中国电子信息产业发展研究院(工信部赛迪研究院)联合人工智能领域软硬件产品企业、应用企业、投资机构、高校院所、地方(园区)发展机构(部门)等超过300家机构,自愿组成人工智能产业创新联盟,旨在推动我国人工智能产业的创新发展,搭建人工智能产业创新合作与对接平台,整合各类产业资源,提供产业公共服务,努力做好产业生态构建者、技术创新集散地、产融结合粘结剂、行业应用推进器。
3月21日,己亥年人工智能春季创新大会在北京国宾酒店隆重召开。大会由人工智能产业创新联盟和赛迪传媒主办。会上,政府领导、企业领袖以及人工智能领域的资深专家悉数到场,围绕人工智能与实体经济深度融合展开了全面、细致的交流与研讨,各种创新观点融合交汇,为人工智能的创新应用提供了新思路、新路径。
科大讯飞消费者BG听见科技副总经理吕旭为大家解读了人工智能的未来发展主要分为三大方向,即面对小样本、无监督、个性化问题的基础理论持续突破,数学统计建模方法和脑科学研究的深度结合,人工智能系统和人类行为协作的人机耦合方式持续探索。科大讯飞在教育、医疗等领域展开了技术研究,同时还针对会议场景推出了创新性的解决方案。未来将不断努力,为推进人工智能与实体经济深度融合贡献力量。
以下内容,来自科大讯飞消费者BG听见科技副总经理吕旭在己亥年人工智能春季创新大会上的演讲,经整理编辑。
各位领导,联盟的各位成员单位上午好!今天演讲的主题是“AI+会议,人工智能的典型创新应用”,为什么选择这样一个主题呢?其实,在整个联盟里面,科大讯飞跟一半以上成员都有合作,比如英特尔、京东、小i机器人,以及与特斯联在智慧城市方面的合作等。其实科大讯飞自身的业务体量比较大,涵盖行业也比较多,而会议,相较于任何一个行业来说都是最传统的。可以说,有人的时候就有会议,而且AI技术在会议的场景下具有很明显的鲜活性,像今天会议中用的语音识别和机器翻译,全部都是由机器来完成的。所以,我认为AI和会议的结合可能是一个最能看得见、摸得着的典型应用。
首先,简单介绍一下人工智能,人工智能这个概念于1956年提出来,经过几十年的发展,不断进化,运算智能让机器能存会算,1997年,IBM推出的“深蓝”战胜国际象棋大师,这已然是智能的表现;运动智能让机器能抓会握,能走会跑;感知智能让机器能听会说,能看会认。如今,我们能够进行语音识别,能够通过机器视觉识别人脸和物体,其实,机器在这方面的成熟度已经非常高,而且在一定程度上已经超过了人类。人工智能最难的,也是我们现在正在努力的方向是认知智能,就是让机器能理解会思考,让它能够具备跟人一样的推理、总结、归纳和学习的能力。
总体来说,人工智能现在还处于初级阶段,只在一些特定任务场景下具备人类的能力,但是在一些通用的场景下,尤其是在研究人脑和神经科学这些高级神经活动底层规律的领域中,人工智能还需要很大的进步。
人工智能的未来发展主要有三个方向,第一个是算法突破,即面对小样本、无监督、个性化问题的基础理论持续突破。目前人工智能以深度学习为代表的技术框架,还需要大规模的数据样本进行训练,需要人工进行样本挑选、标注以及规整。因此,算法突破是未来基础理论框架所需要突破的一个方向。第二个是脑智同飞,即数学统计建模方法和脑科学研究的深度结合。现在的人工智能主要还是基于数学统计建模理论,主要以统计学和概率论等基础数学理论为基础。而我们希望人工智能具有更接近于人类的理解、归纳和总结的能力,需要在人类的人脑活动和神经活动的研究方向进行一个突破,并且只有这两者结合才能实现人工智能突破。第三个是人机耦合,即人工智能系统和人类行为协作的人机耦合方式持续探索。就目前的人工智能技术发展水平来看,人工智能还无法完全替代人类。当前的语音识别和机器翻译的准确率还达不到100%,如果想要在一些专业领域上达到这个要求的话,就需要进行人机协同。因此,算法突破,脑智同飞,人机耦合,便是未来人工智能的三个发展方向。
说到人机耦合,这也是现在业界内普遍存在的观点,未来,不是人与机器进行比较,而是不同的人掌握不同的人工智能技术和工具,人类站在人工智能的肩膀上进行比较才会做更有意义的事情。
科大讯飞从1999年成立以来,一直从事语音和语言处理研究方面的工作。在过去19年的时间里,科大讯飞在语音、图像、人脸、语义方面取得了很多突破性进展。1999年成立之后把语音合成做到了全球第一;2012年,科大讯飞首次在全球让计算机合成英语超过了真人说话水平;2015年,科大讯飞在全球首次让语音识别、语音转写超过专业速记员水平;2016年,我们让机器去批改中英文高考作文,达到了可以媲美人类高考老师的水平。
到目前为止,科大讯飞在语音合成、语音识别,包括在自动驾驶、图像检测和识别等领域共获得了12项国际最顶尖赛事冠军。在过去十几年的时间里,科大讯飞一直坚持一个使命,就是让机器能听会说,能写会思考。同时,讯飞开放平台成为业界能力最全的AI开放平台,目前在这个平台上面,我们已经开放了近200种AI能力,服务于产业界的开发团队来进行一些相关应用的开发。2017年12月份,讯飞开放平台上的第三方开发团队数量大概是47万,到2018年12月份,这个数字已增长到92万,增长速度非常快。同时,平台上每天的交互人次达到47亿次,总应用数接近60万。可以说,围绕以讯飞开放能力为主的双创开发团队和整个产业界对于人工智能热情越来越高。
2017年7月国务院发布《新一代人工智能规划》,根据发展规划,新一代人工智能将在制造、农业、物流、金融、商务、家居等6个重点行业进行融合创新。发展到目前来看,人工智能和实体经济的深度融合已远远超过了这六个行业。2017年的11月15日,科技部公布了首批国家新一代人工智能开放创新平台,依托百度公司建设自动驾驶国家人工智能开放创新平台,依托阿里云公司建设城市大脑国家人工智能开放创新平台,依托腾讯公司建设医疗影像国家人工智能开放创新平台,依托科大讯飞公司建设智能语音国家人工智能开放创新平台。这四大平台的宣布,标志着人工智能与实体经济融合重大科技项目进入全面启动实施阶段。
接下来,以教育和医疗为例,阐述科大讯飞是如何为传统的实体经济赋能的。在教育领域,围绕实现因材施教的教学梦想,我们针对老师提供了一套精准教学的解决方案,同时让学生进行个性化学习,减少无效的学习时间,提升学习效果。现在,这套教育解决方案覆盖了全国8000万名师生,10000多所学校,68所全国百强校。在工信部公布的2018年人工智能与实体经济深度融合创新项目中,科大讯飞入选“面向中小学人工智能创新教育综合解决方案研发及应用”项目。
在医疗领域,科大讯飞在全国建设了一个人工智能辅助诊疗平台,应用全科医生助手辅助医生看病,同时辅助偏远地区患者享用人工智能带来的辅助诊疗。目前,这套平台提供影像辅助诊疗、全科辅助诊断和健康管理服务三个方面的服务。如今这套平台可以通过机器辅助医生诊断300多种病,随着家庭医生随访,随访工作量节省接近80%。
这两个就是科大讯飞在2018年,围绕国家相关政策出台之后,在两个典型行业领域中用人工智能为实体经济赋能的典型案例。
接下来,我们将阐述人工智能是如何为传统会议行业升级赋能的。任正非曾经说过一句话,“会议室就是作战室”,这句话强调了在传统的会议和会议室里面,如何用科技和人工智能技术进行改造。我们认为人工智能对于传统会议行业带来的变革和提升主要体现在三个方面,第一个是会议的沟通效率上,通过AI的应用能够大幅度提升沟通效率;第二个是对会议内容的整理效率上;第三个是对会议精神的传播效率上。在这三个方面,AI+会议要明显区别于传统的会议形式。
具体看一下,AI+会议可以带来什么呢?以传统会议两个小时为例,通过语音处理,使用半个小时便可以把会议纪要全程内容记录下来。此外,由于全程通过语音识别进行记录下来,内容完整度达到100%,所以我们认为在AI+会议形式下,会议内容一体化管理,内容价值最大化利用。在远程会议,尤其是在一些跨国企业使用不同语种进行交流时,以前往往需要专门的同传人员在两端进行同传翻译,但通过AI的语音翻译,可以在远程会议场景中解决跨语言交流障碍问题。同时,对于会议中的翻译和速记等问题,AI可以辅助人类提升速记效率和翻译水平。
在科大讯飞下面,有一个称为讯飞听见的业务单元,承载了科大讯飞在会议行业中使用AI赋能,提供相关得研究和产品研发工作。
目前,这套系统已经为全国300多家政府、企业等客户提供了产品和解决方案,会场服务2000多场次,服务人次超过1000万人。
实际上,AI+会议的主要创新点主要体现在这几个方面,实时转写,普通话转写准确率达到95%,Native英文正确率达到90%;中英互译,忠诚度达到4.0分,流利度达到4.0分,相当于85%左右的准确率;字幕叠加,转写字幕实时展示,并与视频画面叠加输出;内容分享,手机扫描会议二维码即可获取当前会议内容。另外,我们针对整个会议的内容优化和一些安全性问题提供了一些功能,如关键词优化,禁忌词屏蔽,语气词过滤,文件导出等,对于后续的会议内容检索和回溯也带来极大的方便。
接下来介绍一下讯飞听见系统的相关应用案例。第一个就是在工信部的相关领导关注之下,我们和国际电信联盟成为了合作伙伴,将这套系统部署在国际电信联盟的日内瓦总部,为他们每天的国际会议进行服务。第二就是这套系统也在冬奥组委会中进行了部署,将在2022年的冬奥会和冬残奥会上进行使用,助力科技奥运。此外,在一些国际性会议上,讯飞听见国际会议翻译系统也有很多应用,比如金砖国家工商理事会议、2018年中欧贸易与投资论坛、“2018年世界电信展”等。在“2018年世界电信展”上,讯飞听见作为中国国家展团成员亮相展会。同时,讯飞听见系统为第四届金砖国家通信部长会议&行业对话会演讲提供中英文实时转写字幕支持。
此外,在一些专业领域较强的医疗、金融会议,以及央视春晚中,讯飞听见系统也提供了实时转写字幕支持。
在2017、2018年的全国两会上,讯飞听见系统已经在政府工作报告上实现了应用。2018年,讯飞听见系统除了进行中文转写之外,还实现了中英文转写和机器翻译的应用。2019年,在刚刚过去全国两会中,讯飞听见入驻7个会议驻地,全程支持58个界别小组讨论会议,支持共计近1000场会议。可以说,现在通过将AI技术应用到传统会议,无论是提供产品还是提供会议服务,在面向政府、面向行业中已经有了非常成熟的应用,这正是人工智能与实体经济深度融合的典型案例。