12月21日,科大讯飞召开年度发布会,发布新产品,展示大型会议上同步将演讲者语音转换为文字的技术,总结成绩,公布“讯飞超脑”科研项目进展,最终展望未来:3~5年内,让机器人考上大学!
低调了一年,科大讯飞在各家纷纷推出人工智能产品的2015年末尾,一次性宣告其在该领域的江湖地位。
这不禁让笔者想起科大讯飞的2014年度发布会,主题为“语音点亮生活”。发布会上,科大讯飞为普罗大众勾勒的还是“无论你在开车,看电视,还是玩手机,只要动动嘴就能“下命令”的美好生活。
但也正是在这场发布会上,科大讯飞宣布正式启动“讯飞超脑”计划,研发基于类人神经网络的认知智能引擎,赋予机器从“能听会说”到“能理解会思考”的能力,并希望研发出第一个中文认知智能计算引擎。而其团队由来自语言国家工程实验室、清华大学、加拿大约克大学等10多位人工智能领域顶级专家组成,组长是来自加拿大约克大学的江辉教授。
1年过去,科大讯飞再提目标,让机器人在3~5年内考上大学。相较之下,暂不提谷歌大脑、微软“Adam计划”、Facebook邀请Yann LeCun建立的人工智能实验室、Tesla创始人Elon Musk的“Open AI”有多牛,仅国内,李彦宏今年在某次活动上透露百脑大脑如今智力已达到3、4岁孩子智力水平,而人工智能初创团队图灵机器人在今年年底发布的机器人操作系统号称已拥有4、5岁孩子智商,各家“大脑“拼智商时代似乎到来。
这不禁让笔者觉得,今年年初那个文能疗伤,武能打怪兽的暖男大白已经不远了。但冷静下来发现,讯飞超脑才1岁啊,它真能让速记员失业,让机器人3年后考上大学吗?这场野心勃勃的发布会似乎在努力回答这一问题。
先看讯飞超脑是怎么炼成的?
发布会上,科大讯飞董事长刘庆峰、副总裁兼研究院院长胡郁首次对其进行详细解读,笔者总结如下:
人工智能的三个层次是计算智能、感知智能和认知智能,前两者机器的能力已经超越人类,让机器实现认知智能是科研焦点。回看人类自身发展,产生认知智能的标志是语言的广泛使用,因此科大讯飞选择从”自然语言理解“这一方向去寻找人工智能突破口,实现感知智能和认知智能。
经验论,工业界在这一方向取得进步主要基于三大关键因素,即深度神经网络、大数据和涟漪效应,讯飞超脑也是基于这三大因素去实现的,深度神经网络是研究方法,大数据和涟漪效应依靠的是科大讯飞的产业化路径,即“产学研”一体化。
具体到感知智能(能听会说)层面,讯飞超脑的构(核)型(心)是利用FLN神经网络来让机器听懂世界,根据测试机构ICDIR的测试结果,如今效果可以达到93%。
(核心在于构型,即重构的能力。因为所谓深度神经网络只是基于数学统计模式识别的一个很小分支,它起源于上世纪60年代,用于模拟人脑思考方式。2012年,讯飞将深度神经网络用于参数语音合成,使其效果提升30%。但人脑记忆包括短时记忆、瞬时记忆和长时记忆,而深度神经网络处理短时记忆能力比较弱,新的方式叫回归神经网络,它可以将前一个时块的信息输入到当前时刻,以此提高记忆能力。而讯飞自己的构型FLN神经网络可缩短响应时间。)
在认知层面,当感知层面的各种信息集到认知层面,类大脑就要去进行语音理解、知识表达、逻辑推理和最后决策。简单来说,就像你看到一只猫,脑海中形成猫的概念,同时还知道摸猫的感觉。为了实现这样一个系统,讯飞超脑框架被定义为自然意义下的语言生成及知识表达推理。而这其中有词语、句子、篇章等不同层面。在最难的篇章层面,目前讯飞超脑可以做到的正确率为51%。
而在此基础上,讯飞超脑要做两件事情,第一,语言生成与理解,第二,知识的表述及推理。目前,讯飞超脑已可以作诗、评分等。还是数据说话:
此外,讯飞超脑还有一个重要特点,它没有喜怒哀乐。“我们从大脑中学习的越多,越可以把大脑主管智能的这部分和主管自我意识,即喜怒哀乐的这部分区分开来。我们可以让将来人工智能机器人掌握智能,不一定非要有自我意识和喜怒哀乐。”胡郁介绍。
围绕讯飞超脑,这两年科大讯飞做了什么?
科大讯飞2014年年报显示,其营业收入为17.7亿,研发投入为5.1亿,占营业收入的29.18% 。而围绕讯飞超脑计划,其业务在面向各行业数千家开发伙伴提供语音能力的基础上,加快布局教育、移动互联、智能客服、智能电视、车载等领域。2015年上半年报告显示,其上半年营业收入10.3亿,同比增长60.44%,主要是行业应用产品等业务增长所致,这也反映出其在行业拓展方面的成绩。
刘庆峰认为,这是因为科大讯飞做对了三件事,首先选准了切入点,从语音合成到语音识别再到语音理解,并将其产业化形成自我造血和迭代;其次是有真正有抱负的核心人才,最后是产业路径,从语音云平台到教育、客服等领域,具有2B和2C的双轮驱动能力。
下一步,科大讯飞计划怎么做?
在创业邦看来,除了其基于语音交互技术系列产品带来的大数据和涟漪效应,科大讯飞新推出的人机交互新产品AIUI和其在人工智能领域的布局才将是关键。
1、 AIUI、标准、全球化
据介绍,科大讯飞AIUI系统是集成了包括全双工技术、麦克风陈列技术、声纹识别技术、方言识别、语义理解技术和内容服务等科研成果和服务的产品。
这也将是其在行业布局的拳头产品,“基于此,我们会积极制定标准,并将标准利用AIUI优势全球化。 教育领域为例,目前,科大讯飞已经在同新加坡、澳洲、东南亚国家合作进行语音评测。”胡郁告诉创业邦。
2、智能机器人领域布局
在智能机器人行业,科大讯飞有三方面的计划。第一,为所有机器人公司提供语音和语言交互方案,第二,选择家庭服务机器人、产业机器人领域的优秀公司,为其提供定制方案和投资;第三,主导开发机器人。
刘庆峰介绍,科大讯飞目前看好的方向有三个,第一是以陪伴和安防为主的家庭机器人;第二是教育行业的真正人型机器人或虚拟服务形态机器人;第三是客服领域,代替人工的机器人。
而创业邦查询科大讯飞2014年年报和2015年上半年、第三季度报告,尚未发现其具体在智能机器人领域的投资,但发布会上可以看到,科大讯飞更多是将以提供解决方案形式参与其中,例如同Ninebot&Segway合作开发了“服务机器人”、ROOBO、UBTECH开发的系列机器人也利用了其核心技术等。
最后,创业邦不禁幻想,几年后,戴着各家“大脑”的机器人共同坐在考场上,孰优孰劣,考上一本再说吧!