登月早已实现,同期启动的语音识别还在路上

2019-08-06 18:24     来源:     作者:王蔚

  近日,阿里巴巴达摩院开源了自主研发的新一代语音识别模型DFSMN,让全球语音识别准确率记录提升至96.04%。“机器听懂人话”这个目标,似乎已经基本实现,但在AI认知方面还未实现突破性飞跃。

  文字翻译与语音识别,可能是AI与人类实现认知互动最直接的手段。这两方面技术目前应用现状如何?未来提高方向又有哪些?

  文字翻译:评测、算法、用户一个都不能少

  “AI翻译中最普遍的传统算法是通过大量双语语料建立统计模型。”在近日举办的阿里巴巴达摩院技术创新分享日上,阿里巴巴达摩院机器智能技术实验室研究员葛妮瑜向记者解释,“比如‘中国’一词,英文译文经常看到‘China’,机器就大概可判断出‘中国’可能就是‘China’。之所以说‘可能’,是因为机器不可能达到100%的肯定性——于是,错误的翻译来了。”

  而另一种近年比较热门的算法是神经网络翻译。“它的翻译方法是看整句而非单字,读起来很顺,但仍有缺点。”葛妮瑜表示,这种方法的最大缺点是其运用的是数字化模型,一旦翻译错了,人却很难知道它为什么错,很难进行人工干预改正。

  既然传统算法与神经网络翻译各有缺点,那现阶段有何方法能弥补它们的不足?

  葛妮瑜认为,通过不断新增用户实际使用数据来更新AI翻译模型,并将传统的统计机器翻译、规则翻译与较新的神经网络翻译融合,针对不同场景取长补短,是不错的选择。“比如数字相对固定,可用规则的翻译方法。如果是比较长的、灵活的语言,如描述性的用户评论,可采用神经翻译系统。数据的产生都是自动的,不需要人工参与。在保护用户隐私的前提下,这些用户数据可以推动模型的更新与迭代,起到查漏补缺的作用。”葛妮瑜说。

  在今年6月举办的WMT2018国际机器翻译大赛上,阿里巴巴达摩院机器智能-NLP翻译团队在全部5项比赛中获得冠军。“每一种语言,我们都会根据它的语言现象来定制机器翻译的模型。遇到不同的翻译需求,我们先做需求分类。如果翻译的是标题、关键词,我们就用统计模型。如果翻译中有很多数字、日期、地址,以及专有名词,就用规则翻译模型。”葛妮瑜说。

  怎么知道翻译得好不好?在没有人工翻译文本的前提下,如何判断机器翻译的质量?AI机器翻译有一个很重要的挑战——评测。传统的方式是将人工翻译和AI翻译的文本进行比较,这需要大量真人翻译的参与,成本很高。葛妮瑜认为,未来AI翻译技术若想得到良性循环,机器评测手段亟待持续跟进。

  语音识别:复杂环境试验不可或缺

  “语音识别的研发是和美国登月计划同时启动的。登月计划早已成功,而语音识别的一些技术难题却没有完全解决。”谈到语音识别,阿里巴巴达摩院机器智能技术实验室高级算法专家雷鸣调侃道。

  智能语音交互,是基于语音识别、语音合成、自然语言理解等技术,在多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互体验。

  “能听、会说、懂你”有何深意?用户说了一句话,机器首先把话识别出来。之后转化成文字,然后对文字进行语义理解,人工智能可以理解你的语言所表达的意思,及其背后的意图。理解之后,它再形成文字反馈,输入到语音合成模块,把文字转化成语音播报出来,反馈给用户。这样就形成了完整交互的路径。

  “物联网时代,智能人机交互体验能否得到大规模应用,取决于公共空间及特定人群的识别与多模态的技术方案。”雷鸣解释,通过人脸识别及语音定位技术,未来的某款AI语音识别器将能实时检测出人的口形,并通过人与设备间的距离、高度来建模,再通过麦克风阵列把声音收集进来,从而增加语音交互系统准确度。

  如果智能语音交互最终实现,那么支持自由对话交互过程的下一代对话引擎也将不会太远。“比如我点咖啡,三杯咖啡改成两杯,把咖啡换成巧克力之类的复杂意图;在交互过程中对话相关的上下文,都将被机器所理解。”雷鸣这样憧憬,“最早实验室的简单任务都是单个场景,但如果想要早日达到智能语音交互,更多复杂环境场景混合的实验或许必不可少。”

(责任编辑:王蔚)

上一篇:我们需要怎样的人工智能

下一篇:瑞士研发运木卡车 或可实现L4级自动驾驶

*免责声明: 凡本网注明“来源:XXX(非神州瞭望网)”的作品,均转载其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。若内容涉及投资建议,仅供参考勿作为投资依据。本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。


推荐阅读
  • AI应用场景多元化,落地与挑战中寻找产业AI化的最优解

    ​10月26日,《2021-2022中国人工智能计算力发展评估报告》(以下简称:报告)在AICC2021人工智能计算大会上发布,旨在通过宏观经济、技术成熟度、AI劳动供给、行业及地域四大方面综合考量和评估我国

    2021-11-01


  • 用AI赋能智能制造转型升级

    ​中业科技成立10余年来逐渐发展成为一家NLP(自然语言处理技术)及应用的人工智能公司,并在智能制造领域取得突破。未来是AI的天下,AI不仅能用于互联网社交,还能在物联网和制造业等领

    2021-10-25


  • 技术与场景深度融合 谱就AI大时代繁荣生态图谱

    ​锁定重大产业方向,设立以头部企业为依托的开放创新平台,让他们在国家人工智能创新体系中发挥引领作用,是国家新一代人工智能开放创新平台设立的关键诉求。 随着国家新一代人工智能

    2021-10-21


  • 着力推动虚拟现实产业高质量发展

    ​新华社南昌10月19日电 2021世界VR产业大会云峰会开幕式19日在江西南昌举行,国务委员王勇出席并致辞。他强调,要以习近平新时代中国特色社会主义思想为指导,全面贯彻党中央、国务院决策

    2021-10-20


  • 世界VR产业大会发布中国虚拟现实产业重要成果

    ​10月19日,由工业和信息化部、江西省人民政府主办的2021世界VR产业大会云峰会在江西南昌开幕。本次大会以VR让世界更精彩融合发展创新应用为主题,设立奥地利和韩国两个海外分会场,吸引

    2021-10-20


  • 传统行业想获得AI加持,为何这么难

    ​AI技术要实现应用,首先数据要达到一定的体量,此外算力也要能支持大规模的模型训练,而后算法方面需要达到一定的精度,端侧算力也要具备一定的推理能力。 之所以目前只有消费互联网

    2021-10-18


  • 山东移动九大模型助力精准“打猫”

    ​近年来,山东移动将防范打击电信网络诈骗作为我为群众办实事的具体举措,持续深化开展春雷断卡行动,推动构建清朗的网络空间环境。 今年以来,依托九大模型精准识别,山东公司已累计

    2021-09-29


  • 敲黑板啦,关于5G网络的重要提示

    ​敲黑板啦~~随着技术更新迭代,越来越多的人开始用5G手机,请注意:使用5G手机却没有打开5G开关,那用的仍旧是4G网络哦~ 这样的设置步骤,你一定要清楚明了 对绝大多数人来说,睡觉前做的

    2021-09-29


  • 2021国家机器人发展论坛在深圳召开

    ​2021年9月24-25日,以创新湾区智造,跨界融合发展为主题的2021国家机器人发展论坛在深圳隆重召开。此次国家机器人发展论坛的举办是学会积极响应中国科协关于开展科创中国品牌工作号召的具体

    2021-09-29


  • 知道创宇入选第九届CNCERT国家级网络安全应急服务支撑单位

    ​9月27日下午,第九届CNCERT网络安全应急服务支撑单位授牌仪式在世界互联网大会的互联网之光博览会举办,知道创宇创始人兼CEO赵伟等13家国家级支撑单位代表出席此次授牌仪式。 知道创宇在

    2021-09-29