机器翻译主要是Google I / O和Microsoft Build 2019的MIA


2019-07-30 08:25:52



机器翻译


继脸书2019年F8发布三分之一首席技术官迈克·斯科洛普夫的主旨是自然语言处理(自然语言处理)和较少程度上的神经机器翻译(NMT)之后,谷歌和微软在最近的开发者大会上没有什么关于语言技术的大分享。
 
然而,他们确实宣布了自然语言处理和自动化翻译方面的一些相关发展,以适应未来的整合和扩展。谷歌输入输出2019和微软构建2019都发生在2019年5月6日这一周。
 
谷歌输入输出2019
在输入输出2019年,谷歌表示将为谷歌镜头增加翻译功能,这基本上是一款具有图像识别功能的智能相机应用。安卓用户可以通过他们的智能手机摄像头激活镜头,并结合谷歌的图像识别技术及其图像搜索和一般搜索功能来获取摄像头指向的任何信息。
 
 
镜头已经有了光学字符识别(OCR),所以整合谷歌翻译似乎是一个明显的下一步。谷歌翻译应用程序基本上可以做同样的事情,但是它所做的是通过光学字符识别来翻译它在照片中读到的文本。谷歌眼镜的翻译似乎提供了更多,包括一个文本到语音的功能,让安卓用户可以让手机“读出”他们想要翻译成自己语言的内容。
 
与此同时,谷歌助手已经与谷歌翻译功能——以及最近的解释模式——一起推出了沃兹全球定位系统导航应用。说到智能助手,谷歌的人工智能智能客户服务工具Duplex正在登陆网络,从更窄的用例开始,比如预订汽车和购买电影票。它将逐渐推出更多功能。
 
最后,谷歌正在安卓系统中添加实时转录和字幕功能,以帮助听力受损者。技术堆栈很简单:基于自然语言处理的语音到文本转换,允许安卓操作系统监听周围环境并转录听到的任何语音。还没有关于多语言能力的消息。
 
Microsoft Build 2019
实时转录也是微软2019年的特色。该公司展示了其实时转录能力,以及如何学习医学和编码领域的行业术语。
 
微软向有限的观众预览了它的会话转录系统如何能够在多个说话者相互交谈时拾取他们,甚至可以使用音频和视频的组合来识别谁在说话。对话转录目前正与埃森哲、罗博和埃维诺等提供商合作进行商业化。
 
在智能助手领域,微软的Cortana被吹捧为一个多领域、多平台的助手,其重点是通过添加类似于短期记忆的东西来实现更具对话性的语音界面。
 
在整个互动过程中,Cortana会始终记得关于对话的事情。例如,如果用户提出之前讨论过的会议,Cortana将理解所指的内容,并能够执行命令或提出与会议相关的后续问题。
 
与此同时,支持科尔塔纳的核心语言识别技术也将进入宝马的定制虚拟助理。在2019年建造期间,该汽车公司向其虚拟助理演示,公司也可以为他们的目的贴上白色标签。此外,第三方开发人员可以利用会话引擎,通过微软Bot框架和Azure服务为Cortana提供动力。
 
微软的办公应用程序也加入了一点自然语言处理。首先,通过微软365流体框架访问和编辑同一文档的文档作者也将能够同时使用翻译功能。其次,微软的Word正在获得一个名为Ideas的功能,这是一个由机器学习驱动的语法和风格检查器。
微软语言技术的一些商业应用也在展出,即中国科技公司猎豹移动的全球版翻译设备——厘米翻译器,运行在微软Azure认知服务上。