试想一下,我们在高速公路上使用gps导航时,我们更愿意口述目的地还是手动输入目的地?未来,语音将极大程度上代替键盘,成为我们与计算机交流的主要方式。
随着深度学习、大数据以及云计算在语音识别中的广泛应用,语音识别的技术得到了长足的进展,在此方面有多年经验的东芝综合运用其先进的语音、图像识别技术并综合云计算服务,开发出能够助力人与人交流的ai技术——“recaius™”。
东芝产业信息通信技术ictag娱乐平台官方网站的解决方案公司负责“recaius™”项目研发的梅木秀雄介绍说:“为了实现人与ai安心、舒适、协调共存,ai需要具备能够捕捉人类感知和体验的判断。在语音识别方面,即便ai没有完全听清人们的语音,也能够从表情动作中给出恰当的应答,并实现一对一的简单会话,还可分辨多个会话组合,通过计算机算法形成文本。为此,东芝开发出的 recaius™ 能够根据人的表情、声音和动作,综合判断把握具体意图和状况并做出适宜应答。”
“recaius™” 你身边的同声传译
试想一下,如果一个以英语为母语的人,他一句普通话也不懂,当他想和一位土生土长的中国人交谈,他面临的选择有两个:要么他开始艰难的学习,直到能够熟练掌握中文;要么他就得雇另一个人来帮他翻译对话,而有了“recaius™”,就相当于你身边有一位同声传译。
相对你手机里面其他的翻译软件,东芝的“recaius™”具备了同声传译的功能,其不仅可以翻译多国语言,而且即便是语句间没有间断的连续语音,“recaius™”也能自动判断适合翻译的单位,实现智能断句,然后逐句完成翻译。面对一些固有名词被生硬直译后无法理解的情况,使用者可以登录固有词汇或例句,给出应当如何翻译的指示,“recaius™”就能给出恰当的翻译。
所见即能翻译 真正的读图时代
除了语音识别、交互、翻译等功能,东芝还开发了将可视文字信息即时翻译成其他语言的技术。想象一下,人们出国旅行,来到一家以美味著称的餐馆,却往往被菜单上的异国文字搞得一头雾水,如果菜单上又没有图片,根本不知道该如何点菜,而东芝的“recaius™”可帮你摆脱这个困境,拿起智能手机对准菜单进行拍摄,东芝“recaius™”可以瞬间把菜品翻译成母语,让你轻松点菜。
(图:抹茶 绿茶 烘焙茶 乌龙茶 玄米茶 中国茶)
但是,人们用相机拍摄图像时,照片上不只有文字,还有背景、图案等其他信息,为了能够清晰地从复杂图像中辨别出文字信息,东芝开发出独有的图像特征提取技术,可以精准检测到文字。而这一技术对国外的街景图像很有效果,“recaius™”可以轻松地从街景的图像中识别其中的字符串,判断语言属性并将字符翻译成你需要的语言文字显示在屏幕上。未来我们带上ar眼镜,沉浸在异国他乡的外语世界,或许能够将眼前充斥着外语的世界转换成母语来欣赏,会不会是一种非常陌生而又熟悉的景象?
东芝秉承“以人为本”的技术研发理念
梅木秀雄表示:“随着科技的进步以及物联网iot(internet of things)时代的到来,未来不仅是物与物相连,还有人与人相连以及人与物相连。为了给人们的生活和工作创造更加安心、安全、舒适的环境,东芝将一如既往地秉承以人为本的理念,开发越来越智能的ai技术,实现更安全、舒适、人与ai和谐共生的社会。”