Google Project Euphonia 语音辅助功能在 I/O 19 上揭晓

谷歌最新的 Euphonia 项目正在利用人工智能来帮助有语言障碍的移动用户。

Google 在最近的 I/O 2019 演示中为移动和 Android 用户提供了大量新更新。除了公布有关隐私和即将推出的谷歌移动硬件的新细节外,这家科技巨头还公布了旨在帮助有语言障碍的用户的最新功能。最新的 Google 服务名为 Project Euphonia,旨在帮助有语言障碍的用户与周围的世界进行交流。

正如上面视频中详细介绍的,Project Euphonia 利用 Google 的人工智能和语音通信技术来更好地为有语言障碍或残疾的用户提供服务。 I/O 2019 上播放了一段预告视频,相当清楚地展示了情况:

谷歌研究科学家 Dimitri Kanevsky 表示:“谷歌拥有非常好的语音识别能力,但如果你听起来不像大多数人,它就无法理解你。”患有中风、耳聋甚至多发性硬化症等健康问题的人通常不属于该公司的语音识别模型。因此,这些类型的用户是 Euphonia 项目的重点关注对象,该项目旨在修改技术,以便专注于听起来不像典型的直截了当的语音的交流。

显然,培训 Project Euphoria 的过程涉及 Kanevsky 对设备说出超过 15,000 个短语。由于不确定是否可行,Euphonia 项目最终能够“让所有语音交互设备能够理解任何与它们交谈的人”。该过程显然可以从无法说话的人那里识别出命令和其他功能,通过面部表情或哼唱等简单的操作进行操作。

该系统的设计使得那些不能清晰说话的人和那些根本不能说话的人都可以使用典型的谷歌语音功能。它不仅仅是执行移动设备操作的一种方式:Euphonia 项目旨在帮助所有方式的通信,从情感表达到通过文本或语音媒体以外的其他媒介创建的消息的传达。

根据Google I/O 2019 演示,Euphonia 项目的范围如此之大,以至于谷歌“甚至还没有触及其可能性的表面”。这个想法是,随着时间的推移,Project Euphonia 可以帮助残疾用户汇集数据,从而使该技术能够适应新的环境和使用场景。

就目前情况而言,移动用户可以预期基于 Project Euphoria 数据的语音模型将在不久的将来通过 Google Assistant 提供。话虽如此,用户可以通过提交自己的语音样本来帮助加快采用过程。更多详细信息可以在Euphonia 项目网站