科技公司满世界收集人类语音数据为哪般

时间:2021-08-29 19:30:30来源:
导读一篇关于互联网、手机和科技的文章是给大家看的。相信很多朋友对互联网和手机技术还是不太了解。然后边肖还在网上收集了一些关于手机和互联

一篇关于互联网、手机和科技的文章是给大家看的。相信很多朋友对互联网和手机技术还是不太了解。然后边肖还在网上收集了一些关于手机和互联网的相关信仰,与大家分享。希望大家看完之后会喜欢。

据外媒报道,亚马逊Echo让人又爱又恨。一方面,它可以打车、订餐或检查十年级学生的数学作业。另一方面,用户必须对它说得非常清楚,否则它听不清楚。

语音识别在过去的几年里取得了很大的进步,但在日常生活中的应用仍然不广泛,不足以开启人机交互的新时代。许多人仍然需要操作电子设备。

影响语音识别发展的因素有哪些?部分原因是人工智能技术还需要进一步进步,数据——尤其是人类语音的缺乏是另一个原因。

所以亚马逊、苹果、微软、百度都在收集全世界的人声。微软在世界各地的城市设立机构,录制志愿者的音频;亚马逊每小时将Alexa录制的用户音频上传到数据库;百度在中国收集语音数据。他们利用收集到的语音数据来训练计算机分析、理解和响应人们发出的语音命令。

挑战在于理解现实世界中的自然语言对话。百度位于加州森尼维尔的人工智能实验室主任亚当科茨(Adam Coates)表示,即便是95%的准确率也不算好。“我们的目标是将错误率降低到1%。只有这样,人们才能相信机器能够真正理解他们所说的话。”

语音识别的发展得益于人工智能的一个分支神经网络——。人工智能的学习不是通过程序来完成的,而是需要大量的数据。语音识别引擎获得的数据越多,理解不同语音的能力就越高,就越接近实现多语言多背景自然语言对话的目标。

百度首席科学家吴恩达表示,“我们提供给系统的数据越多,它的性能就越好。这就是语音识别技术需要大量投资的原因:并非所有组织都有大量数据。”

20世纪90年代科技行业开始重视语音识别技术时,微软等公司依赖研究机构提供的语音数据。之后,科技公司开始收集自己的语音数据,其中一些来自志愿者。现在,因为语音控制产品和服务的大规模普及,他们通过自己的产品和服务收集了大量的语音数据。

当用户告诉手机搜索、播放音乐或导航时,相关公司可能会记录用户的声音。苹果、谷歌、微软和亚马逊强调,他们将匿名用户数据,以保护用户隐私。当用户向Alexa询问天气情况或运动表现时,Alexa会利用用户的提问提高对自然语言的理解。Alexa项目首席科学家Nikko Strom表示,“从设计的角度来看,用户使用得越多,Alexa就越聪明。”

挑战之一是让语音识别技术精通多种语言、口音和方言,这在中国尤为明显。

另一个挑战是让语音识别技术从背景噪音中过滤掉命令。微软开发了一款名为Voice Studio的Xbox应用,收集用户在玩奇怪的东西或看电影背景下的对话,并为参与的用户提供一定的奖励。该项目在巴西取得了成功,收集的数据被用于开发巴西葡萄牙语版的小娜。

虽然世界各地都在收集语音数据,但科技公司也在探索在没有大量数据的情况下提高语音识别准确性的技术。微软首席语言科学家黄表示,麦当劳测试的语音识别技术比使用更多数据的技术更准确。“即使不使用最多的数据,也有可能取得突破。”

谷歌通常奉行“少即是多”的哲学,用不可理解的语音单位来构造单词和词汇,从而大大降低了对数据的需求。百度正在开发更高效的算法,让系统在学习一门语言后更容易学习其他语言。

即使像吴恩达这样的科学家也很难预测人们可以通过语音助手自然交谈的时间。神经网络仍然是一个新的领域,许多未知的问题仍然没有解决。按照目前的技术和方法,自然人机对话至少需要几年才能实现。

转载请注明出处。

本文就为大家讲解到这里了。
标签:
最新文章