版权归原作者所有,如有侵权,请联系我们

[科普中国]-解开无形声音密码,让有形世界更友好 | 邬晓钧

我是科学家
原创

9月14日“我是科学家”将举办第十七期活动

“善良的力量”

本期演讲嘉宾

邬晓钧

清华大学计算机系高级工程师

清华—得意音通声纹处理联合实验室副主任

《解开声音密码,让老年人不必奔波千里领退休金》

邬晓钧采访视频:

声音,无影无形,却是我们沟通交流和感知世界的重要途径。

来自清华大学计算机科学与技术系的邬晓钧老师,主要从事的研究就是人类的语言和语音。他的工作,就是 从不同人的声音中分辨出他的身份。

“人类发出声音主要依靠声带,通过声带,经过口腔鼻腔,再通过空气传播出去”邬晓钧说。

每个人的声音其实都和指纹一样,有自己独特的“元素” ,会受到先天和后天环境的影响。“首先,人的声音会存在一些先天差异;其次,一个人从小到大所处的环境,用的方言、语言等后天惯性也会形成个人的特点。”

这些生理上的特征和后天习惯形成的特点,都会影响我们的声音,“那么,我们反过来去找声音中这些特殊的部分,就能够跟每个人的特点对应起来。”邬晓钧解释道。

声音识别是清华大学人工智能领域一个非常重要的方向,也是一个很传统的应用方向。不过,要让科学技术转变成真正的产品造福社会,需要一些企业以及政府的参与和支持。

“所以,我们实验室就和得意音通公司建立了一个联合实验室,在研究机构和企业的合作这样一个背景下,我们逐渐把技术踏踏实实地变成了具体的产品和应用,然后能够满足具体的应用的需求。”

在应用的过程中,邬晓钧也和许多人聊过声纹识别技术,“大家听到用声音可以判断人的身份,其实还是会觉得这是很神奇的一件事,但是经过我们多年的努力,这真的不是一个神话,而是实实在在的我们科技能够做到的一件事情。”

现在,邬晓钧所在团队研发的声纹识别产品,已经在很多地方取得了很好的用户评价,给许多需要帮助的人们带来了方便。

在邬晓钧看来,“ 声纹识别研究,就像把一个无形的东西,在处理过程中变成有形的东西。这个过程充满了美感。 ”

另外,“它深深地挖掘了我们人日常就有的一些能力,然后极大地扩展了这些能力,让我们每个人都成为了超人。”

9月14日,欢迎大家来A33剧场,听邬晓钧老师聊一聊如何利用声纹技术造福百姓。

9月14日下午14:00-16:30

北京 · A33剧场