当前位置:智能 > 正文

小米声学实验室 Daniel Povey为何选择小米?

2019-11-01 11:36:43  来源:网易智能

探秘小米声学实验室 Daniel Povey为何选择小米?

在小米科技园举办针对人工智能的媒体开放日,网易科技也第一次近距离地接触了小米“神秘”的人工智能实验室。小米集团副总裁、集团技术委员会主席崔宝秋博士、人工智能部总经理叶航军博士、AI实验室主任王斌博士,介绍了小米在AI领域的自主研发技术成果、技术人才引进情况。

叶航军、崔宝秋、王斌(从左至右)

探秘小米声学实验室

首先我们来到小米声学语音实验室,可以看到,各种以小米智能硬件生态链核心产品小爱音箱为中枢,四周布满了供声学语音测试使用的硬件设备,据介绍,小米的智能硬件产品中,所有具备麦克风、扬声器的语音交互设备,都要经过这个实验室测试后上线。目前,小爱音箱语音算法已经做到由小米全部自主研发,在这个实验室中,以小爱音箱为代表的小米全系智能语音设备,均会进行远场、近场、灵敏度等一系列详细测试并进行调试,其中近场测试,主要针对手机进行。

图:小米声学语音实验室

据现场工程师介绍,实验室中的人工模型及扬声器等设备,均会高度会模拟日常的人声及环境音、噪声干扰等,其中人声的测试,机器可以分别模拟不同性别、不同年龄的声音并反复进行机器还原测试,而无需人工测试,既节省了人力成本,又可以保证精准的测试效果。在这个实验室中,工程师会在测试过程中发现算法中可提升的部分,并反馈给小米研发团队进行优化和算法调试。

图:小米声学语音实验室

不同于前者,进入与硬件强相关的声学实验室后,马上会感觉有些安静的不适应,房间四周布满了锥形吸引墙,房间整体重量约70吨,用料极其奢侈。据工程师介绍,该实验室内部各个角落,都不会产生声音的回波,所有声音都会被锥形墙体吸收,因此理论上讲,房间内,只存在源头声音一个干扰源。实验室包括三层墙体,均为实心砖墙,主要作用为在绝对安静的环境条件下,对设备进行高灵敏度的测试,以便准确找到硬件设备各类极值。

图:小米声学语音实验室

据介绍,语音识别的顶层为云识别算法,但是在硬件设备底层,要极大保证设备的灵敏度,如麦克风对于声音的采集,只有这样,才可以在云端更好地进行算法识别,小米不惜成本地打造声学语音实验室,原因也在于此。

图:小米智能厨卫

接下来,在体验了包括智能客厅、智能卧室、智能书房、智能厨卫等以小爱同学为智能家庭中枢的小米全系智能家居场景后,可以很直观地感受到,小米AIoT,已经把之前描绘的未来智能生活场景完全变为了现实。

图:小米智能客厅

Daniel Povey

Daniel Povey是全球公认的国际语音识别和AI领域知名教授、语音识别开源工具Kaldi之父。他于1993年到2003在剑桥大学度过了自己的高等教育经历,获得语音识别的博士学位。2003年至2008年,他在IBM研究院负责计算机语音识别的工作,并且获得了Research Staff Member的角色;随后在2008年到2012年,Daniel Povey在微软研究院参与计算机语音识别方面的工作。2012年,Daniel Povey加入约翰霍普金斯大学,担任语言和语音处理中心的副教授。

图:崔宝秋与Daniel Povey

2019年,Daniel Povey在长达两周的中国之旅中,分别走访了包括清华、北大等顶级学府,以及多个中国的头部科技互联网公司,但其最终选择了加盟小米,崔宝秋认为,第一是因为Daniel Povey已经了解小米“手机+AIoT”双引擎战略生态的强大,同时他十分清楚语音识别在“手机+AIoT”双引擎战略中所扮演的重要角色;第二,Daniel Povey在参观了小米公司总部后,了解到小米对于人才和技术的重视,以及具备大批优秀的工程师,以及这也是吸引Daniel Povey加盟的重要原因;第三,小米从云计算、大数据到今天的AI,对于开源的拥抱,也是吸引Daniel Povey的关键点。

崔宝秋透露,在与Daniel Povey谈offer的过程中,Daniel Povey对于其他入职大部分细节基本不关心,他最关心的是保证Kaldi100%的开源,而崔宝秋给出的回答是:对于小米来说,这根本不是问题。Daniel Povey入职当天,崔宝秋表示,无论对于Daniel Povey本人、对于小米、对于中国的语音识别届,今天都是很重要的一天。

人工智能技术已实现广泛产品落地

目前,小米人工智能技术实现了广泛的产品落地,比如AI相机、小米电视、AI音箱、MIUI、搜索推荐、IoT设备等,涵盖声学、语音、深度学习、视觉等各个领域,一句话概括,AI在小米已经无处不在。此外,据了解,小米还承建了智能家居国家新一代人工智能开放创新平台。

说到小爱同学,其语音识别技术包括声学和语音,严格来说,这是两个不同的技术领域,小米人工智能的声学技术包括:回声消除,去混响,声源定位,多通道降噪以及多种麦克风阵列解决方案;而语音技术则包括:唤醒,识别,声纹以及语音合成。目前,小米小爱音箱语音算法已经实现全部自主研发。

在参观后的采访中,叶航军介绍,在小米“手机+AIoT”的双引擎战略里,AI扮演了非常重要的角色。在手机上,对于用户经常使用的拍照功能,叶航军认为“目前在整个行业,手机相机研发有一个明显的趋势,就是人工智能的深度整合,具体来讲有两个方面,一个就是手机相机的软件化和算法化,之前很多手机相机的体验是靠硬件去做,但是最近这两年,一些领先的体验是通过软件算法实现。 第二个趋势就是算法AI化,越来越多的相机算法从传统图像处理算法转变成AI算法。”

王斌博士则分享了小米AI自主研发技术成果,目前小米已经在声学、语音、视觉,NLP、知识图谱、机器学习6大方向取得一系列成果。此外,王斌还介绍了小米在视觉、NLP、知识图谱、机器学习等技术上的进展。视觉方面,自研的人脸识别、美颜、魔法换天、场景识别在多款手机上落地应用。小米已经打造了自己的NLP平台和知识图谱,全面支撑公司的多项内容业务。小米面向移动端的深度学习开源计算平台MACE(Mobile AI Compute Engine)一推出便受到业界的广泛关注,目前广泛用于公司的各项产品中。

公开数据显示,2016年—2018年间,小米在AI领域申请专利684项,列居世界第11位。在宣布“手机+AIoT”双引擎战略为未来5年内小米的核心战略同时,雷军表示,未来5年小米将在AIoT领域持续投入超过100亿元,综合人才、技术积累以及资金投入等因素,不难推测,相对于竞品,小爱音箱的线下场景优势依然具备提升空间。(张楠)

推荐阅读

补充云原生安全能力布局 阿里云拟全资收购九州云腾

10月31日消息,据新京报报道,知情人士透露,阿里巴巴旗下阿里云拟全资收购身份认证云管理平台北京九州云腾科技有限公司,已完成正式签约。 【详细】

三个方法帮你快速解决电视内存不够问题

很多用户在选购电视的时候往往不觉得内存有什么重要的,但是长时间使用之后,就会发现家里电视越用越卡,用起来简直就是一种折磨,仔细检查 【详细】

WeWork前CEO被指控在怀孕员工面前抽大麻?

新浪美股 11月1日消息,WeWork前首席执行官亚当·诺伊曼(Adam Neumann)正面临一项新的法律挑战,诺伊曼的前办公室主任(chief of staff) 【详细】

快递员派件压力加大 快递“不告而投”痛点如何破

这两年,智能快递柜在小区、写字楼附近随处可见,它能够提供24小时自助取件服务,非常便捷,不过问题也来了,越来越多消费者发现,快递员不 【详细】

波音737 NG机身现裂缝 或遭澳航停飞

参考消息网11月1日报道 外媒称,澳大利亚航空公司的工程师工会要求该公司停飞全部波音737飞机,因为该公司在一夜之间发现了又一架飞机上的 【详细】



科技新闻网版权