当前位置:热点 > 正文

王海峰:人工智能进入工业大生产时代

2019-10-24 14:45:41  来源:搜狐科技

10月21日消息,第六届世界互联网大会人工智能论坛开幕,主题为“开启智能经济新时代”。

百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰在论坛上发言称,人工智能是新一轮科技革命和产业变革的核心驱动力量。

王海峰透露,百度AI大生产平台的数据,已经开放216项能力,每天调用次数已过万亿,上面有150多万开发者。

在随后参加的5G论坛上,王海峰表示,由于连接,5G也促进了AI的发展,5G也让AI变得无处不在,让传统的产品都变得更好用,很多不可能也会变得可能。

以下为速记全文:

各位领导、各位专家,各位来宾:

大家下午好!

我跟大家分享的题目是《人工智能进入工业大生产时代》,我知道我们这个论坛的主题是“人工智能:开启智能经济新时代”,怎么开启?我的观点是如果想让人工智能能更快地、更有效地助力经济的发展,需要让人工智能真正像工业大生产的方式进入各行各业的生产环节,进而推动整个生产力的进步,也推动社会的进步。

为了论述我刚才讲的工业大生产阶段,我们先回顾一下人类历史上已经发生过的几次工业革命。我们都知道从200多年以前,人类历史上已经发生了三次工业革命,分别为人类带来了机械技术、电力技术和信息技术,而且每一次工业革命的核心技术都不是限于某一个行业,而是广泛应用于各行各业,应用于人类的工业大生产,进而带来了人们的生产方式、生活方式甚至思维方式的变化。

工业大生产的技术有非常强的通用性,另一方面这些技术也呈现出一些显著的特征,比如标准化、自动化和模块化。所以,我认为一个技术有很强的通用性,它可以影响各行各业,同时具备标准化、自动化和模块化的特征,它就具备了进入工业大生产阶段的一些基本前提。

人工智能是新一轮科技革命和产业变革的核心驱动力量。百度大脑是百度经过多年人工智能的技术积累和产业实践的集大成,我们从2010年左右就开始布局人工智能相关的各种基础能力,经过多年的积累,在2016年形成初步完善的布局,因而发布百度大脑1.0。发展到今年,百度大脑不仅仅有很强的各方面的跟AI相关的软的能力,从事也开始进入工业大生产的阶段。一方面它更多地在跟硬件,比如跟芯片、硬件平台进行结合,形成软硬一体的平台;另一方面,是我后面跟大家说到的这些技术也逐渐具备了标准化、模块化、自动化的特征,而且已经开始应用于各行各业,显示出通用性。

百度AI大生产平台的一些基本架构,有基本的算力和数据,同时有深度学习平台,包括核心框架、工具组件、服务平台;上面有各种相对通用的AI能力,比如跟人的视觉和听觉、感知相关的计算机视觉技术、语音技术,同时也包括跟人的认知相关的自然语言处理、知识图谱等基础。在此基础上,还要有定制的训练平台,比如面向各种垂直场景的应用技术进行定制化平台,当然还要有适用于多种场景的多端部署能力,不管是云上、端上还是边缘上以及各种各样的设备上,从而形成AI的解决方案。

我刚才讲的第一点就是深度学习的平台,我认为深度学习框架和平台是AI时代的操作系统。为什么这么说?一方面它向下对接硬件、对接芯片,而且为了达到更好的效果,芯片是需要针对深度学习框架的技术进行定制优化,从而达到软硬一体优化的更好效果;而向上,深度学习框架和平台承接的是各种应用,这样的话它处在一个比较核心的承上启下的位置。所以,我认为它是智能时代的操作系统。

而百度的飞桨经过多年布局,已形成完善的布局,包括基础框架,无论是开发、训练还是预测;还包括产业实践打磨的模型库,也包括端到端的开发套件、工具组件和服务平台。飞桨是一套很庞大的架构,如果提炼出其中几个方面,是我们认为很重要很领先的技术,包括开发方面的开发便捷的深度学习框架,同时也有训练方面能支持超大规模深度学习模型训练的技术,包括多端多平台部署的高性能的推理引擎以及产业级的模型库。

开发方面,一方面是组网的编程范式更符合程序员写程序的习惯,所以程序员开发起来非常方便,而且它同时支持动态图和荆静态图,兼具灵活性和稳定性的优势。另一方面,为了更好设计神经网络结构,我们开发了自动化的网络设计,现在这种基础设计出来的网络已经超越了人类专家设计的网络的效果。

而超大规模的深度学习训练技术已经能支持万亿级参数的训练,而且可以做到实时的更新。

训练出来模型以后,我们需要部署、应用,进行各种应用和推理,这时候涉及到多端多平台的部署能力,而且为了在各种场景当中应用得更好,也做了通用架构推理速度的优化。

有了这些基础的框架,无论是开发、训练还是推理的能力,在真正应用的时候需要针对各种场景建构各种模型。这样的话,飞桨也提供了非常全面的官方支持,经过工业产业验证的工业级的模型库,而且这种模型库一方面在产业应用中得到很多验证,另外一方面也参加了国际标准测试,得到了很多领先的结果。

深度学习有感知、认知技术,包括语音、视觉、语言和知识等等,这也是百度大脑具备的各方面的能力。语音的角度,我们最近研发的SIMLTA流式注意力模型,使准确率进一步提升,而且不仅在正常的比较安静、标准的语音环境下能得到很好的识别效果,在嘈杂的环境或者中英文混读的环境中也能得到很好的效果。如果大家平时会用语音输入,会发现你只说中文,可能效果很好,但中英文混的时候效果就要差很多,这是由于语音识别技术所决定的。但是,我们现在不断地提升模型,将两种语言混合在一起仍然能得到比较好的效果。

而语音合成呢?如果仅仅能够让人听清楚、听得明白,这个事不是特别难,但如果听得很流畅、很舒服而且有不同的音色、风格、情感等等,这些就变得很难了。我们研发的语音合成技术,把这些要素分别结耦、分别训练,最后形成了统一的声音。这时候不仅让声音的自然度更好,同时也可以进行各种定制。如果大家用过地图的导航,知道一般地图会提供一些标准的声音,但你要想用你的孩子、用你的亲人、用你的朋友或者用任何其他人的定制的声音,其实这并不容易做到。但基于我们现在最新研制的语音合成技术,任何人只要对着手机到百度地图说20句话,它就可以给你定制一个模拟这个人声音的合成语。比如你开车的时候,就可以用你孩子的声音帮你导航,帮助你去哪儿、要怎么走等。

刚才讲的是语音识别,接下来是语言相关的。语言相关很重要的一点是语义理解,而我们研制的可以持续学习的,而且不仅有深度学习技术在里面,同时也经过了把知识、知识图谱加进去的语义增强的理解框架,得到了非常好的效果。

同时还有交互的技术,比如说百度的对话式交互平台已经有6万多个定制技能,累计交互已有500多亿次。

再有是两种语言之间的翻译,我们也首创语义单元驱动的上下游感知的翻译模型,而且不仅翻译得很好,同时实时性更好。

所有的百度AI技术,我们已经通过百度大脑开放平台以及飞桨开源开放平台全面开放,大家都可以基于这个平台开发自己的产品、发展自己的业务。另一方面,我们也依托百度智能云,可以更好地、软硬一体地、包括数据、算法、算力结合起来,来部署这些AI能力。

当然,提到AI,安全也非常重要。百度AI安全方面也有一个完整的布局,从基础层到平台层到生态层都有很多的布局,大家有兴趣可以进一步了解。

整体上百度AI大生产平台现在的数据是这样,已经开放216项能力,每天调用次数已过万亿,上面有150多万开发者,有大量的模型发布出来。

AI赋能各行各业,帮助各行各业进入工业大生产时代。时间关系,我不详细讲每一个点,大家可以看到不管是工业、农业、服务业各方面都可以受益于AI的能力。

谢谢大家!

推荐阅读

外媒称特斯拉上海超级工厂168天落地创纪录

图示:10月18日的特斯拉上海超级工厂10月24日消息,据国外媒体报道,2019年底的某个时候,中国制造的第一辆Model 3电动汽车将在特斯拉位于 【详细】

软银在WeWork上遭遇困境,那ARM还好吗?

10月23日消息,据国外媒体报道,芯片架构公司ARM在智能手机时代获得了丰厚利润。在软银收购ARM的2016年,使用其技术的芯片出货量达到了177 【详细】

何刚:华为Mate30 5G是核弹级爆品

10月23日消息,今天华为在深圳召开了5G终端以及全场景新品发布会。华为此次发布了一系列5G产品,华为Mate30系列5G版本和华为5G折叠手机Mate 【详细】

韩媒:LG Display超20位高管被裁员

据韩媒The Elec报道,显示器制造商LG Display在最近的重组中,有超过20位公司高管被裁员,约占其行政工作人员的17%。这些高管包括广州大 【详细】

必胜客开卖人造肉披萨啦 你会去吃吗?

毫无疑问,在保护环境的大前提下,各类有利节能减排的举措都值得推广,其中就包括了近期一直持续不断的热点——人造肉。人造肉汉堡或者素肉 【详细】



科技新闻网版权