2018 年中国自动驾驶俨然进入一个快车道。在各地利好政策的推动下,自今年 4 月开始,上海、北京、重庆、深圳先后开启了自动驾驶城市道路测试;今年 7 月的百度开发者大会上,李彦宏也兑现了一年前的承诺,基于 Apollo 平台,百度和金龙客车合作的全球首款L4级量产自动驾驶巴士「阿波龙」正式量产下线。
到了 8 月份,Apollo 继续霸占中国自动驾驶的新闻。比如和神州优车的合作,双方将探索 10 万辆级自动驾驶车队的商业化运营,开始推行「自动驾驶+共享出行」的商业模式;而与长城汽车的合作,双方将于2020年底实现自动驾驶汽车的量产,百度也成为长城WEY品牌的自动驾驶高精地图和自定位技术的指定合作伙伴,这意味着百度成为国内首个真正实现了L3级自动驾驶高精地图商业化量产的地图提供商。此外,继比亚迪后,长城汽车也加入Apollo开放车辆认证平台。
事实上,Apollo 自诞生到现在不过一年半的时间,能在如此短的时间里,不仅开放平台更新迭代到 3.0,更是在技术、生态和商业化探索上取得不少令行业激动的进展,这当然得力于百度过去多年在自动驾驶领域的人力、物力投入,但鲜为人知的是,支撑 Apollo 平台底层技术的“基础设施”——百度大脑——发挥了巨大作用。
技术:从一辆车到一个平台
自第一辆福特 T 型车下线后一百多年里,人类从未放弃自动驾驶的梦想,而在本世纪初的几年时间,人类似乎看到了实现这个梦想的机会。
2004 年开始,美国国防部高级研究计划局(DARPA)连续三年组织了多次自动驾驶比赛,比赛吸引了来自全美多所名校的教授、学生。尽管有些组装的汽车最终完成了挑战,但人们也发现了自动驾驶落地的真正难点并非是研发出一辆汽车,更大的困难还包括如何降低成本,汽车厂商不可能让一辆 200 万美元研发成本的汽车成为大众可以接受的车型;再比如如何实现量产,汽车作为一款交通工具,其首要考量的是安全性,那么自动驾驶汽车是否能够完全符合汽车行业对于安全的要求,所有这些都是未知数。
作为国内自动驾驶研究的先行者,随着 2017 年 Apollo 平台的成立,百度的自动驾驶开始了从一辆车到一个平台的战略转变。
战略的转变也需要强大的技术支撑,百度大脑在这个过程中扮演了重要的角色。百度深耕AI多年,百度大脑首次亮相于 2016 年的百度世界大会,可以说是百度大脑是百度AI技术多年积累和业务实践的集大成,包括视觉、语音、自然语言处理、知识图谱、深度学习等AI核心技术和AI开放平台。
首先,自动驾驶汽车绝非「摄像头+传感器+传统汽车」这么简单,而是一种驾驶理念的颠覆,如何让汽车学会感知、学会规划以及学会对不断变化环境的反馈,这需要这个顶层系统的支持,也是摆在任何自动驾驶研发者面前的首要难题。
依托百度大脑,Apollo 平台已经可以提供环境感知、行为预测、到规划控制、高精地图、高精定位等一整套完整的技术解决方案,这凸显了百度大脑在AI核心技术的全面布局和深厚积累。
其次,Apollo 作为一个开放平台,需要承载不同厂商、不同车型的技术要求,这也要求底层的百度大脑具有更灵活、也更弹性的系统设计,尤其是,百度大脑如何应对平台级别的技术调用需求。
不久前的开发者大会上,百度不仅发布了百度大脑 3.0,提供了「多模态深度语义理解」的技术升级,还提出一个「用脑量」的概念,这是一个类似于今天用电量来形容一个产业的繁荣状况一样,「用脑量」也会成为判断一个行业智能水平的标准。
百度高级副总裁、AI技术平台体系(AIG)总负责人王海峰在今年的百度AI大会上介绍说,百度大脑现在每天的调用次数已超过4000亿次,自去年 11 月到今年 6 月,百度大脑的技术调用量,也就是「用脑量」有显著的增长,其中,语音技术日调用量增长94%,视觉技术日调用量增长了416%,人脸识别技术调用次数增长近8倍,NLP(自然语言处理)技术日调用量增长了180%。
上述这组数字展现了百度大脑的开放赋能能力,实现了从一辆车到一个平台的巨大跳跃,而另一组数字则显示了百度大脑以及所支撑的各种应用的进化速度。
速度:「中国速度」背后的底层支撑
2017年7月5日,百度Apollo平台正式亮相并发布1.0版本,两个月后,Apollo1.5发布。
2018 年 CES 期间,发布仅八个月的自动驾驶平台 Apollo 迎来 2.0 版本升级,从整体架构、安全性、感知能力以及模拟器方面都得到提升和优化。
七个月后,Apollo 3.0 在百度开发者大会上亮相,带来了一个新架构、两个新平台以及四个量产解决方案的升级。
这一系列被称之为「中国速度」的创新迭代之快令行业震惊,伴随快速迭代的系统版本,Apollo 生态也从无到有、从一到多,快速成长为世界级的自动驾驶开放平台。公开资料显示,Apollo 平台已经开放了 22W+ 行代码,其托管在 GitHub 上的开放代码数量在一年之内增长了 6 倍;而且,还被超过 10000+ 的开发者推荐使用;目前已经拥有 119家生态伙伴。
要支撑如此快速的自动驾驶发展需求,百度大脑是如何应对的?
其一,持续推动基础技术创新。以不久前发布百度大脑 3.0 为例,其核心「多模态深度语义理解」,就是对文字、声音、图片、视频等多模态的数据和信息进行深层次多维度的语义理解,涵盖了数据语义、知识语义、视觉语义、语音语义一体化和自然语言语义等多方面的语义理解技术。
这也意味着,通过「多模态深度语义理解」,机器可以在听清、看清的基础之上,更深入理解它背后的含义,深度地理解真实世界。
其二,进一步提升算力。某种意义上说,自动驾驶汽车就是一个「移动的数据生成器」,海量的数据需要实时计算,更需要低成本计算。今年,百度大脑在过往计算能力基础上推出云端 AI 芯片「昆仑」,专门针对语音、图像、NLP 等计算需求,不仅能够大幅提升计算能力,还能将大大降低计算成本,官方给出的数字是降低 10 倍。未来百度还将推出专门针对自动驾驶场景的AI芯片。
这些基础技术创新对自动驾驶发展的意义重大。正是利用上述基础技术,Apollo将打通语音交互和视觉交互体系,打造出业内首创多模交互的小度车载系统。根据百度官方透露,目前可以在 30 天内完成小度车载 OS 在车上的一站式部署,直接让传统汽车升级为智能汽车。
进化:正在成为全行业的 AI 基础设施
新技术之于互联网公司,都要经历从内部优化到外部赋能的过程。百度大脑很早就成为百度内部众多产品,如搜索、地图等产品的底层技术实施,将人工智能的各项能力注入到这些产品之中。
过去一年多时间,不管是自动驾驶平台 Apollo 还是对话式操作平台 DuerOS,其技术难度之大、行业影响之深以及快速迭代的需求,都是早先行业所没有遇到的难题,也正如上文所言,在过去一年多的时间里,基于百度大脑的 Apollo 在技术、商业和生态上取得的成绩,恰恰反映了百度大脑作为人工智能基础设施的可行性。
如果将视线放在整个人工智能领域,百度大脑还有诸多进化的可能性。尤其是 3.0 版本的百度大脑构建了从芯片到深度学习框架、平台、生态的 AI 全栈技术布局。
除了上文提到的芯片,百度大脑上的深度学习开源框架 PaddlePaddle 也更新到 3.0 版本,新版本在服务器和移动端进行了全面优化,可以适配更广泛的开发需求。
其次,基于 PaddlePaddle 增加了三个平台 AI Studio、AutoDL、EasyDL,进一步降低了开发者进入人工智能领域的门槛,比如 AutoDL 的目的是向开发者提供更普惠也更自动化的神经网络架构,而EasyDL可以帮助开发者零算法基础训练业务定制模型,并提供可视化的操作。
第三,正如王海峰所言「我们研发最顶尖的AI技术,我们也致力于开放最顶尖的AI技术」,百度大脑已对外开放110多项领先的AI场景化能力与解决方案,这些能力和解决方案为各行各业的开发者甚至毫无编程经验的入门者提供了一个可以改变世界的可能。
如果说 Appllo、DuerOS 是百度大脑面向汽车、人机交互提出的进化方向,那么基于百度大脑,越来越多的开发者、大中小企业,完全可以结合自己的优势和领域,开发出更多面向某个特定行业、领域应用,只有越来越多的应用落地,才能推动人工智能,尤其是中国人工智能的快速发展。
写在最后
李彦宏不久前曾说过这么一句话:「我们希望,今天,无论你在哪里,无论你是谁,都能够通过百度平等便捷地获得AI能力。」如果把这句话放在百度人工智能发展的大框架里看,我们会发现自动驾驶平台 Apollo 是让赋能自动驾驶行业,让汽车领域的开发者、厂商平等接入自动驾驶,对话时平台 DuerOS 则是要让语音交互变成人人可以开发以及构建全新商业模式的底层技术。
百度大脑则更进一步,它在驱动上述两个世界级的平台,同时又在向全世界的人工智能开发者们开放新的能力和技能,这个全新的人工智能基础设施正在让自动驾驶的梦想成真,同时还将承载更多人类迈向智能未来的新梦想。