“未来,自然语言将成为新的通用编程语言,你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。”
4月16日,百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会上发表“人人都是开发者”的主题演讲。
“过去这一年,我跟很多创业者、开发者交流,感觉大家都处在一种‘FOMO’状态,既兴奋又害怕错过。”李彦宏说。
在过去一年,AI正在重塑社会认知。
不过,大模型时代的到来和AI原生应用的爆发给创业者、开发者带来机遇的同时,也让众多普通人陷入迷茫。面对AI时代的巨大风口,普通人怎么做应用?怎么做智能体?怎么保证跟上AI时代的脚步?
李彦宏给出了确切的答案:“人人都可以成为开发者。”
他认为,大模型和生成式AI将彻底改变开发者这个群体,“AI正在掀起一场创造力革命,未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者。”
会上,李彦宏表示,百度作为一家技术公司,百度尽可能为大家提供所需的开发工具,提升社会创造力,这包括了1个强大的基础模型系列也就是文心大模型,和三大AI开发工具,包括智能体开发工具AgentBuilde、AI原生应用开发工具AppBuilder和各种尺寸的模型定制工具ModelBuilder。它们组成了一个工具箱,支持开发者打包带走,随取随用。
文心一言用户数突破2亿
据了解,百度在4月3日正式发布智能代码助手Baidu Comate 2.0,面向个人开发者全面免费。此前Comate已经在百度内部上岗1年,李彦宏在大会上透露,“上岗一年多,Comate已经走入了喜马拉雅、三菱电梯、软通动力等上万家企业,生成的代码采纳率达到了46%,百度每天新增的代码中,已经有27%是由Comate生成的。”
李彦宏认为,借助AI,人人都能成为一名开发者,“今天,你不会写代码,也可以做出一个AI应用;不用编程,也可以做出一个智能体。AI正在掀起一场创造力革命,未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者。”
在大会上,李彦宏还披露了文心一言的最新用户数据,“文心一言从去年3月16日发布,到今天是一年零一个月的时间。我们的用户数突破了2亿,API日均调用量也突破了2亿,服务客户数达到了8.5万,利用千帆平台开发的AI原生应用数超过了19万。”
李彦宏透露,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。也就是说,客户原来一天调用1万次,同样的成本现在一天可以调用100万次。
得益于文心大模型的强大,开发者通过文心4.0降维裁剪出来的更小尺寸模型,要比直接拿开源模型调出来的模型,同等尺寸下效果明显更好;同等效果下,成本明显更低。李彦宏强调,“大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。所以开源模型会越来越落后。”
除了开发工具之外,李彦宏还为开发者们带来了资金和资源方面的支持。大会现场,李彦宏宣布,第二届“文心杯”创业大赛正式启动,面向全球市场及高校学子招募AI原生应用方向的创业创新团队,并设立“特别大奖”。他表示,“特别优秀的项目将有机会获得5000万元的现金和资源支持。”
智能体带来应用爆发
在开发AI原生应用的具体思路方面,李彦宏提到,MoE、小模型和智能体是值得关注的三个方向,“这是我们百度根据过去一年的实践,踩了无数的坑,交了高昂的学费换来的。”
智能体是在基础模型上,进一步进行思考增强训练,包括思考过程的有监督精调、行为决策的偏好学习、结果反思的增强学习,进而得到思考模型。智能体的思考模型像人一样,会阅读说明书,学习工具的使用方法,进而可以调用工具来完成任务。
百度首席技术官王海峰认为,智能体是重要的发展方向,会带来更多的应用爆发。从万亿级训练数据中,文心大模型既学到了自然语言的能力,也学到了代码能力,打通从思考到执行的过程。基于文心大模型的这两种能力,百度开发了代码智能体和智能代码助手。王海峰表示:“代码智能体,让大家都能做之前只有程序员才能做的事,人人都可以成为程序员;智能代码助手,则帮助专业的程序员更高效地写出更好的代码,可以说是程序员的AI同侪。”
百度集团资深副总裁、百度移动生态事业群组总经理何俊杰表示,智能体将重塑人与技术互动的方式,带来新的应用生态、流量格局和商业模式。何俊杰透露,在用户层面,百度移动生态致力于打造“人人可用的超级智能体”,他现场展示了百度新文库、文心一言App的全新进展;在客户层面,商家智能体、慧播星等正成为商业经营的标配和基建;在生态层面,AgentBuilder(文心智能体平台)致力于让每个人都能成为智能体开发者,成为人人可开发、人人可经营、人人可获益的平台。
此外,百度搜索、地图、贴吧等百度生态的平台也都能接入智能体的能力,让开发者获得实打实的流量支持。
李彦宏认为,“智能体可能是未来离每个人最近、最主流的大模型使用方式,基于强大的基础模型,智能体可以批量生成,应用在各种各样的场景。”
现场,李彦宏演示了新加坡旅游局、启德教育和索菲亚三个智能体案例,手把手教开发者用自然语言,5分钟、零门槛创建一个智能体,“启德教育智能体非常受欢迎,上线第一周,就成功分发了155万次,与用户交互了5.8万次,线索转化量直线增长、有效线索的转化成本明显降低,经营效率大幅提升。”
视觉大模型最大的应用场景是自动驾驶
面向未来,李彦宏认为,多模态大模型,或者说文字、图片、语音、视频等多模态的融合,是基础模型非常重要的长期发展方向,是通往AGI的必经之路,“百度在这些领域有着长期投入,并将及时更新大模型的最新进展。”
李彦宏还表示,“我有一个非常不一样的判断:视觉大模型最大的应用场景是自动驾驶。百度在这个方向上是最好的,是自动驾驶的全球领导者,我们不只训练AI如何生成视频,更训练AI理解真实世界发生的事情并预测未来。”
李彦宏透露,基于超过1亿公里的、中国复杂城市道路测试里程数据,百度训练出来了Apollo视觉感知大模型。它具备检测、跟踪、理解、建图四大基础能力。这让百度拥有了更智能、适应性更强、更安全的自动驾驶方案。
在大会现场,百度集团执行副总裁、百度智能云事业群总裁沈抖正式发布新一代智能计算操作系统——万源,通过对AI原生时代的智能计算平台进行抽象与封装设计,为用户屏蔽掉云原生系统与异构算力的复杂性,提升AI原生应用开发效率与体验。
沈抖表示,随着大模型技术的不断演进,通过自然语言进行编程正在成为现实。编程将不再面向过程或者面向对象,而是面向需求;编程的过程将成为开发者表达愿望的过程,并为操作系统带来革命性的变化。在操作系统的内核中,底层硬件从以CPU算力为主变成以GPU算力为主,并且新增了被大模型压缩的世界知识。操作系统管理的对象发生了本质的变化,从管理进程、管理微服务,变成了管理智能。
“传统的云计算系统依然重要,但不再是主角,我们需要一个全新的操作系统,对新的计算平台,也就是智能计算做好抽象和封装,重新定义人机交互,为开发者提供更简单、更流畅的开发体验。”沈抖如是说。
“AI正在掀起一场创造力革命,未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者。”李彦宏在演讲最后表示,“今天的中国,有10亿互联网用户,有强大的基础大模型,有足够多的AI应用场景,有全球最完备的产业体系,国家也在大力鼓励和支持‘人工智能+’行动,每一个人、每一家企业,只需要充分利用这些工具,就可以释放无限的创造力和生产力。”
采写:南都记者 汪陈晨