大模型对日常生活的改变,比预期来得更早一些。
很多用户可能已经注意到,手机地图导航的语音交互越来越接近真人交流的体验:当用户询问一个较为复杂的问题时,或许很难一次描述清楚自己的需求,但是可以多次补充追问,地图应用也会主动询问,还能根据用户的使用反馈自主学习成长,更准确理解和满足用户的真实意图,越来越像一位“AI向导”。
这背后正是大模型技术对地图应用交互体验的重构,用户可通过自然语言对话,一步唤醒地图中埋藏的各种功能和服务,提升出行决策效率。
在学习和工作领域,改变也在发生。此前,整理英文报告、论文以及视频资料的核心信息是一件非常繁琐的工作,不仅浪费大量时间,还经常发生遗漏重要信息等问题,都会影响整体的进度。而一些应用加持了大模型能力之后,可帮助用户一键提取这些复杂文件中的内容重点、翻译特定段落,甚至还可以为文稿起标题、根据文档写读后感。目前,这些新功能已经在百度文档、百度网盘中应用,极大提高信息理解和传播效率。
对于这些新变化,百度创始人、董事长兼CEO李彦宏在2023百度世界大会上给出的判断是,AI原生时代即将来临。“没有构建于基础模型之上的丰富 AI 原生应用,大模型就一文不值。”
实际上,这种趋势在移动互联网时代已经得到验证。智能手机和底层操作系统的发展是基础,移动互联网的真正繁荣是由形形色色移动应用带来的,而移动互联网的竞争就是应用层面的竞争。
以此类推,大模型给日常生活带来的改变也将由应用层的落地带来。应用是大势所趋,不能落地的AI都是空中楼阁,而“卷”应用的竞赛才刚刚开始。
从技术到应用,大模型转向
今年上半年,国内掀起了一股大模型热潮。但几个月之后,一些从业者突然醒悟。
作为底层技术底座,大模型并不能直接创造商业收益,市场也不可能容纳下数十个甚至更多大模型产品。和电脑、手机操作系统类似,大模型竞争的结果也将是一两家大模型作为底层操作系统,统一整个市场。
在多位大模型从业者看来,资金和资源更强的科技巨头公司更有能力承担大模型底层技术底座的角色,创业公司和巨头公司“卷”大模型技术并不明智,而应用层的机会更大,大家可以在产业链上做各自擅长的事。
百度等一众互联网公司都发布了自己的大模型产品,一些产品正在快速迭代,逐步形成核心优势。比如,百度旗下的文心大模型在今年5月已迭代3.5 版本,4.0版本在2023百度世界大会上正式发布,并开启邀请测试。
在大模型技术层面构建起核心优势之后,百度也把更多精力投身应用层。李彦宏在百度世界大会表示,没有构建于基础模型之上的丰富 AI 原生应用,大模型就一文不值。换言之,单纯卷大模型没有意义,AI大模型研发的最终目标都是要落地、转化成能够被普通人使用的工具。
百度已经把李彦宏对大模型趋势的判断转化为实际行动。在2023百度世界大会上,百度发布了十余款AI原生应用,从百度搜索到百度地图、百度文库、百度网盘等被C端用户熟知的互联网应用,再到如流、百度健康有医笔记等工具类产品,都被文心大模型重构。
其中,生成式AI与搜索是天作之合。此前,“AI伙伴”等功能以及灵境矩阵平台已上线,10月百度搜索将有更多新功能。AI重构后的搜索,能够更准确理解用户意图,给出最佳答案,还能够搜索总结全网优质内容,与用户多轮交互。
在大模型重塑工具产品上,百度从交互方式、需求满足方式、工作流程重塑等方面改进工具产品的体验。比如,针对传统办公中的沟通和高频会议场景,如流推出的超级助理“IM智能总结”功能,划选多条对话之后会生成一段智能总结,一键转发,接收人便能看到这条精简准确的总结,快速决策和响应,该功能使消息阅读效率提升3倍。
虽然大模型对不同产品的重构方式不同,但都有一个共同的出发点,改进原来的人机交互方式,改善用户体验、提升效率,这是一种让用户受益的重构。当大模型从技术转向应用成为越来越多从业者的共识之后,大模型的竞赛方向也被改写,“卷”应用是一种更良性的内卷,最终都会转变为更好地服务用户上,让各种产品的服务能力产生质的飞跃。
大模型时代,应用层的智能化想象力
正如我们很快习惯于智能手机给日常生活带来的便捷一样,我们也将很快习惯大模型带给各种互联网应用的智能感。
从C端已经出现的AI原生应用来看,大模型带来的改变主要集中于更好的交互体验以及更高效的信息整理和理解能力,这只是应用朝着智能化方向进化的开端。由此,我们也可以预见到大模型时代,应用层面朝着智能化发展的一些趋势。
越来越多的C端应用都将朝着改善用户交互体验和更好理解用户意图、需求的方向发展,最终达到和真人沟通互动一样的体验效果。除了在搜索、文档等信息处理领域之外,电商、教育、医疗服务等应用场景,也可以通过这两方面的改善实现更好的用户体验。
目前,百度电商已率先试水AI智能导购度小优以及AI数字人直播解决方案慧播星。利用文心一言的自然语言理解和生成能力,度小优学习和汇聚全网的商品信息、优惠信息,通过对话的形式与用户进行交流,了解用户在购物过程中的需求、偏好、预算等信息,并根据用户的输入提供个性化的商品推荐和指引,解决用户在购物过程中的各种问题。
而当这些自然语言理解和生成能力在电商行业广泛应用之后,未来用户在电商平台购物时不再需要精准描述想要的品牌、型号以及款式等信息,可以通过模糊的描述让平台推荐和其预期匹配的商品,扩大其选择面,也能帮助其找到更符合自己预期的商品。
在产业端,大模型的知识增强能力和产业场景适配能力在特定行业中落地,将极大提升相关行业的生产效率,是一次新的生产力进化机会。
百度在产业端也率先进行了一些尝试,给行业的进化提供了想象空间。在营销领域,百度推出AIGC商业创意平台“擎舵”,可通过多模态内容生成突破创意生产力瓶颈,2分钟生成100条创意文案,3分钟生成一个数字人建模,5分钟即可制作一支完整的数字人口播视频,大大降低生产营销素材的成本。在2023百度世界大会上,百度还发布了国内首个生成式商业智能产品百度GBI,该产品可针对政务、金融、工业等领域大量的数据查询分析的需求,实现企业客户用任意问题询问任意一张或多张数据表都可以快速得到结论的效果,为企业经营、生产安全、设备监控、业务增长等方面的决策提供充分的信息支持。
由此可以预见,当大模型能力在营销、政务、金融、工业等领域广泛应该之后,这些领域的智能化水平将有显而易见的进步,工作效率大幅提升,最终带来的是相关企业经营朝着更健康的方向发展。
无论是更好的用户体验,还是更高效的生产力,最终带来的都是相关领域企业商业收益层面新的飞跃。C端应用在大模型能力的加持下获得更好的用户体验,将转化为用户付费收入的提升、广告收入的提升,而B端企业生产力和工作效率直接关系着企业营收。在智能化的新浪潮下,各种各样的企业都获得新机会,能把握住计划的企业将获得更大的发展空间。
比惊艳更重要的是持久
作为人工智能新的发展方向,大模型和过往的人工智能技术非常不一样。
过去十几年,人工智能领域让人眼前一样的技术接二连三出现,但经过多年沉淀之后,很多当年红极一时的技术和应用已经被人遗忘,比如大家熟知的AI聊天和AI下棋等。这些新技术和应用刚出现时给普通大众了足够的新鲜感,提供人们茶余饭后热议的话题,很多人也愿意去尝试使用。但在娱乐消遣价值之外,这些新技术和应用提供的实用价值非常有限,当人们的新鲜感逐渐消失,它们也就被冷落。
所有新技术和新产品,无论刚出现的时候有多惊艳,如果不能服务于人类日常生活和社会发展,最终都会被人遗忘。人工智能技术也一样,如果AI不能服务于人类更美好的生活和社会的发展,就是华而不实的空中楼阁,并不具备长期发展的动力。
此前AI实用价值不足的问题主要由两方面因素导致:一方面,AI的技术能力有限,很难满足用户解决实际生活中较为复杂问题的需求。比如,此前AI聊天的能力仅限于和用户插科打诨,很难提供有价值的信息和判断。另一方面,AI技术能力还处在单点突破阶段,能解决的问题也仅限于特定场景,无法在更多领域展开。
大模型和过往人工智能热门技术和产品本质的不一样,就在它的通用能力,对各行各业都有实用价值。
在大模型技术能力的加持下,用户可获得医疗、教育、财务等各种专业领域问题的答案,还可以一键式生成图文和视频内容,能够给生活、工作和学习带来实实在在的改变,这得益于大模型更强的信息理解能力以及文字、图片和视频生成能力。而当技术和产品对用户和产业有实用价值,才能够形成商业价值循环,获得持久生存下去的能力。
在ChatGPT走红之初,很多人工智能从业者被其技术能力所惊艳,纷纷投身于训练自己的大模型产品,这是面对新技术的冲动性选择。而经过一段时间的沉淀之后,很多从业者回归理性,他们意识到大模型只是底层的技术能力,各项参数和训练能力的提升并不能带来直接的商业收益,真正的商业收益来自于其解决生活生产中的各种问题。所以,越来越多人开始转变大模型开发思路,从技术转向应用。
比起让人惊艳一时的技术能力,新技术和产品更重要的实现商业价值循环,这也是当下人工智能领域比较欠缺的。大模型竞赛方向从技术转向应用,是一个良好的开端:更多从业者从应用和商业角度思考大模型的价值,也就意味着大模型将更快速地从技术概念走向落地,走向用户和产业受益的正向循环,而AI技术本身也能够在实践中继续进化。
当越来越多AI原生应用改变人类生活,人工智能造福于人类的美化愿景才能真正实现。