【文/观察者网 周毅,编辑 张广凯】
从参数至上转向实用优先,国产大模型正在进入长跑期。
今日(9月7日),2023腾讯全球数字生态大会在深圳宝安举行。在大会上,腾讯集团高级执行副总裁、腾讯云与智慧产业事业群CEO汤道生宣布,腾讯自主研发的通用大语言模型——混元,正式面向产业亮相。
腾讯集团高级执行副总裁、腾讯云与智慧产业事业群CEO汤道生
观察者网在大会现场了解到,腾讯混元大模型拥有超千亿参数规模,预训练语料超2万亿tokens,具有强大的中文理解与创作能力、逻辑推理能力,以及可靠的任务执行能力。
据悉,目前混元大模型已经接入腾讯50多个业务并取得初步效果,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等业务和产品。
发布会现场图 观察者网
据腾讯集团副总裁蒋杰介绍,腾讯混元大模型从第一个token开始从零训练,掌握了从模型算法到机器学习框架,再到AI基础设施的全链路自研技术。此外,腾讯还自研了机器学习框架Angel,使训练速度相比业界主流框架提升1 倍,推理速度比业界主流框架提升1.3倍。
发布会现场图 观察者网
目前,业界大模型在场景中的应用依然有限,主要集中在容错率高、任务简单的休闲场景。腾讯在算法层面进行了一系列自研创新,提高了模型可靠性和成熟度。例如,例如针对大模型容易“胡言乱语”的问题,腾讯优化了预训练算法及策略,让混元大模型的幻觉相比主流开源大模型降低了30%至50%。
与此同时,通过强化学习的方法,腾讯让模型学会识别陷阱问题;通过位置编码优化,提高了超长文的处理效果和性能;提出思维链的新策略,让大模型能够像人一样结合实际的应用场景进行推理和决策。
发布会现场图 观察者网
汤道生表示,腾讯将迈入“全面拥抱大模型”时代:“以大模型生成技术为核心,人工智能正在成为下一轮数字化发展的关键动力,也为解决产业痛点,带来了全新的思路。腾讯产业互联网将通过智能增强、数据增强、连接增强,持续助力产业增强。”
据了解,混元大模型将成为腾讯云MaaS服务的底座,客户不仅可以直接通过API调用混元,也可以将混元作为基底模型,为不同产业场景构建专属应用。汤道生表示,千行百业也可以通过API调用混元,或者将混元作为基底模型,为不同产业场景构建大模型应用。
汤道生强调,腾讯已经和1万1千家生态伙伴展开紧密合作,推出了覆盖100多个产业场景的行业解决方案,共同服务千行百业。去年,生态伙伴收入占到腾讯云整体收入的三分之一,收入增速是腾讯云增速的4倍。“在探索未来的道路上,腾讯愿与伙伴携手,共同探索大模型等全新行业机遇,持续拓展下沉市场,坚持打磨‘好产品’,拥抱‘被集成’,搭建‘数字化大舞台’,请伙伴当好主角,共建产业智能未来。”
以下是汤道生演讲全文:
智能变革未来数据激活产业
尊敬的各位领导、嘉宾、媒体朋友们:
早上好!欢迎大家光临腾讯数字生态大会,非常高兴再一次相聚深圳宝安,在这里,我也特别感谢深圳市政府、宝安区政府,一直以来对我们的大力支持。
从上一届合作伙伴大会到现在,虽然只有一年的时间,但我们与宝安的合作,进展迅速。腾讯云工业互联网总部基地,已经助力了300多家宝安企业的数字化转型;“大湾区人工智能创新中心”和“智能网联技术创新联合实验室”先后建成,全面拥抱人工智能时代。
这是争分夺秒的深圳速度,也是全国各地、各行各业加速拥抱产业互联网的真实写照。产业数字化,越来越多从构想走向现实。腾讯对实体产业的助力,覆盖越来越广,场景越来越深,能力越来越强,我们与合作伙伴的定位与协同,分工越来越清晰,生态也越来越繁荣。
我们深信产品为王,坚定做扎实的技术,构建性能卓越、自主可控的云产品体系。
五年来,腾讯的研发投入超过2300亿,在核心数字科技的许多领域,实现了性能的突破。比如在音视频领域,腾讯编码器在MSU世界大赛中,一次性包揽了全部15个世界冠军。又比如,结合了腾讯云高性能的星星海服务器、深度优化的操作系统TencentOS与自研数据库TDSQL,腾讯云在最近一次TPC-C性能测试中,创下了每分钟支撑8.14亿笔交易的世界纪录。此外,我们在人工智能、云原生、音视频通讯、区块链、网络安全等领域,在全球获得专利授权3.3万件,申请总数超过6.6万件,位列中国企业第一名,全球第二。
我们聚焦产业场景,以解决痛点为目标,推动前沿创新加速落地,助力企业降本增效。
在制造领域,腾讯工业互联网平台WeMake连续三年,入选国家级双跨平台,帮助60多万家制造企业,实现了更好的生产管理。在出行领域,我们与45家头部车企合作,通过腾讯生态车联网TAI,为超过800万车主,提供便捷舒适的车上数字生活。在零售领域,我们用云和连接能力,助力600家头部零售企业,提高销售成绩,助力品牌发展,其中60多家企业,在微信私域里销售额突破10亿。在医疗领域,我们的AI导辅诊覆盖全国1000多家医院,为患者提供更准确的咨询、更详尽的解答。
我们让伙伴“唱主角”,共建高质量的数字经济新生态。
我们和1万1千家生态伙伴展开紧密合作,推出覆盖100多个产业场景的行业解决方案,共同服务千行百业。我们提出聚焦产品,在生态体系中做好数字化工具的提供者,将集成、交付、销售等环节,更多交给生态伙伴,请伙伴“唱主角”。彼此定位清晰,分工明确,角色互补。去年,生态伙伴收入占到腾讯云整体收入的三分之一,收入增速是腾讯云增速的4倍。
腾讯的冠军产品,广泛适配和被集成到伙伴的系统中,成为伙伴破局的“尖刀”。例如,我们的数据库TDSQL,就与250多家合作伙伴的业务系统适配,覆盖金融、政务、能源、工业等关键行业。
立足过往,展望未来,我们也正在迎来全新的机遇。正如腾讯董事会主席马化腾先生所说,“人工智能技术的不断增强,让企业获得一种越来越重要的生产工具,将数据中潜藏的‘信息能源’,源源不断地转化为实体经济高质量发展的新动能。”
以大模型生成技术为核心,人工智能正在成为下一轮数字化发展的关键动力,也为解决产业痛点,带来了全新的思路:大语言模型让人机交互体验变得更简单,理解意图与操控系统的能力也更强大,大幅度提升数字化在产业中的可用性、易用性。企业的核心中枢,也从由人来驱动,走向由人和机器协同驱动,大大提升决策的质量、响应的速度与执行的效率。
腾讯产业互联网也将全面拥抱智能时代,我们将通过三个“增强”,助力产业建构“智能引擎”,挖掘数据价值,连接场景应用,实现高质量发展。
第一,我们以“智能增强”,构筑产业发展“新动能”。
今天我们也非常高兴地告诉大家,腾讯自主研发的通用大语言模型——混元,正式面向产业亮相!
腾讯混元大模型拥有超千亿参数规模,预训练语料超2万亿tokens,具有强大的中文理解与创作能力、逻辑推理能力,以及可靠的任务执行能力。目前,混元已经与腾讯的产品,进行了广泛的对接和集成,在腾讯云、腾讯广告、腾讯会议、腾讯文档、微信搜一搜等多个业务线应用,为用户提供更贴心的智能服务,提高工作效率。
同时,我们也诚意邀请各行各业接入体验,企业可以通过API调用混元,或者将混元作为基底模型,为不同产业场景构建大模型应用。
我们始终认为,大模型需要基于产业场景,与企业数据融合,才能释放出最大的价值。AI通过对企业生产、销售、服务各个环节的影响,助力产业生产效率提升、服务创新。
因此,我们推出了“腾讯云MaaS服务”,在腾讯云行业大模型精选商店中,我们不仅提供混元大模型,还上架了20多种行业最新、最流行的开源通用大模型,以及覆盖金融、文旅、零售、政务、医疗、教育等20多个领域的行业大模型。
企业可以根据需要,选择合适的模型,然后借助腾讯云智能的TI平台,导入企业专有数据,做进一步的训练与精调,快速生成更有针对性的专属大模型,满足企业个性化需求。
同时,我们也将大模型与腾讯的行业解决方案、企业级应用结合,在生产、营销、售后服务、办公等多个环节,实现能力提升,达至降本增效。
通过智能生产,我们以创新方式破解场景痛点。例如,在能源领域,我国有大量的电网设备,散布在偏远地区,依靠人工巡检方式,故障隐患无法及时发现和处理,影响电力生产安全。我们通过训练电力视觉大模型,一个模型可以有效适应不同电网场景,具有高检出率、低误检率、支持少样本训练、泛化能力强的优势,助力电网生产经营和减负增效。
我们通过智能营销,提升服务效率。在营销分析中,企点分析·AI助手,基于行业模型,让销售人员用自然语言提问,就可以获取准确的商业分析,几秒钟可以获取一份PPT,不再需要花费大量的时间,学习复杂的软件、制作看板。新一代的腾讯企点智能客服,基于行业模型,结合客户业务需求进行训练与精调,可以提供更精准、更详细的回答,复杂问题的解决率,比之前提升了30%。
在上海仁济医院,我们将数智人,与医疗大模型结合,合作开发了“数智人医疗智能客服”,通过这个“虚拟护士”,患者可以用语音,无障碍咨询,看哪个科室,找哪个医生,做什么检查?系统的回复也更准确、更人性化。即保障患者高效就医,也避免了三甲医院专家资源的浪费。
同时,我们也通过智能办公,助推高效协同。现在,腾讯会议、腾讯文档、企业微信、腾讯乐享等应用,已经全面接入大语言模型能力,助力工作效率大幅提升。例如,我们的企业社区产品——腾讯乐享,拥有培训学习、知识管理、文化建设等多元能力。在腾讯内部使用过程中,沉淀了150万篇员工创作的各类技术、经营文档,每月平台浏览量超过5千万次。腾讯乐享搭载大模型能力之后,通过AI助手,可以帮助大家在复杂的资料库中,快速检索和提炼对自己有用的信息。在数字化培训中,AI还能在线进行课程答疑,一键生成测试题库,助力更有效率的企业培训。
第二,我们以“数据增强”,夯实企业数字化基石。
很多人注重大模型,但对数据关注不够。数据已经成为社会和企业运行的关键生产要素,随着智能时代的到来,数据将发挥更大作用,甚至成为企业竞争的核心壁垒。在“数据爆炸”的时代,解决好数据的处理、挖掘、安全等问题,将成为企业和开发者必须翻越的山峰。
数据处理能力有多强,决定了业务发展天花板有多高。我们持续增强数据库、大数据等能力,满足企业运行中对海量数据的存储、读写、调用和弹性管理需求。
腾讯云数据库TDSQL,单实例存储规模达到PB级别,单实例日请求次数超百亿次,在Garner报告中,OLTP(在线事务处理)及轻量级TP能力得分均为国内第一。
我们也推出AI原生的向量数据库TencentCloudVectorDB,这是国内首个从接入层、计算层、到存储层全面AI化的数据库。当你想在大模型中找到一张带“猫”的图片,腾讯云向量数据库能在1百毫秒内,从10亿张向量化的图片中,返回查询结果。
腾讯云大数据,则通过不同的大数据分析引擎和相应的数据开发、算法开发服务,帮助企业实现数据仓库、用户画像、精准推荐、风险管控等大数据应用服务。算力规模达到千万核,每天实时计算量数百万亿次,规模量级位居国内第一。我们通过云原生数据湖仓,将数据仓库的高性能和管理能力,与数据湖的灵活性融合;实现存储智能调优、无差别的数据访问体验,让存储和计算引擎无缝对接。
在数字化时代,企业的日常经营,高度依赖各种数字系统。数据需要在安全合规的情况下被使用。如果数字系统一旦被攻击,用户数据一旦被泄漏,对企业经营可能造成重大的损失,对企业信誉带来长期负面的影响,因此企业必须高度重视与投入数字安全防护能力的建设。
腾讯具备业界领先的安全能力,在威胁情报、风控反欺诈、数据安全、云安全托管服务、零信任等领域,腾讯安全多年来被权威市场分析机构,评为“领导者”和行业第一的位置,也服务了80%以上的金融行业客户、90%以上的头部能源企业、80%以上的头部车企。
广州农商行通过腾讯安全“SOC+安全运营体系”,以自动化策略拦截攻击2千万条。同时,日常威胁分析时间从原来的4小时,降到了30分钟,在有效保障系统安全同时,大幅度提升了安全运营效率。
第三,我们以“连接增强”,激发场景创新。
做好产业数字化,还需要推动数据像水一样,不断滋养人、财、物等传统生产要素,才能生长出像参天大树一样的、健康高效的企业经营管理体系。流动的水才有活力,而流动的数据才能发挥作用,“连接”就是数据保持流动的“河道”。
过去,我们通过QQ、微信等连接了超过10亿用户。今天,我们也将这样的连接,拓展到产业场景中人与人、人与物、物与物的连接。企业微信连接超1200万真实企业及组织,腾讯会议用户数超过3亿。
在产业互联网中,我们仍然致力于连接用户,把用户身份贯穿多个企业应用,过程中也发现了企业身份ID管理上的许多痛点。在企业的数字办公环境中,身份ID是员工进入业务场景的“工卡”。随着企业内网与云上的数字系统越来越多,如果不同系统各有自己的账号"门禁",多重身份ID的维护成本很高,用户无法在不同系统间自由切换,数据也打不通、不同步,给员工带来许多不便,同时割裂的权限管理也大大增加了数据安全的风险。
今天,我很高兴向各位宣布,腾讯统一身份ONEID,正式发布。它能帮助企业统一管理员工的身份架构、登录方式、应用权限,一处管理,各处身份一致。员工用一个身份,就可以顺畅访问各业务系统。OneID不仅与腾讯会议、腾讯文档、腾讯乐享等,自研SaaS应用兼容,也将全面兼容第三方应用。OneID的统一身份能力,也可以让业务系统,自由组成松散套件,让企业客户能够自由选择最符合业务需要的应用,有更好的业务联动体验。
在全真互联的时代,我们以实时数字孪生,连接时间、空间、物体和人,基于AI、实时计算、仿真推演、大数据等技术对数据整合处理,实现物理世界在虚拟世界中可观察、可分析、可预测、可管控。
腾讯与故宫合作打造“数字孪生智慧管理平台”,不仅在线上复刻了古建筑的样貌和结构,还打通了照明、湿度、仓储、门禁等多个管理系统。可以根据丝绸、陶瓷、青铜等不同材质,自动调整灯光、温湿度、二氧化碳浓度等参数,为文物提供最适宜的环境,最大程度减少损耗。同时,对烟雾、火灾、入侵等危险情况,进行实时监测和预警,保障文物与建筑安全。
各位嘉宾,各位伙伴!
过去五年,在社会各界的共同努力下,数字科技已经深入各行各业,“上云”已经从“共识”成为“现实”。在产业互联网的征途中,我们已经开始全力攀登“智慧化”的阶梯,开创产业升级新局面。
在探索未来的道路上,我们期待,与伙伴携手,共同探索大模型等全新行业机遇,持续拓展下沉市场。我们将坚持打磨“好产品”,拥抱“被集成”,搭建“数字化大舞台”,请伙伴当好主角,唱好戏;以持续稳定的合作规则,让伙伴与腾讯的合作分工更清晰、投入更有积累、收益更可预期。
我们将立足于未来,立足于实效,让数字化工具在产业中用起来、用得好,以智能增强、数据增强、连接增强,持续助力产业增强。我们会继续以创造价值为目标,坚定地投入技术与创新,不断完善产品,提升服务体验,与生态伙伴、产业客户同心协力,共建产业智能未来!谢谢大家!
本文系观察者网独家稿件,未经授权,不得转载。