今年3月的一天早上9点,上海11号线龙耀路地铁口,很多人穿着厚厚的大衣,手里拿着早餐和电脑快步行进。
就在前方不到两公里内,腾讯、阿里、微软、无问芯穹、出门问问、澜码科技等多家 AI 大模型初创公司和科技互巨头就坐落于此。
尽管外面寒风凛冽,但当你走进上海模速空间、西岸智塔AI Tower,里面却呈现“热火朝天”的办公景象。内外形成鲜明对比。
与此同时,距离模速空间1200多公里外的海淀区成府路上,北京智源人工智能研究院、智谱 AI、百川智能、面壁智能、生数科技等多家北京大模型公司亦坐落于此。而“五道口”这里也被称为中国大模型的“发祥地”。
企业技术人员们每天熬夜、更新迭代,都铆足了劲头希望超越OpenAI。
位于北京量子芯座的 AI 公司月之暗面产品经理松鹅形容,最近一年多,他们几乎每天都要阅读大量关于 AI、模型相关的公开技术论文,这也成为他们研发并迭代Kimi智能助手的核心原因之一。
过去近一年间,北京、上海两城大模型产业竞争已趋于白热化。
多家北京 AI 公司负责人告诉钛媒体App,上海开出了非常优渥的条件,不仅有人民币基金投资、产业链合作等,而且还有“算力券”的支持,他们希望北京 AI 公司能到上海模速空间等地设立办公室,并落地大模型应用。
2023年9月,全国首个生成式 AI 专业孵化和加速载体上海模速空间(上海“模速空间”创新生态社区)成立。
钛媒体App编辑实地走访了解到,不到半年内,模速空间就有近60家企业入驻,确认入驻企业已超过50家,其中86%(43家)的企业来自垂类领域应用企业,如成立不到一年的清华系 AI 模型算力公司无问芯穹,其在模塑空间旁边设立了一个规模非常大的“总部”。
据钛媒体App不完全统计,截至目前,上海发布的大模型产品已超过33个,而北京大模型超过115个——全国排名第一。
如今,在 AI 大模型领域,北京、上海两城“并驾齐驱”,加速抢滩布局,构建 AI 产业链,预计到2025年总规模目标将达到7000亿元人民币。
那么,这是否存在重复性建设?北京、上海 AI 产业是否将出现小而散的问题?而作为国内经济最发达的两座直辖市,北京、上海双城 AI 大模型竞争即将爆发,谁将能抓住先机,成为“中国大模型第一城”?
起点比ChatGPT早,2025年北京 AI 产业规模达3000亿
北京市在 AI 大模型产业的布局最早起源于六年前,比ChatGPT的出现还要早。
2018年11月,北京市政府联合科技部成立北京智源人工智能研究院(BAAI),以及北京智源行动计划。成为北京市继脑科学与类脑研究中心、量子信息科学研究院之后,着力建设的又一个重要的新型研发机构。
时任北京市委副书记、市长,现任上海市委书记陈吉宁在致辞中指出,智源研究院将集合北京大学、清华大学、中国科学院、百度、字节跳动等机构,采用新的科研组织形式和人才引进培养模式,推动 AI 发展方向和理论、方法、工具、系统等方面的关键性突破。北京市将把政府、企业和社会数据集合到这一平台上,建设新的开源 AI 工具,并将整合大学和大企业的计算能力,向各类 AI 研发机构开放,欢迎全球的人工智能研究人员参与使用。
智源研究院的核心包括四项任务:以共享数据、智能计算编程框架和算力基础设施为核心,推动算法开源,构建创新生态,打造北京智源开放服务平台;推动原始创新,共建北京智源联合实验室,围绕人工智能领域重大核心基础理论问题,布局研究团队和项目,开展跨学科、大协同的创新攻关,服务国家人工智能发展战略;培养引进并举,集聚高端人才。放眼国际,汇聚人工智能领域基础研究创新资源,引进和培养有全球影响力的人工智能顶尖人才团队;加强产学研合作,举办全球 AI 峰会,把北京打造成为链接世界人工智能产业与学术资源的中心枢纽。
2021年3月,智源研究院推出超大规模智能模型“悟道1.0”,这是国内首个超大规模智能模型系统,也是全球仅次于OpenAI、谷歌的大型 AI 研究项目。
然而,这一切都被ChatGPT所改变了。
2023年起,随着ChatGPT风靡全球,北京也开启 AI 大模型“狂飙模式”,全面支持 AI 大模型产业发展,并迎来项目“井喷期”。
北京市相关部门负责人透露,截至目前,北京 AI 相关企业数量约达到2200家,占全国近40%,现已拥有大模型创新团队122家,数量居全国首位;北京大模型、备案上线大模型数量均占全国近一半。同时,北京还计划今年将建设运营超过1000P(每秒1000万亿次的浮点运算)算力,到2027年将新增智能算力3.6万P,力争成为北方智能算力枢纽。
据钛媒体App不完全统计,截至目前,北京发布的大模型产品已超过115个,在全国排名第一。代表产品包括百度文心、抖音云雀、京东言犀、智谱 AI ChatGLM、中科闻歌雅意、北京大学ChatLaw、第四范式的“式说”等,覆盖内容生成、智能问答、IT支持、数据分析、智能识别等多个场景应用。
北京大模型代表产品一览。钛媒体App通过公开报道整理
融资层面,据IT桔子统计,2023年,总部位于北京的 AI 初创公司融资事件达156笔,占全国 AI 领域融资的29.4%,约等于 3 个杭州、7 个广州、13 个成都;而上海占比19%,屈居第二。
与此同时,这一年北京也陆续出台相关的产业扶持政策和措施。
2023年5月30日,北京一连发出两项 AI 相关政策方案《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》和《北京市促进通用人工智能创新发展的若干措施》,对北京 AI 产业发展做出了部署和指导。
方案中提出,到2025年,北京 AI 技术创新与产业发展将进入新阶段,基本建成具有全球影响力的 AI 创新策源地,而且基础理论研究取得突破,原始创新成果影响力不断提升;关键核心技术基本实现自主可控,其中部分技术与应用研究达到世界先进水平;AI 产业规模持续提升,形成具有国际竞争力和技术主导权的产业集群。
2023年10月,北京市经信局发布《人工智能算力券实施方案(2023-2025年)》,全面支持企业在工业、政务服务、医疗、金融、教育、法务、交通、文旅、科学研究、城市管理等领域建立行业 AI 大模型训练和应用,向相关企业提供算力补贴支持。
如今,无论是清华系、字节系、百度系出身的北京 AI 领域创业公司,都已经进入到新一轮 AGI 浪潮中。
3月14日,北京智谱华章科技有限公司(简称“智谱AI”)宣布日前已完成新一轮融资,北京市人工智能产业投资基金参与投资。这是该基金成立以来投资的第一家 AI 大模型公司。
据悉,北京市人工智能产业投资基金是去年9月北京市政府投资引导基金(引导基金)拟联合社会资本组建设立的基金项目,基金总规模达100亿元,其中引导基金出资不超过30亿元。该基金致力于加快推动北京市 AI 产业高质量发展,支持底层关键核心技术突破,促进适合首都定位的重大创新成果在京落地产业化,营造 AI 产业创新生态。
钛媒体App独家了解到,除了智谱 AI 之外,北京市政府投资引导基金日前还参与投资了 AI 公司北京深势科技有限公司新一轮融资。该基金核心诉求是投资北京本土 AI 企业,要求公司只能在北京本地进行发展,不然就会触发回购操作。
今年2月29日的一场活动上,北京市经信部门负责人曾表示,据不完全统计,2023年北京市 AI 相关产值规模有望突破2500亿元。
根据规划,预计到2025年,北京市 AI 核心产业规模有望达到3000亿元,持续保持10%以上增长,辐射产业规模超过1万亿元。
创新工场创始人兼CEO,零一万物CEO李开复博士在2023中关村论坛上对钛媒体App等表示,北京是在 AI 大模型和 AI 2.0 层面政策帮扶力度最大的城市之一,政策中包括对人才的帮助、算力的帮助都是特别重要的内容。
“从全球范围来看,硅谷和中关村无疑是世界上两大科技创业最成功的地区。”李开复称,相比于2000年,如今北京的创业氛围、文化、投资环境等都有了巨大的进步。
“因为这次的 AI 2.0 大模型创业跟过去不一样的是,过去创业成本是很低的,你只要有5个、10个工程师,就可以创业了。现在,你不但需要几十个工程师,还需要花上亿,甚至几十亿元人民币去买GPU,那么创业的成本就非常的高。所以,我觉得一是需要去想办法降低创业巨大的成本,二是可能投资人需要愿意去帮助 AI 产业发展,最后一点是政府能够给出一些对接或者补助,算力方面是需要政府携起手来支持的。”李开复去年6月对钛媒体App表示。
北京市政务服务管理局一位负责人日前提到,为了支撑平台“京策”建设,政府需要在场景领域进行通用大模型技术落地,从而提升政策规范管理和精准服务能力。
中关村智友天使人工智能与机器人研究院院长王田苗表示,孵化器作为北京中关村科技产业的生态土壤,将成为专精特新企业培养的生力军,成为未来独角兽企业和大企业的策源地。
整体来看,北京的大模型产业呈现出企业数量增长、科研投入增长的趋势,并展现出产业规模要“遥遥领先”的决心,但却并没有孕育出类似OpenAI这样的大公司。
因此,这需要北京持续提升对 AI 大模型产业的认知度并健全其发展体系。
大模型算力为王,上海力争2025年 AI 产业规模达4000亿
相对于北京在 AI 领域的全面布局,上海则把这一轮 AI 大模型热潮的目光转向算力和应用。
据钛媒体App不完全统计,截至目前,上海发布的大模型产品已超过33个。发布时间集中在2023年,代表产品有复旦大学的MOSS、商汤科技的“日日新SenseNova”、蜜度大模型、上海人工智能研究院的“ChatDNA”等,均为 AI 大模型应用。
上海大模型代表产品一览。钛媒体App通过公开报道整理。
目前,上海浦东张江人工智能岛已集聚IBM、百度、同济大学等19家创新主体,正推动由岛扩区;徐汇西岸国际人工智能中心正式启用,微软亚洲研究院、华为、依图等AI领军企业入驻;闵行马桥人工智能创新试验区正推进“达闼智能机器人产业基地”等重大项目;商汤“新一代人工智能计算与赋能平台”项目于临港奠基,已完成主体建筑封顶;天数智芯7nm通用GPU芯片发布,有望突破智能芯片领域“卡脖子”问题。
此外,国家创新应用先导区的应用场景公共服务平台项目获工信部立项支持;同济、交大、复旦正在开展“人工智能前沿基础理论与关键技术”市级科技重大专项攻关。
以商汤为例。
去年4月10日,AI 上市公司商汤科技正式发布全新“日日新SenseNova”大模型体系,以及自研的中文语言大模型应用平台“商量”(SenseChat)。其参数量达千亿,可实现文本生成、图像生成、多模态内容生成等能力与场景应用。
最新财报显示,2023年上半年,商汤营收达14.33亿元,同比增长1.3%;亏损净额31.43亿元,比去年同期收窄2%,经调整后亏损净额同比收窄6.7%,至23.9亿元;毛利率45.3%,去年同期为66%,同比下降30.6个百分点。
商汤集团董事长、CEO徐立曾表示,2023年上半年,商汤发布了国内第一个综合能力超越GPT-3.5-turbo的大语言模型,让商汤生成式 AI 相关收入实现了670.4%的增长。
如今,上海 AI 大模型产业已经出现了一个重要范例,商汤的收入增长促进了上海 AI 产业快速发展。
与此同时,上海还在谋划 AI 大模型算力布局。
上海市通信管理局数据显示,截至2023年9月底,上海在用数据中心标准机架达42.3万个,上架率约65%,在用和在建算力总规模超过14EFLOPS(EFLOPS是指每秒百亿亿次浮点计算),算力综合指数全国排名第三,高于北京。
综合算力评价结果Top10省份。数据来源:中国信通院
据了解,目前上海还在密集出台算力补贴政策,补贴政策主要分为两大类:一是针对算力提供方,对纳入统筹管理的算力平台进行建设补贴;二是针对算力使用方,对使用算力的单位给予最高10%算力补贴,类似于“算力补贴券”。
上海徐汇区曾透露,入驻西岸模速空间的大模型企业可享受“梯次递进”的优惠房租,每年符合条件的企业还能享受不超过算力成本的30%、最高1000万元的资金支持。开张至今,“模速空间”已有近60家企业入驻,分属产业上中下游,其中86%为垂类应用。
上海电信正谋划在2024年推出万卡集群。按照《上海市推进算力资源统一调度指导意见》规划,到2025年,上海市数据中心算力将超过18000PFLOPS。
算力、算法、数据都已准备就绪。政策层面,上海正加大 AI 产业支持力度。
2023年7月8日,上海宣布成立 AI 开源生态产业集群,打造 AI“模都”。
上海市经济和信息化委员会总工程师葛东波表示,上海面对新形势和新要求,聚焦人工智能大模型、软硬件协同等方面,出台了支持大模型创新发展的三年行动计划。
他所指的是2023年发布的《上海市推动人工智能大模型创新发展若干措施(2023-2025年)》,其内容涵盖实施大模型创新扶持计划、实施大模型示范应用推进计划等11条措施。其中指出,上海鼓励浦东新区、徐汇区等建立大模型生态集聚区,聚焦大模型研发和产业化加大支持力度。在人才方面,上海重点支持大模型相关紧缺技能人才落户;组织企业、高校、科研机构联合培养跨学科大模型人才。
措施中强调,将对2024年底前在沪完成智能算力部署并纳入统筹、接受调度的算力建设主体给予适当额度的部署奖励;同时,对于进行大模型研发的主体将按照算力集群规模和成果水平给予最高10%的租用补贴。
截至2023年7月,上海 AI 规上企业数已从2018年的183家增至2022年的348家,产值实现倍增,从1340亿元跃向3821亿元。
这意味着,上海 AI 相关产值早已突破3800亿元。
据《上海市人工智能产业发展“十四五”规划》显示,上海力争到2025年,基本建成具有国际影响力的 AI 产业创新发展高地,形成10个以上百亿元级细分领域产业集群,AI 规上产业规模年均增长12%以上。到2025年,上海 AI 产业规模达到4000亿元,届时 AI 人才规模达到30万人。
预计到2025年之前,上海市将重点支持在智能制造、生物医药、集成电路、智能化教育教学、科技金融、设计创意、自动驾驶、机器人、数字政府等领域构建示范应用场景。
“目前上海在发展大模型方面已经具备一定的优势。”天使投资人、资深 AI 专家郭涛分析称,首先,上海拥有丰富的科技创新资源和优秀的科研机构,为大模型的研发提供了坚实的基础。其次,上海积极推动产业升级和转型,为 AI 产业的发展提供了良好的政策环境和市场机遇。
上海人工智能实验室主任助理石伯明也表示,一些技术领先的大模型出来后,中国的优势是场景多、数据多,在这些方面,中国可以构筑自己的大模型生态优势。
陈吉宁在2月22日表示,AI 是上海着力发展的三大先导产业之一。作为新一轮科技革命和产业变革的重要驱动力量,上海加快发展新一代人工智能是一项需要长期坚持的战略性任务。要紧密结合上海实际,以时不我待的紧迫感和舍我其谁的使命感,围绕产业生态和全产业链持续用力、久久为功。要充分发挥企业主体作用,充分发挥企业主体作用,全力支持企业优化攻坚重点和发展方向,持续加强通用大模型和垂直领域大模型研发,在底层技术上加快突破,在产业应用上加大创新,探索可落地的商业模式,打磨产品、做出精品,释放溢出带动效应,更好服务高质量发展和现代化建设。
京沪大模型竞速,谁将赢得领先?
随着GPT-4已发布一周年,国内 AI 大模型领域开始加速转向商业化应用落地,因此,北京、上海大模型“争夺战”已悄然升级。
3月初,北京召开多场关于 AI 技术的闭门活动,并利用北京市人工智能产业投资基金布局智谱 AI 和深势科技,国家也全面支持北京发展 AI 产业,称 AI 是发展新质生产力的重要引擎,背景要抓住算力、数据、算法等关键攻坚突破,多路径布局前沿技术,大力开展“人工智能+”行动,统筹推进通用大模型和垂直大模型应用,实现弯道超车、换道超车,充分发挥北京优势,起到示范带动作用。
3月23日,上海即将在距离模速空间1公里的西岸艺术中心召开2024全球开发者先锋大会,会议期间上海市政府或将公布对 AI 领域新的支持政策,以及投资、“算力券”等一系列措施。上海市经信委副主任张英曾表示,上海实施了数百个投资重大 AI 产业项目签约落地,投资总额近千亿元。
“现在是 AI 发展的窗口期,不抓紧,再过三五年就抓不住机会了。”最近一场涵盖近百家 AI 模型企业的线上闭门会上,一位政府部门负责人表示,中国希望 AI 能像电动车一样,成为全球领先的科技产业。
据中国信通院测算,2022年,中国 AI 核心产业规模达5080亿元,同比增长18%,企业数量超过4000家,中国人工智能产业已进入全球第一梯队。在此背景下,从中央到地方,政策利好频频释放,促进 AI 产业发展。
那么,上海、北京大模型竞争态势不断升级下,未来谁将拿下“中国大模型第一城”?
近日,嘉帕科技创始人庞国强对钛媒体App表示,“北京在 AI 人才资源和底层技术方面具有一定的先发优势,而上海也在迎头赶上。上海 AI 产业更注重垂类大模型应用的落地。”
据庞国强透露,上海模速空间目前已入驻的企业有一半是来自北京。而目前嘉帕科技已签约入驻模速空间,正开发GenPark模型的中国品牌出海营销渠道。“模速空间在做第一批企业引进工作时,专门去北京找了一些比较好的 AI 企业,让他们到模速空间设立分部。”
“而模速空间为入驻企业提供算力调度、大模型相关备案等服务,确保企业在遇到问题时能及时得到Face to face(面对面)的咨询和帮助。上海不仅会为相关企业提供数据算力、场地资源等硬件支持,还在政策上给予倾斜,人才招聘上给予支持,”庞国强对钛媒体App表示。
北京市社会科学院副研究员、南昌理工数字经济研究院院长王鹏对钛媒体App表示,目前国内大模型行业主要面临三大痛点:一是大模型精度(即模型预测的准确性)有待优化,无论是文生视频还是文生图模型,和国外都存在一定的差距;二是算力比较紧缺,国内高端芯片存在“卡脖子”问题,国产自研芯片相比国外还有一定差距;三是大模型的商业落地难题。
尽管中国开始重视 AI 与大模型产业发展,但如何解决中国 AI 算力“卡脖子”,重复性建设 AI 基础设施,产业规模小而散等问题,将成为上海、北京两大城市需要考虑的重点议题。
北京师范大学新闻传播学院教授喻国明3月17日表示,当前中国面临美国的GPU算力限制,国内只有150多万片(英伟达)GPU芯片,而在这种环境下,300多家大模型企业却“一窝蜂”式发展,效率低、浪费高,严重制约中国 AI 产业发展。
“大模型是一个计算资源消耗非常重的产业,在前期投入之前,我们要做好资源的准备。”徐立曾表示,要想在未来占据大模型产业优势地位、做一些创新突破时,可以不完全照着西方的道路走,更多结合一些非常垂直的场景和数据,来打磨端到端的大模型的突破,这样才能在未来的国际环境中,即使是算力受限的情况下,也能取得更好的效果。
可以预见的是,在大模型的资金强度、人才密度、政策措施等多维度领域,京沪两城未来将展开全面竞速。
(本文首发钛媒体App,作者|林志佳、任颖文,编辑|马金男)