衡宇 发自 凹非寺
量子位 | 公众号 QbitAI
大模型初创公司智谱AI,自曝已完成超25亿人民币融资!
这个数字已经高过许多AI创企的现有估值。
更重要的是,这25亿元融资只是“今年累计”,今年以前,智谱AI已经进行过(至少)3轮融资。
难怪乎9月就已经有市场消息传出,作为国内大模型公司的头马之一,智谱AI的市场估值已经在120亿元左右。
智谱官方消息称,今年的融资将用于基座大模型的进一步研发。
而翻看本次透露的一长串投资方,里面清晰写着美团、蚂蚁、阿里、腾讯、小米、好未来等老牌互联网大厂的名字,还有君联、顺为、红杉、高瓴等多家一线VC。
量子位此前获悉,美团、阿里、蚂蚁等押注智谱,都走的是“带业务进组”的路线,一举将智谱的身家往上拉了不少。
今年以来,推出1个产品+n个模型
与GPT系列不同,智谱的模型一直走的是GLM预训练架构路线。
既然是今年以来的累计融资额,那么不妨一起看看今年以来,智谱在GLM系列和其他大模型上都有什么动作。
如果要先用一句话总结一下,那就是“1个产品+n个模型”。
1个产品,是9月末与百度文心一言、MiniMax、百川智能等多家大模型一同首批上线的AI助手App,智谱清言。
再来看n个模型——
3月,就在GPT-4发布的同一天,智谱官宣了千亿基座的对话模型ChatGLM,并开源单卡版模型ChatGLM-6B。
5月,具有图片理解能力的多模态对话模型VisualGLM-6B推出网页端试玩版。它整体模型参数量为78亿,在ChatGLM-6B的基础上完成,图像部分则通过训练BLIP-Qformer构建视觉和语言模型的桥梁。
6月,ChatGLM迭代到ChatGLM2-6B,上下文长度从2k拓展到32k,允许更多轮次的对话。这个版本在次月对外开放了免费商用。
同月,主打联网搜索的WebGLM发布,参数100亿,论文入选KDD2023。
7月底,智谱将去年发布自有代码模型CodeGeeX迭代到CodeGeeX2版本,同时开源CodeGeeX-6B。
9月初,同为清华系大模型初创公司,被曝已经被智谱全资收购,并紧接着推出超拟人大模型CharacterGLM。
事后量子位向智谱方求证,得到的答案是“智谱增持了聆心智能股份”。
9月底,20亿参数的MathGLM被提出。
到了10月,智谱的最新动态是新发布了多模态大模型CogVLM-17B,可以“不牺牲任何NLP任务性能的情况下,实现视觉语言特征的深度融合”。
浅浅回顾一下,智谱公司成立于2019年,核心团队脱胎于清华KEG实验室。
创始成员有如今的CEO张鹏,以及清华计算机系教授唐杰等人(据悉,唐杰现在在智谱的title是技术顾问)。
前面所提聆心智能的创始人、清华计算机系副教授黄民烈,也一直与技术团队合作紧密。
今年,无论是技术热度还是资本热度,大模型都一骑绝尘。
而国内大模型,常被调侃的一句话就是“被清华系创业公司占去半壁江山”。
此话倒是不假。
目前赛道上的明星,无论是今日曝光25亿融资数目的智谱,前几日曝光累计融资3.5亿的百川,还是深言科技、月之暗面、面壁智能、生数科技等,都出自清华一脉。
同侪甚至是同门竞争,让本来就激烈的赛道看点更足。
不过如月之暗面创始人、清华叉院助理教授杨植麟在媒体沟通会上所说,“(大模型)里面空间非常大,大家侧重点不同,技术路线也不一样”。
确实,很难有一家公司可以把通往AGI之路上的所有事情都做了。
So,无论是智谱、其余清华系大模型公司,还是其他创业大模型的团队,干就完事儿了~