暴涨超31%后暂停交易!商汤回应:大模型上新引市场关注

时事新闻2024-04-24 22:50:49无忧百科

暴涨超31%后暂停交易!商汤回应:大模型上新引市场关注


4月24日午间,商汤(0020.HK)在港交所暂停交易,停牌前上涨31.15%,报0.8港元,成交12.61亿港元。今日早间,在底部短暂徘徊后,商汤大幅飙升,盘中涨幅一度涨超36%引发关注。

对此,商汤科技向南都湾财社记者回应称,主要原因是昨日“日日新大模型5.0” 发布会受到了市场极大关注;依照上市规则及港交所建议,公司将进一步刊发相关公告,敬请关注。

4月23日,在商汤的技术交流日上,南都湾财社记者获悉,商汤科技董事长兼CEO徐立现场发布了全新升级的“日日新SenseNova 5.0”大模型体系(以下简称“日日新5.0”),并带来行业首个“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求。

基于日日新基础大模型,商汤还推出了系列模型,例如,日日新·商量大模型5.0(SenseChat)、日日新·商量多模态大模型(SenseVision)、日日新·商量拟人大模型(SenseChat-Character)等七种。

商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚在接受南都湾财社记者采访时表示,“各模型之间并不是孤立存在的。这也是商汤推出一系列模型的原因,比如今天我们的多模态模型,它就是以语言模型为基础的。”王晓刚指出,大模型发展不看数量,最重要的是模型的差异化,即要有创新。“今年多模态模型会是一个发力重点。”

大模型矩阵“上新”,文生视频平台迎来技术突破

此次引发关注的日日新5.0,是自去年4月首次发布后,商汤“日日新SenseNova”大模型体系正式推出的第五个大版本迭代。

徐立分别从文科能力、理科能力以及多模态能力三个层面介绍日日新5.0的吸睛之处。其中,多模态能力是一大核心指标。以分析理解高清长图为例,该模型可在更快时间内实现分类描述功能,包括标题、副标题、背景、主体分类等信息。除此之外,它还支持文生图交互式生成,实现复杂的跨文档知识抽取及总结问答展示以及丰富的多模态交互能力。

此外,在文科能力方面,“日日新5.0”的创意写作能力、推理能力以及总结能力均大幅提升,相同的中文知识注入后,可以获得更好的理解总结及问答,为教育、内容产业等垂直应用场景提供有力辅助。

在理科能力方面,“日日新5.0”数理能力、代码能力及推理能力也达到业内领先水平,为金融、数据分析等场景落地提供坚实基础。

以一个趣味推理问题为例,徐立在现场演示中,问了“日日新5.0”和GPT-4同一个问题:“妈妈给圆圆冲了一杯咖啡,圆圆喝了半杯后,将它加满水,然后她又喝了半杯后,再加满水,最后全部喝完。问圆圆喝的咖啡多,还是水多?”结果显示,相比GPT-4,“日日新5.0”给出了正确的答案。

除了云侧大模型,徐立坦言,端侧大模型的应用落地,其实是大模型铺开的一个核心关键。现场,徐立以同友商“打拳”为例,指出在相同时间内,商汤端侧模型能够更快做出判断并“出拳”。同时通过与现有友商云端的扩散扩图对比,展现了该模型可1秒内出预览,数秒内生成1200万像素大图的显著优势,比友商云端快10倍。在端上快速进行等比扩图、自由扩图、旋转扩图等图像编辑功能也在大会现场得到实时验证。

商汤科技在2023年财报中预测,2024年是端侧大模型应用的爆发之年。这一背景下,商汤将端侧大模型应用的普及推广作为今年的战略重点。

结合云侧和端侧的强大算力,商汤还在现场推出了端云协同方案。徐立介绍,端云MOE架构中,部分场景端侧处理占比70%+,推理成本会更低。“我们可以针对不同的行业运用设置云端联动的百分比,从而得到最佳的推理效果。”他补充道。

针对端云结合方案,王晓刚也在接受采访时表示,“将来,手机模型一定是一个端云结合的模型。”他指出,这需要端侧大模型在体验或性能等方面与云侧大模型对齐,并进行端云协同。过去一年内,商汤对云侧模型做了大量的开发与改进,在此基础下开发出的端侧模型便可对齐云侧模型,“这是商汤作为端云结合独有的一个优势。”

此外,技术交流日上商汤推出的“云、端、边”全栈大模型产品矩阵还包括“商汤企业级大模型一体机”,即面向金融、代码、医疗、政务等多个领域推出产品。对此,王晓刚认为,与垂直行业相结合亦是体现模型“差异化”的一个关键指标。“而模型又该朝哪些方向发展优化,这些需要行业进行牵引。”

值得注意的是,商汤此次还透露,在文生视频平台方面也取得了新的技术突破。徐立在现场播放了三段完全由商汤大模型生成的视频,并强调“文生视频”平台对于人物、动作和场景的可控性,但并没有正式发布“文生视频”产品;而针对数字人,商汤还发布过商汤·拟人语言大模型,让虚拟人物感受真实。

“一方面,现阶段大模型发展已进入落地阶段,如何与产业、应用场景结合是关键一环。另一方面,‘尺度定律’路径逐渐清晰,‘涌现’时刻不定出现,前瞻探索最先进的大模型技术也是重中之重,”徐立表示。

聚焦三大业务,将在“绝影”系列加大投入

据了解,在2023年的业务重组中,商汤科技明确了新的三大业务板块,即生成式AI、传统AI和智能汽车。

尽管传统业务此前受到影响,但生成式AI业务有了良好开端。谈及商汤与过去手机厂商的合作,王晓刚认为,“这肯定是有价值的。一方面是我们跟客户的积累,另一方面,由于手机厂对于交付的品质、响应的速度要求非常高。高质量的端侧模型离不开高质量的数据,我们这些大模型也会生成相应的数据,用于加强对小模型的训练。”

此外,作为智能汽车板块的重磅业务,“绝影”的发展也备受关注。“智能汽车是通用人工智能大模型落地的一个非常好的场景”,王晓刚表示,“一方面我们希望给绝影更大的投入,在发展道路上能有更多的自主权。另一方面依托商汤最基础的这些能力,让绝影能在智能汽车终端里充分地展示通用人工智能和大模型的价值。”王晓刚坦言,对于商汤来说,未来发展的重点不是做实体机器人,而是打造机器人的“大脑”。

面向未来,王晓也透露了商汤在生成式AI业务方面的布局与规划。“由于商量、如影、格物等生成式AI产品主要面向To C市场,C端客户端体验非常重要,所以也会不断针对用户的需求进行优化,及时响应。”

王晓刚强调,AI 大模型是一个长期投入、长期竞争的过程。“无论是B端还是C端的业务,这两条腿走路都是非常重要的。在这条路上,商汤还是非常坚定会往前继续走,而且在这基础之上会与很多合作伙伴、生态一起去支持这些成果和基础能力。”

采写:南都湾财社记者 严兆鑫 实习生 柴嘉

本文标签: 商汤  王晓  向南  模态  大模型  日日新  

相关推荐

猜你喜欢

大家正在看