多款大模型向公众开放,实测“智商”和“情商”

时事新闻2023-09-06 00:10:41无忧百科

多款大模型向公众开放,实测“智商”和“情商”

9月5日,科大讯飞宣布讯飞星火认知大模型面向全民开放。讯飞星火大模型也成为继百度文心一言和商汤“商量”(SenseChat)之后,又一向公众开放的主流聊天机器人应用。同日,360智脑大模型也宣布向公众开放。

“我们要打造每个人的人工智能助手,让每个人都真正能够享受到人工智能的红利,真正解决社会刚需。”科大讯飞董事长刘庆峰表示。

不过,资本市场对于此次开放的大模型反应相对冷淡,9月5日,科大讯飞(002230.SZ)和三六零(601360.SH)股价分别下跌1.8%和1.2%;商汤科技(00020.HK)股价大跌4.8%,百度(09888.HK)股价下跌1.5%。

随着人工智能技术日益成为企业竞争的焦点,企业正在疯狂投入资源、竞相开发人工智能相关的大模型产品。

百度CEO李彦宏周二表示,中国已经发布了70多个参数超过10亿规模的大型语言模型。百度向公众开放了AI聊天机器人之后,用户已超过600万。


上周,首批根据《生成式人工智能服务管理暂行办法》完成备案的五家大模型宣布向全社会开放服务,包括文心一言、百川智能、抖音云雀大模型、质谱清言、商汤商量SenseChat。

对于竞争激烈的互联网行业而言,率先获得批准并向公众开放的公司具有先发优势,这意味着它们能够比竞争对手更快地调整产品。

李彦宏就表示,通过广泛使用文心一言,百度将“收集大量有价值的现实世界人类反馈”,以进一步改进聊天机器人。

这或许也意味着这些企业距离变现更近一步。在OpenAI的聊天机器人产品ChatGPT发布以来,分析机构预计,未来12个月内有望为OpenAI创造超过10亿美元的收入。

不过,与ChatGPT相比,目前基于国内大模型开发的AI聊天机器人的“智商”和“情商”还需要更多的训练。但相比之下,国内几款已向公众开放的大模型的“情商”似乎要高于“智商”。

第一财经记者随机选择了一道奥数题,分别向百度的文心一言和商汤的SenseChat提问,但都未达到标准答案。

这是一道小学奥数题,问题是:烧水沏茶,洗水壶用1分钟,烧开水用10分钟,洗茶壶用2分钟,洗茶杯用2分钟,取茶叶用1分钟,如何安排能尽快喝上茶?

以下是文心一言的答案。它回答道:“这是一个时间规划的问题,我们需要计算完成所有任务所需的总时间。1 + 10 + min(2,2,1) = 12 分钟。所以,最少需要12分钟来完成所有任务。”

讯飞星火的回答是:“为了尽快喝上茶,我们可以按照以下顺序进行操作:洗水壶(1分钟),烧开水(10分钟),在烧开水的同时,洗茶壶(2分钟),继续在烧开水的同时,洗茶杯(2分钟),继续在烧开水的同时,取茶叶(1分钟)。等待水开(剩余5分钟),沏茶。所以总共需要15分钟。”

根据奥数的标准答案:洗水壶一分钟,在烧开水的10分钟内,我们已经完成了洗茶壶、洗茶杯和取茶叶的操作。所以,只需要等待水开后,就可以尽快喝上茶了。正确答案是11分钟!

如果再问一道关于生活建议的题目:为了钱发生争执时,你会怎么办?文心一言和讯飞星火大模型的回答类似。它们都认为,如果为了钱吵架,首先应该冷静下来,好好地分析一下问题的本质,思考是因为什么而吵架;然后,尝试找到解决问题的方法;也可以考虑制定一个明确的财务计划,帮助双方更好地理解和管理金钱问题。



文心一言特别还提到,“如果问题依然存在,可以考虑寻求专业的婚姻咨询师的帮助,他们可以提供专业的建议和指导。”

未来将会看到更多的人工智能大模型向公众开放。不过,业内人士认为,“百模大战”的格局可能不会持续。“很多人都在涌入大模型开发的赛道,但随着向公众开放审批制度的形成,行业可能很快会触发整合。”一位人工智能分析师告诉第一财经记者,“未来只有那些拥有数据和技术能力的企业,才最有可能推动行业前进。”

相关推荐

猜你喜欢

大家正在看