一水 发自 凹非寺
量子位 | 公众号 QbitAI
AI领域本周都卷起来对话式交互。
前有OpenAI推出实时视频通话如真人的GPT-4o,后有谷歌与之类似的Astra。
但不论是GPT-4o还是Astra,都或多或少有一些使用门槛。
也许是看到了这种gap,一款类似能力的国产AI应用,也悄然更新了……
能力和体验上,可能跟GPT-4o和Astra演示的还有差距。
但作为门槛更友好的平替,也足够了。
这款产品是国产大模型公司MiniMax的海螺AI,主打AI助手+实时语音聊天。
那么它有哪些具体应用场景呢?
海螺AI能干什么?
海螺AI是MiniMax推出的一款多模态AI生产力工具,能听、能写、能说、能识图。
概括而言,官方此次对这款产品作了如下更新:
(以下为原速实测)
语音播报今日热点
上下班开车途中,可以让海螺AI播报今日热点,并随意聊天。
读论文、读财报
接着来看一项日常学习工作都需要用到的能力——快速总结长文本。
直接拿最常见的学术论文和公司财报来试试。
△海螺AI总结论文
整体较为流畅,看来十几页的论文对它来说不算挑战。
难度加码!这一次我们喂给它有大量数据报表的公司财报。
△随机选取华夏银行今年1季度报告
免费查数据
除了速读长文本,作为一款AI助手,检索并快速整合信息也是关键。
先就日常生活来说,我们来试试让海螺AI做旅行攻略。
比如“从重庆出发前往深圳再去长沙的五天旅游规划方案”。
短短几个字估计能瞬间让倾向于细致规划的“J人”炸毛。
此外,海螺AI接入了天眼查、萝卜投研和学科网等专业数据库,能够让用户免费搜索专业数据。
随便想了一个例子,“帮我查下量子位的工商数据”。
辅导作业
海螺AI还能帮助父母辅导孩子功课。
我们直接上传一张小学数学应用题常见的“相遇问题”。
可以看到,海螺AI按照步骤进行了解答。(移动端支持直接拍照上传)
写作
由于写规划、写报告、写文案等对几乎所有AI来说都是常规操作,在此我们不再展示。
但是,当我们驱散班味儿,想用AI写作来搞副业时,海螺AI能否派上用场?
让我们直接提示它“帮我构思一个职场女性黑化逆袭重生的爽文霸总剧本”。
英语口语陪练
海螺AI支持口语练习,用户可以用它来练雅思和托福、CET4/6、PET等。
小结
单从本周热门的“对话式交互”来说,它和GPT-4o及Astra还存在一定差距。
这主要体现在:
总之,对于这样一款能立即上手甚至免费的国产AI来说,瑕不掩瑜,值得一试。
技术原理:自研多模态MOE大模型
对于海螺AI背后的技术,更早之前,官方也有过披露,分为以下两个方面:
万亿参数MoE大语言模型
今年4月,MiniMax推出了万亿MoE模型abab-6.5,并在其基础上开发了生产力工具“海螺AI”。
根据MiniMax发布的技术报告,在各类核心能力测试中,abab-6.5接近 GPT-4、Claude 3 Opus 、Gemini 1.5 Pro等世界领先的大语言模型。
MiniMax语音大模型
另外,海螺AI还接入了MiniMax语音大模型——speech-01。
这一模型的主要特色是:
首先,官方称海螺AI可以很好的理解人类的语言、语气、情感。
让我们整蛊一下小海螺。
要求它在同一句话里表达出喜怒哀乐等情绪,看看能否听出明显差别。
其次,官方称海螺AI不仅限于模仿单一的声音,它还能通过学习数千个声音的音色特征,生成更多声音变体。
目前它精通中文、英文、德文、法文等8国语言,还预置了30多种音色。
最后,官方称海螺AI只需30秒的音频样本,就能快速复刻出与原音色高度相似的语音。
打造者:国内独角兽MiniMax
MiniMax是一家成立于2021年12月的人工智能初创公司,由前商汤科技副总裁、研究院副院长闫俊杰创立,成员主要来自商汤科技等知名AI公司。
△闫俊杰在2021世界人工智能大会算法典范总决赛上
2022年7月,MiniMax完成了Pre-A轮融资,投资方包括明势资本和米哈游等。
2023年6月,MiniMax完成了一轮超过2.5亿美元的融资,投资者包括与腾讯有关联的实体。
今年3月,MiniMax的最新一轮融资由阿里巴巴领投,金额至少为6亿美元,这使得公司估值超过25亿美元。
目前,MiniMax主打三款产品,分别为MiniMax API开放平台、沉浸式AI内容社区星野、以及生产力工具海螺AI。
使用无门槛,欢迎回来给我们分享使用反馈呀。
体验地址:
海螺AI:https://hailuoai.com/ (支持移动端应用商店下载)