本周AI界发生了什么 | ChatGPT免注册；苹果进军家用机器人；Anthropic发现长文本漏洞

时事新闻2024-04-08 17:57:20无忧百科

文｜陈斯达

编辑｜邓咏仪

一周速览

在各家大模型的轮番出击后，本周ChatGPT迎来多次升级。OpenAI宣布，用户现在无需注册，即可使用ChatGPT，还可在 ChatGPT 中跨网页、移动端使用 DALL-E 生成图像，并对生成结果进行局部调整。另外，还有6个全新微调API功能推出，帮助构建更精细化的ChatGPT应用。

苹果战略动作近来十分频繁。其研究团队发布设备端模型ReALM，称性能优于GPT-4，未来可显著提升Siri智能程度。多项变动因放弃造车项目而起：苹果多个研究团队，正在研究转向推进各种家用机器人设备，而在加州，公司解雇了600多名员工。

明星AI创企仍是资本的宠儿。成立不到半年的Cognition Labs，寻求以至多20亿美元的估值获得融资。马斯克AI初创公司xAI或融资30亿美元，估值有望达180亿美元。另外，Sam Altman已携手前苹果设计总监孵化AI硬件公司，正计划融资10亿美元。

本周还有多款大模型开源发布。加州大学伯克利分校开源世界模型LWM，多模态性能优秀。普林斯顿的团队也开源名为SWE-agent的智能体-计算机接口（ACI），性能堪比“AI程序员”Devin。然而，AI初创公司Anthropic警告所有主流模型，一种新式“多轮越狱”方法可诱使AI做出有危害的回答。

Key Points大模型第一线ChatGPT无需注册即可使用

当地时间4月1日，OpenAI宣布，将让用户无需注册即可直接使用ChatGPT。这一福利将逐步开放给大众，“任何对AI功能感兴趣的人都能用上”。目前，ChatGPT流量增长基本陷入停滞。SimilarWeb网站数据显示，2023年初爆炸式增长后，ChatGPT自2023年6月全球流量下降了9.7%，流量逐月起伏。

图源：官网

ChatGPT整合DALL-E 3，可直接生成图像

4月4日消息，OpenAI 发文宣布，用户现在可以在 ChatGPT 中跨 Web、iOS 和 Android 使用 DALL-E 生成图像。除此之外，用户还可以通过添加、删除或调整图像中的元素来完善自己的 DALL-E 作品。

图源：X

苹果发布ReALM模型，手机平板可跑，性能优于GPT-4

4月2日消息，在最近的一篇论文中，苹果的研究团队宣称，他们提出了一个可以在设备端运行的模型ReALM，这个模型在某些方面可以超过GPT-4。ReALM的参数量分别为80M、250M、1B和3B，体积都非常小，适合在手机、平板电脑等设备端运行。

图源：论文

论文地址：

https://arxiv.org/pdf/2403.20329.pdf

国内千亿参数 MoE 架构大模型开源

4月2日，全球移动互联网公司APUS与大模型创企新旦智能宣布，联手开源国内首个千亿参数的MoE（混合专家模型）APUS-xDAN大模型4.0，该模型可以在低端算力芯片4090上运行，综合性能达到了GPT-4 的90%。这也是国内首个可在消费级显卡上运行的千亿MoE中英文大模型。

大事件苹果正探索家用机器人领域

当地时间4月3日，知名苹果爆料人Mark Gurman撰文表示，放弃造车后，苹果公司的多个团队正在研究推进各种家用机器人设备，以及相关人工智能功能。该领域或成为苹果公司不断变化的“下一大事件”之一。据4月5日消息，苹果公司在加州已解雇600多名员工，也与放弃造车有关。

OpenAI发布全新微调API

4月5日凌晨，OpenAI在官网宣布新增6个全新微调API功能，以扩展自定义模型，帮助企业、开发人员更好地构建特定领域、精细化的ChatGPT应用。功能包括：基于Epoch的检查点创建、Playground新功能、第三方集成、全面验证指标、超参数配置和更详细的微调仪表板改进。

OpenAI将在东京设立亚洲首个办事处

据彭博社，OpenAI为拓展其国际业务，4月将在日本东京开设其首个亚洲办事处。继去年在伦敦和都柏林开设办事处后，这将是其第三个国际办事处。2023年4月，OpenAI 首席执行官Sam Altman曾访问日本，与日本首相会面后，Altman称“希望让大模型更适合日语和日本文化。”

英伟达将在印尼投资2亿美元，建AI中心

4月5日消息，英伟达宣布将与印尼第二大移动电信公司 Indosat Ooredoo Hutchison 合作，在中爪哇省梭罗市建设一座人工智能开发中心，总投资额2亿美元。在上个月的 XNUMX 年世界行动大会上，双方已宣布建立合作伙伴关系，Indosat Ooredoo Hutchison 计划将英伟达 Blackwell 芯片集成到其基础设施中。

亚马逊为创企提供AI大模型免费积分

据路透社，4月2日消息，亚马逊云科技（AWS）在采访中称，公司已扩大针对初创公司的免费积分计划，以降低使用主要AI模型的成本，提高其AI平台Bedrock的市场份额。为了吸引创企客户，亚马逊现在允许其云积分覆盖其他提供商的模型的使用，包括Anthropic、Meta、Mistral AI和Cohere。

200多位艺人联名抵制AI

据CNBC，4月2日，200多名国际乐坛知名音乐人联署公开信，呼吁AI开发者、科技公司、平台和数字音乐服务商停止使用人工智能（AI）来侵犯并贬低人类艺术家的权利，具体诉求包括，停止使用AI侵犯及贬低人类艺术家的权利，要求他们承诺不开发与之相关的AI音乐生成技术等。

近日，AI生成音乐成为热点，Suno V3、Stable Audio 2.0等音频生成模型接连发布。

图源：X

融资动态马斯克初创公司或再融资30亿美元

据华尔街日报，4月5日消息，知情人士称，与马斯克关系密切的投资者，正洽谈帮助其AI初创公司xAI融资30亿美元，本轮融资将使该公司估值达到180亿美元。据悉，考虑投资此轮融资的支持者包括风险投资公司Gigafund和美国风投家Steve Jurvetson。xAI的融资条款尚未最终确定，计划可能会发生变化。

“AI程序员Devin”背后公司估值达20亿美元

4月1日消息，近期有报道称，成立于去年11月的AI初创企业Cognition Labs正在进行融资谈判，估值高达20亿美元。Cognition Labs宣称其开发的人工智能Devin是“首个完全自主的软件工程师AI”。Devin刚在本月发布，而Cognition Labs目前还未产生实质性收入。

Sam Altman与前苹果设计总监的AI硬件项目，寻求10亿美金融资

据The Information，4月6日消息，OpenAI首席执行官Sam Altman携手前苹果设计总监Jony Ive，联合设计面向个人的AI硬件，目前正寻求外部投资。消息称Altman和Ive已经牵头组建一家初创公司，正向主要风险投资人寻求资金，目标筹集10亿美元。

Sam Altman不再拥有或控制与OpenAI相关的风投基金

4月2日消息，据美国证券交易委员会 (SEC) 的文件，OpenAI已改变旗下投资人工智能初创公司风险投资基金的治理结构，其首席执行官Sam Altman不再拥有或控制该基金。据了解，该基金是由Sam Altman从外部有限合伙人处募集，投资决策也由他主导。OpenAI方面表示，尽管拥有所有权，Sam Altman并没有从中获得任何财务利益。

雅虎收购AI新闻应用Artifact

据官网，当地时间4月2日，雅虎宣布已完成对AI新闻平台Artifact的收购。Artifact于2023年1月创立，是Instagram联合创始人Kevin Systrom和Mike Krieger创建的一款AI新闻聚合和发现平台，因经营不善，今年1月关停服务。

在收购完成后，Artifact将不再独立运营，其AI技术和功能将在未来几个月内整合到雅虎旗下产品中，包括雅虎新闻。

图源：雅虎

港股“AIGC第一股”将上市

4月2日，AI公司“出门问问”于晚间通过港交所聆讯，有望冲击港股AIGC第一股。出门问问成立于2012年，作为较早切入AI赛道的公司，出门问问获得包括红杉中国、谷歌、歌尔声学、真格基金等获得顶级机构青睐。其最后一轮融资在2019年9月完成，当时估值超7亿美元。

出门问问产品矩阵，图源：出门问问官网

新玩意Stability AI 发布免费音频生成工具

4月3日消息，著名大模型开源平台Stability AI发布音频生成模型Stable Audio 2.0。这一版本支持用户通过文本或音频生成多种类型的高质量音乐，时长可达3分钟。Stable Audio向公众免费提供，未来将很快提供API接口。

Stable Audio 2.0创作界面，图源：Stable Audio 2.0

体验地址：

https://stableaudio.com/

前沿研究Anthropic发现大模型长文本漏洞

4月3日消息，AI公司Anthropic的研究人员最近发现了一种新方法，可以让大模型回答本不应回答的问题：如果首先用几十个危害性较小的问题对大模型进行预热，就能诱使其介绍炸弹的制作方法。这种方法被称为“多轮越狱”，对Claude 2、GPT-3.5、GPT-4、Llama 2和Mistral 7B等多个主流模型都有效。

图源：论文

论文地址：

https://cdn.sanity.io/files/4zrzovbb/website/af5633c94ed2beb282f6a53c595eb437e8e7b630.pdf

开源世界模型LWM发布

4月4日消息，来自加州大学伯克利分校的研究人员，最近发布并开源了世界模型LWM（LargeWorldModel）系列模型。这一模型采用了大量视频和书籍数据集，通过RingAttention技术实现了长序列的可扩展训练，使得模型的上下文长度达到了1M token，约等于75万个单词。

LWM基于文本生成图像与视频，图源：论文

论文地址：

https://arxiv.org/pdf/2402.08268.pdf

代码地址：

https://github.com/LargeWorldModel/LWM

普林斯顿大学开源智能体SWE-agent

4月2日消息，普林斯顿的研究团队推出了一款名为SWE-agent的智能体-计算机接口（ACI），性能堪比“世界首位AI程序员”Devin。这一接口的创新之处在于其能够将大型语言模型，如GPT-4，转化为软件工程AI智能体，并在实际的GitHub仓库中自主修复bug。此举有望解决GPT-4在编程方面的难题。