文|陈斯达
编辑|邓咏仪
大事件谷歌、OpenAI、Mistral的“疯狂星期二”
太平洋时间4月9日,谷歌、OpenAl、Mistral在24小时内,接连发布大模型重磅更新。
谷歌正式发布了Gemini 1.5 Pro的多项更新,包括企业AI平台预览版本,首次上新音视频处理能力——最长可处理11小时的音频,或者1小时的视频。
OpenAl则又一次“狙击”谷歌,紧接着发布非预览版的GPT-4 Turbo,将之前独立的 GPT-4 Vision直接集成到模型中,只需一次API调用,该模型就可以分析图像并应用推理。
“欧洲版OpenAI”Mistral AI也正式开源了大模型Mixtral8x22B,参数规模高达1760亿,仅次于马斯克AI公司的Grok-1大模型。
苹果或在9月发布新电脑,搭载AI功能
当地时间4月11日,据彭博社,为了提振低迷的电脑业务,苹果正准备借助AI功能,彻底改造整个Mac产品线。新版Mac将配置具备AI功能的M4芯片,预计首批最快将于今年9月推出。
苹果股价当天出现近来罕见飙升,大涨超4%,约 1120 亿美元。
英特尔发布新AI芯片,性能超越英伟达H100
当地时间4月9日,英特尔Vision大会上发布新一代 Gaudi 3 AI 芯片。新款 Gaudi 3 与英伟达 H100 相比训练性能提高了 170%,推理能力提高了 50%,效率提高了 40%,且成本更低,但英特尔并未与英伟达最新的 Blackwell 系列产品进行对比。
谷歌发布Transformer新架构,解决大模型“内存”问题
4月12日消息,谷歌发布下一代Transformer模型Infini-Transformer。Infini-Transformer引入了一种有效方法,可将基于 Transformer 的大语言模型拓展到无限长输入,而不增加内存和运算需求。就在4月5日,谷歌还发布 Mixture-of-Depths,改变了以往 Transformer 计算模式。
图源:论文
论文链接:
https://arxiv.org/pdf/2404.07143.pdf
AI界前线马斯克旗下xAI发布其首款多模态大模型
4月13日消息,马斯克AI初创公司xAI推出了其首款多模态大模型Grok-1.5V。除文本功能外,Grok现在可以处理各种各样的视觉信息,包括文档、图表、图表、屏幕截图、照片,并能进行多学科推理。xAI 表示,将于近期邀请早期测试者和现有的 Grok 用户测试。
图源:官网
AI大牛吴恩达加入亚马逊董事会
4月12日消息,据亚马逊官方,DeepLearning.AI 创始人吴恩达已加入亚马逊董事会,该任命从 4 月 9 日起生效。吴恩达是DeepLearning.AI 创始人、Landing.AI 创始人、Coursera 联合创始人、斯坦福大学计算机科学系和电气工程系客座教授,曾任谷歌大脑深度学习项目创始人兼负责人、百度首席科学家、斯坦福大学人工智能实验室主任。
OpenAI解雇两名核心团队成员
4月12日,据The Information,近期两名OpenAI的研究员因涉嫌泄露机密信息而遭到解雇。其中一位是OpenAI 超级对齐团队的核心成员 Leopold Aschenbrenner,在2023年 OpenAI 的宫斗大戏中,曾是时任首席科学家 Ilya Sutskever的坚定盟友。另一位是专注于推理研究的专家Pavel Izmailov,也曾在安全团队工作。
Meta推出5nm制程AI训练芯片
当地时间4月10日,Meta宣布推出旗下的第二代自研AI训练和推理芯片MTIA v2。和2023年五月官宣的Meta第一代AI推理加速器MTIA v1相比,最新版本芯片在性能上有显著提升,专为Meta旗下社交软件的排名和推荐系统而设计。分析指出,Meta的目标是降低对英伟达等芯片厂商的依赖。
融资动态Sam Altman又去中东了,给OpenAI找钱找合作
据彭博社,4月11日消息,OpenAI首席执行官Sam Altman正努力在全球范围内构建一个由各国政府与行业领袖组成的联盟,旨在保证AI发展所需的芯片、能源和数据中心容量的供应。据消息人士,Altman本周在阿拉伯联合酋长国会见投资者和政府官员,讨论私营部门如何与各国合作,支持昂贵的大规模AI基础设施。
“面壁智能”完成新一轮数亿元融资
4月11日消息,面壁智能完成新一轮数亿元融资,由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,知乎作为战略股东持续跟投支持。本轮融资将用于人才引入,大模型底层算力与数据基础构建,和大模型落地三个方向。光源资本担任独家财务顾问。面壁智能创立于2022年8月,团队曾于2020年12月发布国内首个中文大模型CPM-1。
AI物联网企业“特斯联”融资20亿元
4月9日消息,人工智能物联网(AIoT)企业特斯联宣布完成D轮20亿人民币融资交割。本轮融资由国际著名投资机构 AL Capital 与国内产业基金阳明股权投资基金共同领投,国家发改委旗下投资平台、福田资本、金地集团、重科控股、数字重庆等新老股东一同跟投,募集资金将用于完善具有多模态能力的领域大模型在园区、企业、经济、能源等多场景的应用。
特斯联成立于2015年,关注以智能技术驱动场景的智慧化升级、产业生态繁荣与绿色低碳落地。
新玩意Suno的对手来了:AI音乐生成工具Udio上线
4月11日,一款名为Udio的AI音乐生成工具正式对外发布。用户可以通过简单的文字描述,创作出带有歌词的音乐作品。Udio还具备多语言歌声创作功能,支持包括J-pop、俄罗斯梦幻流行、雷鬼音乐和宝莱坞音乐在内的多语言歌声。
△Udio界面,图源:官网
前沿研究北大与字节合作提出VAR范式
4月13日消息,北京大学和字节跳动的研究者提出合作提出新一代范式视觉自回归建模(VAR),将图像的自回归学习,重新定义为从粗到细的“下一个尺度预测”或“下一个分辨率预测”。人类在感知、创作图像时习惯先概览全局、再深入细节。VAR模仿了这一逻辑顺序,这样的自回归算法带来很好的效果。
成果登上 GitHub 和 Paperwithcode 热度榜单,得到大量同行关注。
△图源:论文
体验网站:
https://var.vision/
论文地址:
https://arxiv.org/abs/2404.02905
开源代码:
https://github.com/FoundationVision/VAR
开源模型:
https://huggingface.co/FoundationVision/var
北大开源aiXcoder-7B代码大模型
4月9日,北京大学软件工程研究所开源了由其 aiXcoder 团队全新自研 7B 代码大模型。模型在代码生成和补全任务中领先同量级甚至超越 15B、34B 参数量级的代码大模型。模型将凭借其在个性化训练、私有化部署、定制化开发方面的优势,满足企业个性化开发需求。