本报特约记者 任 重 本报记者 冷舒眉 刘 扬 王 冬
图片说明:英伟达发布“全球最强AI芯片”引发关注。
全球知名芯片厂商英伟达13日在2023年全球超算大会(SC23)上发布了全球最强AI芯片H200,相比其前一代产品H100,性能提升约60%到90%。H200的发布引发业界高度关注。到底这款AI芯片的性能有多强大,它将对高速发展的生成式AI大模型的发展产生什么样的作用呢?针对这些问题,《环球时报》记者采访了多位专家。
英伟达又来深夜“炸场”
多家国内科技类媒体用“深夜炸场”之类的说法来表达对于H200性能给全球业界带来的震撼程度。
英伟达大规模与高性能计算副总裁伊恩·巴克称,想要通过生成式AI和HPC应用领域创造智能,就必须使用大型、快速的GPU来高速、高效地处理海量数据。借助H200,业界领先的端到端AI超级计算平台的速度将会变得更快,一些世界上最重要的挑战,都可以被解决。据介绍,H200是英伟达H100的升级版,两者同样基于Hopper架构,H200主要升级包括141GB的HBM3e显存,显存带宽从H100的3.35TB/s增加到了4.8TB/s。
国外的知名科技网站和财经类媒体纷纷关注H200的性能指标。据美国CNBC网站13日报道,H200是OpenAI用于训练其最先进的大型语言模型GPT-4的H100芯片的升级版。大科技公司、初创公司和政府机构都在争夺有限的芯片供应。H200的关键改进在于它包含了141GB的下一代“HBM3e”内存,这将有助于芯片进行“推理”,或者在训练后使用大模型来生成文本、图像或预测。英伟达表示,在处理Meta的大语言模型Llama2(700亿参数)时,H200的推理速度比H100提高了将近1倍。
会加速人工智能大模型进化?
美国科技网站“techwireasia”13日称,英伟达正在利用其迄今最强大的芯片H200推动人工智能革命。OpenAI推出ChatGPT已经快一年了,全球对人工智能芯片的需求比以往任何时候都更加旺盛。如今,大多数大型科技公司都把注意力集中在生成式人工智能上。英伟达生产的GPU数量最多、性能最高。在发布了数十款芯片以迎合以指数级速度增长的人工智能市场之后,这家图形芯片巨头推出了迄今为止最强大的GPU——H200。H200推出之际,正值英伟达努力捍卫其在人工智能计算领域的主导地位,英特尔、超威半导体以及亚马逊网络服务等一大批芯片初创企业和云服务提供商正试图在人工智能工作负载驱动的芯片需求激增的情况下夺取更多市场份额。AWS、谷歌、微软等主要参与者,以及超威半导体等传统的人工智能和高性能计算实体,都在积极准备下一代用于训练和推理的处理器。
英伟达称,用H200与英伟达GraceCPU搭配使用,就能组成性能更强的GH200 Grace Hopper超级芯片,专为应用于大型HPC和AI。
有分析认为,这一芯片将被用于新一代超级计算机。在SC23大会上,多家顶级超算中心纷纷宣布,即将使用GH200系统构建自己的超级计算机。德国尤里希超级计算中心将在超算JUPITER中使用GH200超级芯片。这台超级计算机将成为欧洲第一台超大规模超级计算机,是欧洲高性能计算联合项目的一部分。
由筑波大学和东京大学共同成立的日本先进高性能计算联合中心,将在下一代超级计算机中采用英伟达GH200 Grace Hopper超级芯片构建。
不过,美国科技媒体“The Verge”网站认为,最大的问题是,各方是否能够得到这种新芯片,或者它们是否会像H100一样供应受限——英伟达对此没有确切答案。首批H200芯片将于2024年第二季度供货,英伟达表示,它正在与“全球系统制造商和云服务提供商”合作,以提供这些芯片。与此同时,这款芯片可能价格不菲,尽管英伟达目前没有列出新芯片的价格。据美国CNBC网站13日报道,H100估计每个售价在2.5万到4万美元之间,要想在最高水平上运行,可能需要数千个H100芯片。
长期关注人工智能技术发展的新智元创始人杨静14日在接受《环球时报》记者采访时表示,H200人工智能芯片的发布值得高度关注,因为这代表着人工智能技术,特别是生成式人工智能大模型快速发展的新趋势——与大模型训练同步,AI软硬件融合快速迭代。生成式人工智能大模型的快速发展对芯片性能的更高需求加速高性能芯片迭代升级,芯片性能的升级又会进一步加快大模型的“进化”。后续这种相互作用将会进一步加快。
算力,科技大国竞逐的新高地
一位熟悉计算领域的专家对《环球时报》记者表示,对于更高算力的追求,已经成为全球科技大国竞争的新赛道。有更强的算力,对于科研与应用来说都是好事,但一款新的高性能人工智能芯片能够产生多大的影响,还要进一步观察,毕竟该芯片才刚刚发布,对于相关领域工作能带来多少提升,还有待潜在用户的实测。
所谓算力,简而言之就是设备的计算能力(Computing Power)。小至手机、PC,大到超级计算机,没有算力就没有各种软硬件的正常应用。以PC而言,搭载的CPU、显卡、内存配置越高,一般来说算力就越高。
在智能世界中,智能是知识和智力的总和,智能翻译到数字世界就是“数据+算力+算法”。杨静也提到,如果再加上算法的加乘,AI软硬件融合快速迭代的过程就会进一步提速,这一点也是要高度关注的。
据华为发布的《计算2030》预测,2030年人类将进入YB数据时代(Y表示1024),全球数据每年新增1YB。通用算力将增长10倍到3.3ZFLOPS、人工智能算力将增长500倍超过100ZFLOPS。100ZFLOPS的算力是什么概念,1023量级,相当于一百万个中国超级计算机“神威·太湖之光”的算力总和。而这些数据和算力的需求量,将主要来自于未来丰富的计算场景。▲