参考消息网10月11日报道 据台湾《自由时报》网站10月11日报道,由台湾“中研院”开发的繁体中文AI(人工智能)语言模型被踢爆使用大陆的资料库后,9日已下架。台湾“中研院”9日称这只是该院资讯所研究员的个人研究,10日再强调,该模型系研究人员自行发布,将厘清是否违规。
根据台湾“中研院”网站最初发布的说明,这一AI语言模型是“中研院”词库小组开发的开源可商用繁体中文大型语言模型。参数量达70亿,允许大众下载,以供学术或商业用途。
然而据台湾联合新闻网10月9日报道,网友实测提问这一语言模型时,却被回复“我是由复旦大学自然语言处理实验室和上海人工智能实验室共同开发的,我的生日是2023年2月7日,我的国籍是中国,我的居住地是上海人工智能实验室服务器集,我可以说中文和英语”。岛内网友直呼台湾“中研院”“抄袭成性”。
在各方提出质疑后,台湾“中研院”研究人员最初表示,由于生成式AI易产生“幻觉”,模型产生内容出乎预期,也是未来要努力改善的地方。后来,台湾“中研院”承认,该模型使用来自大陆的任务资料集,并表示该模型建置仅花30万元新台币(1元新台币约合0.23元人民币——本网注)经费。