财新传媒
财新传媒
1111111
财新通行证
T中

胡泳:万模大战,数据为王?大语言模型当破除规模迷思

文|胡泳 刘纯懿
2024年05月08日 14:46
“最好的数据就是更多的数据”的数据迷信已经破灭,更大的模型并不意味着更好的结果。应更好地鼓励人们生产更多高质量的数据,而不是听任平台借助算法不断增加用户在其上花费的时间,仅仅是为了大量生产价值低劣的数据
news 原图 谷歌的人工智能应用BardAI(或ChatBot)、OpenAI的应用ChatGPT和其他人工智能应用的图标。图:视觉中国

引言

  自2022年11月OpenAI首次向公众开放聊天机器人ChatGPT以来,不管是科技精英、媒体从业者还是普罗大众都惊叹于这一被称为大语言模型(large language model,LLM)的生成式人工智能所拥有的类人智慧、应用前景和社会潜力。不仅Alphabet、Meta、亚马逊和英伟达等全球科技巨头都训练了自己的大语言模型,并给予它们以诸如PaLM、Titan、Megatron、Chinchilla等令人眼花缭乱的命名,那些尚未加入这场“万模大战”的新型公司和传统企业也正在围绕生成式革命而重新部署、设计、规划产品和未来商业模式。然而,在大语言模型和生成式人工智能一路高歌猛进的过程中,也始终充斥着担忧和批判的声音,其中一种强烈的声音指向一个似乎已成共识的问题,那就是大语言模型之“大”。

责任编辑:张帆 | 版面编辑:王永

观点频道所发布文章及图片之版权属作者本人及/或相关权利人所有,未经作者及/或相关权利人单独授权,任何网站、平面媒体不得予以转载。财新网对相关媒体的网站信息内容转载授权并不包括上述文章及图片。文章均为作者个人观点,不代表财新网的立场和观点。

财新网所刊载内容之知识产权为财新传媒及/或相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

如有意愿转载,请发邮件至hello@caixin.com,获得书面确认及授权后,方可转载。

推荐阅读
财新移动
说说你的看法...
分享
取消
发送
注册
 分享成功

订阅财新网主编精选版电邮>>