财新传媒


大语言模型在金融中能做什么、不能做什么

2023年09月25日 14:44
在金融领域,大语言模型可以视为自然语言处理技术的升级,将使文本信息更有效地进入金融市场,从而提高金融市场和金融服务的效率
大语言模型具有一定“黑盒特征”,而金融领域在可解释性、可审计性和可追责性等方面的要求,也会限制大语言模型在一些金融场景的应用。图:视觉中国

  自2022年11月以来,以OpenAI公司的ChatGPT为代表的大语言模型在全球备受关注,各行各业都在讨论大语言模型的应用前景。那么,大语言模型在金融中能做什么、不能做什么?

一、从ChatGPT看大语言模型的功能

  斯蒂芬·沃尔弗拉姆(Stephen Wolfram)在《这就是ChatGPT》一书以ChatGPT为例对大语言模型的功能有准确描述。

  ChatGPT “首先从互联网、书籍等人类创造的海量文本样本,然后训练一个神经网络来生成‘与之类似’的文本。特别是,它能够从‘提示’开始,继续生成‘与其训练数据相似的文本’”(第102页)。ChatGPT的文本生成,是“对文本的合理的延续”(第3页),本质上是“根据概率选择下一个词”(第10页)。

  推荐进入财新数据库,可随时查阅宏观经济、股票债券、公司人物,财经数据尽在掌握。

责任编辑:张帆 | 版面编辑:鲍琦

统计学学士、经济学硕士和经济学博士,副研究员。先后就读于北京大学数学科学学院和中国经济研究中心(现国家发展研究院)、中国人民银行研究生部(现清华大学五道口金融学院)以及哈佛大学肯尼迪学院梅森学者。曾供职于中央汇金公司、中国投资公司、南湖金服和比特大陆,现为万向区块链公司首席经济学家。曾获首届(2014年度)孙冶方金融创新奖。