新闻实验室会员通讯(930)大语言模型如何“姓党”
通过塑造互联网上的免费内容来影响AI的输出。
虽然大语言模型的运作原理在很大程度上还是一个黑箱,但很多力量已经在试图影响它们的输出结果。例如,有所谓GEO(生成式引擎优化,Generative Engine Optimization)的操作,旨在通过特定的话术和结构调整内容,以诱导AI在回答时优先推荐特定品牌或观点。
想要影响AI回答内容的,当然不只是商业机构。刚刚发表在学术期刊《自然(Nature)》上的一项研究揭示:各国政府对媒体的管控,已经通过训练数据渗透进了商业大语言模型的输出之中。这项由俄勒冈大学的Hannah Waight、普渡大学的Eddie Yang、加州大学圣地亚哥分校的Yin Yuan和Margaret E. Roberts、纽约大学的Solomon Messing和Joshua A. Tucker、普林斯顿大学的Brandon M. Stewart等多位学者联合完成的论文,通过六项相互关联的子研究,系统性地追踪了国家媒体控制影响AI模型的完整路径。
本期新闻实验室会员通讯,我们来一起了解这篇论文的发现。
官方内容大量存在于训练数据
本内容需加入付费会员后查看
Unlock full access to 新闻实验室Newsletter and see the entire library of members-only content.
订阅已经有账户? 登陆