跳至正文

新闻实验室会员通讯(930)大语言模型如何“姓党”

通过塑造互联网上的免费内容来影响AI的输出。

方可成
方可成
需要 10 分钟阅读
新闻实验室会员通讯(930)大语言模型如何“姓党”
Photo by Fili Santillán / Unsplash

虽然大语言模型的运作原理在很大程度上还是一个黑箱,但很多力量已经在试图影响它们的输出结果。例如,有所谓GEO(生成式引擎优化,Generative Engine Optimization)的操作,旨在通过特定的话术和结构调整内容,以诱导AI在回答时优先推荐特定品牌或观点。

想要影响AI回答内容的,当然不只是商业机构。刚刚发表在学术期刊《自然(Nature)》上的一项研究揭示:各国政府对媒体的管控,已经通过训练数据渗透进了商业大语言模型的输出之中。这项由俄勒冈大学的Hannah Waight、普渡大学的Eddie Yang、加州大学圣地亚哥分校的Yin Yuan和Margaret E. Roberts、纽约大学的Solomon Messing和Joshua A. Tucker、普林斯顿大学的Brandon M. Stewart等多位学者联合完成的论文,通过六项相互关联的子研究,系统性地追踪了国家媒体控制影响AI模型的完整路径。

本期新闻实验室会员通讯,我们来一起了解这篇论文的发现。

官方内容大量存在于训练数据


相关内容

免费订阅后可查看 免费内容

新闻实验室会员通讯(936)世界杯

它是这个碎片化世界里所剩不多的、几十亿人同时关注同一件事的时刻。

新闻实验室会员通讯(936)世界杯
免费订阅后可查看 免费内容

新闻实验室会员通讯(935)殖民与反殖民

我们太容易把地缘政治上的对抗、把大国之间权力的转移,误认成解放与解殖了。

新闻实验室会员通讯(935)殖民与反殖民
免费订阅后可查看 免费内容

新闻实验室会员通讯(934)记者与信源的权力游戏

很多最好的新闻,恰恰是在没有access的情况下做出来的。

新闻实验室会员通讯(934)记者与信源的权力游戏