新闻实验室会员通讯(767)“加速崩塌”的互联网与过刊的价值
在数字时代,倘若没有有意识的保存行动,消失和“崩塌”才是常态。
不知道大家是否还记得5月底流传的一篇文章《中文互联网正在加速崩塌》。文中说,“在移动互联网之前曾经存在过的中文互联网的一切,不管是门户网站、机构官方网站、个人网页,还是校园BBS、公众论坛,还是新浪博客、百度贴吧,还是文件、照片、音乐、视频等,都已消失不见。”“我们曾经以为互联网可以保留一切,但结果是一切都没能保留。”
如果“崩塌”指的是过往资料的消失,那么全世界的互联网都在崩塌中,只不过中文互联网的崩塌速度格外快。互联网上曾经存在的各种内容都在消失中,本期新闻实验室会员通讯,我想重点聊聊一个具体类别的资料的价值:媒体过刊,也就是媒体曾经刊发的内容。
保存媒体过刊,听上去并不是一件太难的事情。每天有几十亿人在社交媒体发布内容,一个BBS在关停之前的帖子数量可能是天文数字,要把它们都保留下来确实想想就觉得困难。相比之下,媒体的数量是非常少的(中国的报纸杂志数量不过几千家,生产新闻内容的数字媒体也因为牌照问题而很少),每天发布的内容也是相当有限的,少到几则内容,多也不过几百、几千条。而且,这些内容是经过集中化的生产流程推出的,格式也颇为统一,不像用户生产的内容那样分散和多元。从理论上说,把媒体发布的内容保存下来不应该那么费力。
但那只是理论——现实中,媒体过刊资料几乎是无处可寻。过去十年中,有许多人问过我:想依赖中国媒体的过刊内容做研究,可以去哪里找资料?很遗憾的是,我也没有答案。除了《人民日报》有非常全的过刊数据(并且几乎各大高校图书馆都有购买)之外,其他媒体的过刊都很难通过简单公开的方式一站式获得,不像英文媒体有Factiva和LexisNexis等集成式过刊服务。
而随着媒体数字化的进程,过刊的保留变得更难了。
电子存档的特殊挑战
在互联网出现之前,媒体保留过刊的方式非常简单直接:每年制作“合订本”,将出版的报刊装订到一起即可。现在在图书馆,还可以找到这种以合订本的方式保留的过刊。这种“原始”的保存方法,现在看来其实是最可靠的。
电子化的技术本应让过刊的保存和获取变得更容易,但它带来的是更多的挑战。
本内容需加入付费会员后查看
Unlock full access to 新闻实验室Newsletter and see the entire library of members-only content.
订阅已经有账户? 登陆