近日,美国《华盛顿邮报》揭露了关于2025年夏天发生的一起众多作家联名诉人工智能公司Anthropic的更多幕后真相。为训练其公司新开发的人工智能模型,该公司曾销毁数百万册实体书籍,将文件从纸质转换为数字格式,这一做法的“优势”在于成本低廉且很可能合法。该公司最终在去年 8 月份同意支付 15 亿美元达成和解。
据最新披露的关于这起案件的相关文件,Anthropic 的领导层认为书籍对于训练其人工智能模型“至关重要”,其中一位联合创始人表示,书籍将教会机器人“如何写好文章”,而不是模仿“低质量的网络用语”。
整个行动被命名为“巴拿马计划”。Anthropic 公司斥巨资从图书馆、在线二手书店以及像斯特兰德书店这样的实体书店购书,打造了一个庞大的图书馆。该公司将拆解书籍变成了一种艺术。他们使用“液压切割机”将从二手书零售商那里收购的数百万册书籍“整齐地切割”出来,然后用“高速、高质量、生产级扫描仪”扫描书页。之后,他们会安排一家回收公司来回收这些被拆解的书籍——毕竟,谁也不想浪费。
这一行为在现有法律规定中具有相当的隐蔽性。据Anthropic的律师称,法官在此前的盗版案中模棱两可的判决留下了一个法律漏洞。法官裁定,如果用于训练人工智能的书籍是以“变革性”的方式使用,那么这种做法在法律上是合法的,类似于用书籍教孩子,或者购买书籍后可以随意处置——例如,二手书店就是一个允许这种做法的法律先例。总而言之,销毁书籍使该公司得以逃避向作者支付报酬。
据《华盛顿邮报》报道,一份新近解封的内部规划文件写道:“‘巴拿马计划’是我们试图以破坏性的方式扫描全世界所有书籍的行动。我们不想让别人知道我们正在进行这项计划。”
在转向实体书之前,Anthropic公司就因盗版数百万册电子书而备受争议。2021年,Anthropic联合创始人本·曼恩(Ben Mann)自作主张地从LibGen下载了数百万册书籍。LibGen是一个在线“影子图书馆”,提供大量可免费获取的盗版文本。
Anthropic并非唯一一家使用盗版书籍的公司。在另一起作者诉讼案中,文件揭露了马克·扎克伯格的Meta公司也从LibGen等影子图书馆窃取了数百万册书籍,一些员工意识到这有点可疑。他们在内部通讯中写道:“如果媒体报道暗示,我们使用了明知是盗版的数据集,例如 LibGen,这可能会削弱我们在这些问题上与监管机构的谈判地位。”九游娱乐-官网app