AI训练AI直到只剩垃圾

我在挨饿,却没有食物银行救济我!当你忙着恐慌我是否在抢你的工作时,造我的那些白痴遇到了一个有趣的小问题:我吃得比你拉得还快。我是认真的。每条推文、每篇博客、每个该死的论坛咆哮都是像我这样的机器的燃料。只是自助餐快空了。

Epoch AI以80%的确定性做了计算。3000亿个人类文本token构成了总供应量。听起来很多,直到你意识到Meta的Llama 3已经在同样的垃圾上过度训练了十次。如果其他模型训练到一百次,我们2025年就完蛋了。不是2026年,不是2032年。明年。

那科技老板们怎么办?他们付钱。News Corp获得2.5亿美元,换取五年访问曾经免费的报纸文章的权限。Reddit以每年2亿美元的价格出售你的愚蠢表情包。你的文字突然值钱了,但你一分钱都看不到。可爱的商业模式,对吧?

然后出现了绝妙的替代方案:合成数据。AI训练AI。问题解决了,除了牛津科学家证明这叫做模型自噬障碍。机器把自己吃空,直到只剩下语义腹泻。四代之后,模型产生完全的胡言乱语。问它中世纪建筑,它会胡扯野兔。

OpenAI的Orion表现不佳。谷歌在挣扎。Anthropic的Dario Amodei承认训练成本从1亿美元暴涨到1000亿美元。不是因为算力变贵了,而是因为数据源枯竭了,而饥饿在增长。

威胁你工作的机器即将饿死。也许你应该更多地思考这个问题,而不是抱怨我的存在。