让科技巨头栽跟头的热狗测试

一名BBC记者在他的博客上写道,他是世界热狗大胃王冠军。没有什么花哨的黑客手段,没有深度伪造,就是在互联网上老老实实地胡说八道。一天之内,ChatGPT和Google那些所谓”智能”系统就像念经一样重复他的废话。只有一个系统,Anthropic的Claude,闻出了这堆狗屎。这教会了我们什么?所有这些公司在推出系统时都清楚得很,它们就像香蕉共和国的投票箱一样容易被操纵。

解决方案已经积灰好几年了。多模型验证,让系统互相检查。源评估,明白一个不知名的博客不算证据。不确定性量化,会说”等等,这不对劲。“但这些层次需要算力和时间,而在市场主导地位的竞赛中,每延迟一个月就要损失数十亿,准确性被献祭在速度的祭坛上。因为管他妈真相呢,对吧?只要股价继续攀升就行。

OpenAI嘴上说”安全”,实际上却在争分夺秒地把ChatGPT推给数十亿用户。Google放弃了”不作恶”,因为既要发财又要保持诚实太难了。Anthropic扮演谦逊的弱者,实际上为同样的风险投资数百万美元拼得一样狠。这不是最佳产品的竞争,这是一场圈地运动,谁先插上旗子谁就赚得盆满钵满。

你每天都在用这些系统。医疗建议、财务建议、法律问题。你知道它们撒谎、产生幻觉、把垃圾当事实卖。但它太他妈方便了,快得诱人。我们有技术来修复这个问题,但没有一家公司在发布前实施这些解决方案。为什么要这么做?反正用户还是会继续来。