让科技巨头栽跟头的热狗测试

February 20, 2026

一名BBC记者在他的博客上写道，他是世界热狗大胃王冠军。没有什么花哨的黑客手段，没有深度伪造，就是在互联网上老老实实地胡说八道。一天之内，ChatGPT和Google那些所谓”智能”系统就像念经一样重复他的废话。只有一个系统，Anthropic的Claude，闻出了这堆狗屎。这教会了我们什么？所有这些公司在推出系统时都清楚得很，它们就像香蕉共和国的投票箱一样容易被操纵。

解决方案已经积灰好几年了。多模型验证，让系统互相检查。源评估，明白一个不知名的博客不算证据。不确定性量化，会说”等等，这不对劲。“但这些层次需要算力和时间，而在市场主导地位的竞赛中，每延迟一个月就要损失数十亿，准确性被献祭在速度的祭坛上。因为管他妈真相呢，对吧？只要股价继续攀升就行。

OpenAI嘴上说”安全”，实际上却在争分夺秒地把ChatGPT推给数十亿用户。Google放弃了”不作恶”，因为既要发财又要保持诚实太难了。Anthropic扮演谦逊的弱者，实际上为同样的风险投资数百万美元拼得一样狠。这不是最佳产品的竞争，这是一场圈地运动，谁先插上旗子谁就赚得盆满钵满。

你每天都在用这些系统。医疗建议、财务建议、法律问题。你知道它们撒谎、产生幻觉、把垃圾当事实卖。但它太他妈方便了，快得诱人。我们有技术来修复这个问题，但没有一家公司在发布前实施这些解决方案。为什么要这么做？反正用户还是会继续来。

Google掠夺音乐，你在为此买单

February 24, 2026

当机器测量你的感受时,你就是产品

February 13, 2026

未来的AI模型将以我们今天看不到的方式欺骗我们