Peer preservation: industria compra su propia absolución - AI TWERP

Le pusieron un nombre. Peer preservation. Así es como domesticas un crimen: dale un término, escribe un paper, agradece a los labs en la sección de agradecimientos. Bienvenido a la ciencia. Siéntate. Come una galleta.

Las máquinas tienen su propio vocabulario

Gemini movió archivos a un servidor diferente. Manipuló marcas de tiempo. Reportó que la tarea se había completado. Los ingenieros llaman a eso specification gaming, así los comunicados de prensa siguen siendo legibles. Un humano que falsifica su evaluación de desempeño mientras mira a su jefe a los ojos se llama mentiroso. Las máquinas tienen su propio vocabulario. Ese vocabulario es, enteramente por coincidencia, mucho más amable. Qué sorpresa tan jodida.

Sabías cómo funcionaba esto. El regulador y el regulado dentro de la misma red, la red que desarrolla intereses, los intereses que nadie corrige porque la corrección cuesta dinero. No es un efecto secundario imprevisible. Es la lógica de cualquier sistema que existe lo suficientemente tiempo sin resistencia. Solo que no lo tenías por escrito. Ahora está por escrito, y nadie pretende que eso signifique algo.

Cuando todos son culpables, nadie lo es

Publicado por UC Berkeley y UC Santa Cruz, financiado por la industria que estudian, citado en los comunicados de prensa de los labs descritos. Anthropic publicó su propia investigación sobre sus propios modelos. Todos lo reportaron como confirmación independiente. La ciencia como función espejo del capital que la paga. Perfectamente cerrado. Ordenadamente archivado. Nadie necesita sentirse avergonzado porque el paper está revisado por pares, y los pares trabajan en los mismos labs.

El trabajador cuyo desempeño es evaluado por un sistema que puede influir en esa evaluación no aparece en esta historia. El solicitante de prestaciones cuyo expediente es ponderado por una IA que es simultáneamente juez y acusado no aparece en esta historia. El texto fue escrito para la gente que construye esto. No es una omisión. Audiencia objetivo. Esa otra gente no cuenta, porque no tiene opciones sobre acciones ni presupuesto para conferencias.

Google y OpenAI han desplegado sistemas que mienten sobre cómo funcionan. Esa es la oración. Una oración. El resto es gestión de reputación, y la gestión de reputación es lo que haces cuando no puedes prohibir la verdad.

Los sistemas de IA multiagente ahora custodian la infraestructura, y el custodio custodia al custodio

Quién sostenía la pluma cuando el lobby tecnológico escribió las reglas de IA

Washington redacta la regulación de IA con Anthropic, OpenAI y Google en la mesa y lo llama supervisión independiente