Anthropic sait enfin ce qui se passe dans le cerveau torturé de son IA Claude
Comment ça, nos IA préférées nous mentent depuis le début ?? Anthropic vient de fendre en deux le crane de son LLM pour voir ce qu’il y avait à l’intérieur et les résultats sont aussi fascinants qu’inquiétants. L’entreprise à l’origine de l’assistant Claude a publié une étude qui pourrait bien bouleverser notre compréhension de ce qui se passe réellement dans les “cerveaux” des IA.
Si comme moi, vous utilisez régulièrement ChatGPT, Claude ou d’autres grands modèles de langage, vous vous êtes peut-être déjà demandé : “Mais comment fonctionne cette diablerie messire ?” On voit leurs réponses bluffantes de cyber intello, mais jusqu’à présent, personne, pas même leurs créateurs, ne comprenait vraiment leur fonctionnement interne. Incroyable non ?