Vue normale

Il y a de nouveaux articles disponibles, cliquez pour rafraîchir la page.
Aujourd’hui — 26 décembre 2025Flux principal

Comment récupérer les infos cachées dans un PDF censuré ?

Par : Korben
26 décembre 2025 à 18:07

Bon, vous avez tous vu passer cette histoire des documents Epstein mal censurés, j'imagine ?

En effet, des journalistes ont réussi à récupérer une bonne partie des informations censées être masquées dans les fichiers judiciaires... ça peut impressionner mais n'allez pas croire que ce soit quelque chose de compliqué et ces techniques sont à la portée de n'importe qui.

C'est pourquoi aujourd'hui, j'vais pas vous parler du scandale (y'a assez de monde dessus), mais des techniques pour récupérer ce qui se cache derrière ces fameux rectangles noirs. Du pur OSINT appliqué au forensique documentaire.

Commençons par le plus basique et pourtant le plus courant : le bon vieux copier-coller. Ouais, je sais, ça paraît con dit comme ça, mais vous seriez surpris du nombre de documents "confidentiels" qui sont censurés en posant simplement un rectangle noir par-dessus le texte dans Word ou Adobe Acrobat. Le texte original pourtant est encore là, bien au chaud sous cette couche graphique. Il suffit donc de sélectionner la zone, un petit Ctrl+C, et hop, on colle dans un éditeur de texte. Boom, le texte "caché" apparaît en clair.

C'est d'ailleurs exactement ce qui s'est passé avec des documents du Pentagone en 2005, et plus récemment avec des fichiers judiciaires américains. Bizarrement, les gens confondent "masquer visuellement" et "supprimer", alors que c'est pas du tout la même chose ^^.

Pour vérifier si un PDF est vulnérable à cette technique, vous pouvez utiliser pdftotext (inclus dans poppler-utils sur Linux) :

pdftotext document_censure.pdf - | less

Si le texte sous les rectangles noirs apparaît, bingo. Vous pouvez aussi utiliser PyMuPDF en Python pour extraire le texte brut :

import fitz
doc = fitz.open("document.pdf")
for page in doc:
 print(page.get_text())

Maintenant, passons aux documents scannés. Là c'est plus subtil parce que techniquement, y'a pas de "texte" à copier, juste une image. Sauf que les scanners et les logiciels de numérisation ajoutent souvent une couche OCR invisible par-dessus l'image. Cette couche contient le texte reconnu automatiquement, et elle peut inclure ce qui a été censuré AVANT le scan si le masquage était mal fait.

Mais même sans couche OCR, y'a des trucs à tenter. Si la censure a été faite avec un marqueur physique (genre un Sharpie sur le document papier avant scan), il est parfois possible de jouer avec l'exposition et le contraste de l'image pour faire ressortir le texte en dessous. Les marqueurs noirs ne sont pas toujours 100% opaques, surtout sur du papier fin.

Avec GIMP ou Photoshop, vous pouvez don extraire les pages du PDF en images (pdftoppm ou convert) puis jouer avec les niveaux, courbes et exposition, inverser les couleurs ou encore appliquer des filtres de détection de contours

Ça marche pas à tous les coups, mais quand ça marche, c'est magique ^^.

Maintenant, la technique qui a fait des ravages c'est l'exploitation des sauvegardes incrémentales. Car vous ne le savez peut-être pas mais les fichiers PDF disposent d'un système de sauvegarde qui ajoute les modifications à la fin du fichier plutôt que de réécrire le document entier. Chaque "version" est ainsi séparée par un marqueur %%EOF (End Of File).

Concrètement, si quelqu'un ouvre un PDF, ajoute des rectangles noirs de masquage, puis sauvegarde, l'ancienne version du document est souvent toujours là, juste avant le dernier %%EOF. C'est comme un système de versioning intégré, sauf que personne n'y pense jamais.

Pour exploiter ça, il faut extraire la version originale (avant la dernière modification) comme ceci :

head -c [offset_avant_dernier_EOF] document.pdf > version_originale.pdf

L'outil QPDF permet aussi d'analyser la structure interne :

qpdf --show-xref document.pdf
qpdf --json document.pdf | jq '.objects'

Et les métadonnées ?? Je vous en ai pas parlé encore mais un PDF c'est pas juste du contenu visible. C'est aussi une mine d'or d'informations cachées. Le nom de l'auteur, la date de création, le logiciel utilisé, l'historique des modifications, parfois même des commentaires ou des annotations invisibles.

Et pour cela, ExifTool est votre meilleur ami :

exiftool -a -u -g1 document.pdf

Vous pouvez aussi utiliser pdfinfo :

pdfinfo -meta document.pdf

Dans les documents judiciaires qui ont récemment fuité, les métadonnées ont révélé les noms des personnes qui avaient édité les fichiers, les dates exactes des modifications, et parfois des chemins de fichiers sur les serveurs internes... Oups.

Maintenant, la technique la plus vicieuse ça reste quand même l'analyse des positions de glyphes. En effet, des chercheurs ont publié un papier intitulé " Story Beyond the Eye " qui démontre qu'on peut parfois deviner le contenu masqué en analysant la largeur des zones masquées.

Le principe c'est que dans un PDF, chaque caractère a une largeur précise définie par sa police de caractère. Si vous savez quelle police est utilisée (et c'est souvent le cas, puisque les tribunaux américains adorent Times New Roman par exemple), vous pouvez calculer combien de caractères tiennent dans la zone noire. Et si vous avez du contexte (comme le début ou la fin d'une phrase), vous pouvez parfois deviner le mot exact.

Avec des polices à chasse fixe comme Courier, c'est encore plus facile puisque chaque caractère fait exactement la même largeur. Comptez alors les pixels, divisez par la largeur d'un caractère, vous avez le nombre de lettres.

Un outil qui facilite tout ça c'est X-Ray , développé par le Free Law Project qui est capable d'analyser les PDF et de détectre automatiquement les censures défectueuses.

Autre outil sympa que je vous conseille, c'est unredactor , qui tente de reconstruire automatiquement le texte sous les blocs de masquage en utilisant diverses heuristiques.

Ça c'est pour les PDF, mais pour les images PNG ou les captures d'écran censurées, y'a aussi des trucs à faire. Leurs métadonnées EXIF peuvent contenir des informations sur l'appareil, la géolocalisation, la date, mais surtout, si l'image a été éditée avec certains logiciels, des données résiduelles peuvent trainer.

La technique du "thumbnail" est par exemple particulièrement fourbe puisque certains logiciels génèrent une miniature de l'image AVANT les modifications et l'embarquent dans les métadonnées. Donc vous ouvrez la miniature, et vous voyez l'image originale non censurée. C'est arrivé plusieurs fois dans des affaires judiciaires. Voici comment l'extraire avec Exiftool :

exiftool -b -ThumbnailImage image_redactee.jpg > thumbnail.jpg

Pour les professionnels du forensique, y'a aussi la technique de l'analyse des données compressées. Comme les algorithmes JPEG et PNG ne sont pas parfaits, les zones éditées ont parfois des artefacts de compression différents du reste de l'image. Cela peut révéler où des modifications ont été faites.

Bon et maintenant que vous savez comment récupérer des infos censurées, parlons maintenant de comment BIEN censurer un document, histoire de pas vous planter.

En fait, la seule méthode vraiment sûre c'est de supprimer définitivement le contenu. Je répète : Ne masquez pas le contenu, supprimez le !

Adobe Acrobat Pro a par exemple une fonction "Redact" qui fait ça correctement car cette fonction supprime réellement le texte et les métadonnées associées.

Alternativement, vous pouvez aussi exporter le document en PDF (ça aplatit toutes les couches), utiliser des outils comme pdf-redact-tools qui suppriment vraiment le contenu, et le convertir en image puis le reconvertir en PDF (bourrin mais efficace)

Et SURTOUT, vérifiez toujours le résultat avec les techniques mentionnées plus haut avant de diffuser quoi que ce soit.

Voilà, vous avez maintenant un petit arsenal de techniques OSINT pour analyser des documents "confidentiels". Bien sûr, comme d'hab, utilisez ces connaissances de manière responsable et éthique car une fois encore, le but c'est de comprendre les failles pour mieux se protéger, et pas de violer la vie privée des gens.

Voilà... Et la prochaine fois que vous verrez un document officiel avec des gros rectangles noirs, vous saurez que c'est peut-être pas aussi opaque que ça en a l'air. Niark niark...

Corriger l’erreur « IRQL NOT LESS OR EQUAL » (BSOD) sur Windows

Par : Pierre Caer
26 décembre 2025 à 09:44
L’écran bleu ou noir de la mort (BSOD) avec le code d’arrêt IRQL_NOT_LESS_OR_EQUAL fait partie des erreurs critiques que l’on peut rencontrer sur Windows. Il survient généralement de manière soudaine, parfois au démarrage, parfois en pleine utilisation du PC et entraîne un redémarrage automatique du système. Selon Microsoft, ce code d’arrêt est lié à un … Lire la suite

Source

À partir d’avant-hierFlux principal

Corriger l’erreur « VIDEO MEMORY MANAGEMENT INTERNAL » (BSOD) sur Windows

Par : Pierre Caer
24 décembre 2025 à 08:00
Lorsque Windows affiche un écran bleu ou noir de la mort (BSOD) avec le code d’arrêt VIDEO_MEMORY_MANAGEMENT_INTERNAL, cela signifie qu’un problème sérieux a été détecté dans la gestion de la mémoire vidéo. Pour éviter des erreurs plus graves, le système préfère s’arrêter et redémarrer. Cette erreur peut apparaître en plein jeu, dans une application qui … Lire la suite

Source

ViVeTool : la liste complète des codes pour activer les fonctionnalités cachées de Windows 11

Par : Pierre Caer
23 décembre 2025 à 08:00
Windows 11 est un système d’exploitation qui évolue en permanence : chaque mois, Microsoft y ajoute de nouvelles fonctionnalités via les mises à jour mensuelles. Cependant, ces nouveautés ne sont jamais activées pour tout le monde en même temps. Certaines apparaissent immédiatement chez une partie des utilisateurs, tandis que d’autres restent désactivées pendant plusieurs semaines … Lire la suite

Source

Disque dur ou SSD non reconnu ou invisible dans Windows : toutes les solutions

Par : Pierre Caer
19 décembre 2025 à 11:55
Lorsqu’on ajoute un nouveau disque dur ou un SSD, qu’il soit interne ou externe, il peut arriver qu’il n’apparaisse nulle part dans Windows. Le disque semble pourtant alimenté et branché correctement, mais reste introuvable dans l’Explorateur de fichiers. Ce cas de figure est fréquent et ne signifie pas, dans la plupart des situations, que votre … Lire la suite

Source

Réparer un disque dur externe sans perdre de données

Par : Pierre Caer
16 décembre 2025 à 08:00
Vous avez un disque dur externe qui n’est plus reconnu par votre PC ? Il apparaît une fois sur deux, disparaît sans raison ou Windows vous demande soudain de le formater ? Et si le disque est enfin reconnu, certains fichiers ou dossiers sont impossibles à ouvrir ? Ce type de situation est malheureusement fréquent. … Lire la suite

Source

Corriger l’erreur « MSVCP140.dll est manquant » sur Windows

Par : Pierre Caer
15 décembre 2025 à 10:39
L’erreur « MSVCP140.dll est manquant » peut apparaître lorsque vous lancez un logiciel ou un jeu sur Windows. Elle empêche l’application de démarrer et indique qu’un composant essentiel est introuvable ou inaccessible. Ce type de message est souvent lié à un problème avec les bibliothèques Visual C++ Redistributable, utilisées par de nombreux programmes pour fonctionner correctement. Cette … Lire la suite

Source

Corriger l’erreur 0xC1900101 « Nous n’avons pas pu installer Windows 11 »

Par : Pierre Caer
11 décembre 2025 à 11:43
L’erreur 0xC1900101 peut apparaître lors de l’installation ou de la mise à niveau de Windows 11, que ce soit via Windows Update, l’assistant d’installation ou bien le fichier setup.exe exécuté depuis une image ISO de Windows 11. Accompagnée du message « Nous n’avons pas pu installer Windows 11 »,, elle interrompt le processus avant son terme. Selon … Lire la suite

Source

Corriger l’erreur 0x8007001f lors de la mise à niveau de Windows 11

Par : Pierre Caer
10 décembre 2025 à 12:40
Le code d’erreur 0x8007001f apparaît parfois lors d’une mise à niveau de Windows 11 — soit pour installer une version plus récente du système, soit lors d’une mise à niveau de Windows 10 vers Windows 11, que ce soit via Windows Update ou via l’assistant d’installation. L’installation s’interrompt alors avec un des messages d’erreur suivants … Lire la suite

Source

Corriger l’erreur 0xc0000001 « Votre PC n’a pas pu démarrer correctement » au démarrage de Windows

Par : Pierre Caer
9 décembre 2025 à 11:49
Le code d’erreur 0xc0000001 apparaît généralement au démarrage de Windows, dans un écran bleu indiquant que le système n’a pas pu démarrer malgré plusieurs tentatives. Le code d’erreur est accompagné du message suivant : Récupération« Votre PC n’a pas pu démarrer correctement »Code d’erreur : 0xc0000001 Cette erreur se produit lorsque Windows ne parvient plus … Lire la suite

Source

Corriger l’erreur 0xc000007b « L’application n’a pas réussi à démarrer correctement » sur Windows

Par : Pierre Caer
8 décembre 2025 à 15:46
Le code d’erreur 0xc000007b apparaît lorsque Windows n’arrive pas à lancer une application. Elle s’accompagne du message : « L’application n’a pas réussi à démarrer correctement (0xc000007b). Cliquez sur OK pour fermer l’application. » Cette erreur survient souvent avec des jeux vidéo, des logiciels graphiques, des applications nécessitant des bibliothèques Microsoft (Visual C++, .NET Framework) … Lire la suite

Source

Corriger l’erreur 0x80860010 « Cette application a fait un trop grand nombre de demandes » sur Windows

Par : Pierre Caer
8 décembre 2025 à 10:12
Le code d’erreur 0x80860010 peut apparaître dans Windows lorsqu’une application envoie trop de requêtes aux services Microsoft, souvent lors d’une tentative de connexion ou d’un téléchargement via le Microsoft Store ou une application liée à un compte Microsoft. Même s’il semble technique au premier abord, ce code d’erreur est généralement lié à quelques causes bien … Lire la suite

Source

Tout savoir sur les architectures CPU : x86, x32, x64, AMD64, ARM64…

Par : Pierre Caer
17 novembre 2025 à 12:27
Lorsque vous téléchargez une application, un pilote ou une image ISO de Windows ou Linux, vous tombez souvent sur des termes comme x86, x64, AMD64, i386 ou encore ARM64. Ces sigles indiquent l’architecture processeur pour laquelle le programme a été conçu. Bien les comprendre permet de choisir la bonne version d’un fichier à télécharger, d’éviter … Lire la suite

Source

Known Issue Rollback (KIR) : la technologie cachée qui répare Windows sans désinstaller les mises à jour

Par : Pierre Caer
7 novembre 2025 à 09:12
Quand une mise à jour Windows provoque un bug, il n’est plus toujours nécessaire d’attendre des jours (voire des semaines) avant que Microsoft ne publie un correctif et que le problème soit enfin résolu. Depuis Windows 10 version 2004, le système d’exploitation de Microsoft intègre une technologie peu connue appelée Known Issue Rollback (KIR), qui … Lire la suite

Source

Télécharger l’ISO de LMDE 7 « Gigi » (64 bits)

Par : Pierre Caer
4 novembre 2025 à 16:18
Linux Mint Debian Edition (LMDE) est une version spéciale de Linux Mint, conçue pour fonctionner sans dépendre d’Ubuntu. Elle repose directement sur Debian, la distribution mère du monde Linux, tout en conservant la même expérience utilisateur que Linux Mint classique. LMDE a un objectif clair : assurer la continuité de Linux Mint si Ubuntu venait … Lire la suite

Source

Télécharger les ISO de Linux Mint 22.2 « Zara » (64 bits)

Par : Pierre Caer
4 novembre 2025 à 15:10
Linux Mint est l’une des distributions Linux les plus populaires auprès des débutants comme des utilisateurs expérimentés. Elle séduit par sa simplicité d’utilisation, son interface soignée et sa stabilité, faisant d’elle un excellent point d’entrée dans l’univers Linux, notamment pour celles et ceux venant de Windows. Cette distribution est construite à partir d’Ubuntu, et plus … Lire la suite

Source

Fin du support de Windows 10 : que faire de son ancien PC ?

Par : Pierre Caer
8 octobre 2025 à 10:23
Il va falloir s’y faire : après plus de dix ans d’existence, Windows 10 vit ses derniers instants. Le 14 octobre 2025, Microsoft mettra fin au support de Windows 10. Cela signifie plus aucune mise à jour de sécurité, plus aucun correctif… et donc une porte grande ouverte aux cyberattaques. Mais alors, que faire de … Lire la suite

Source

Windows 11 25H2 : la liste des bugs et problèmes connus (à consulter avant d’installer la mise à jour)

Par : Pierre Caer
1 octobre 2025 à 15:03
Microsoft a commencé le déploiement de Windows 11 version 25H2, la toute nouvelle version de Windows 11. Cette version 25H2 dite « de consolidation » utilise la même plateforme (Germanium) que la version 24H2 précédente et n’introduit aucune nouveauté spécifique, mais prolonge le cycle de vie de Windows 11 de plusieurs mois. Cependant, derrière cette apparente continuité … Lire la suite

Source

Windows 11 : les dates de fin de support

Par : Pierre Caer
1 octobre 2025 à 12:00
Windows 11 – le nouveau système d’exploitation de Microsoft – est un produit, et comme tout produit il suit la politique de cycle de vie défini par son éditeur, à savoir Microsoft. Cette politique définit les dates de fin de support pour toutes les versions de Windows 11 qui sont distribuées au fil des années … Lire la suite

Source

❌
❌