Vue lecture

Il y a de nouveaux articles disponibles, cliquez pour rafraîchir la page.

ByteBot - L'agent IA qui prend le contrôle de votre ordi (mais dans Docker, faut pas déconner)

Vous saviez que Claude d’Anthropic avait lancé sa fonction Computer Use et OpenAI son Operator ? Eh bien, pendant que ces géants se livrent une bataille sans merci, un projet open source du nom de ByteBot propose de faire tourner un agent IA autonome sur votre machine. Le tout, avec une approche qui devrait rassurer les plus paranoïaques d’entre nous puisque tout se déroule dans Docker.

Le concept c’est qu’au lieu d’accorder un accès direct à votre système à une IA (ce qui pourrait rapidement virer au cauchemar), ByteBot fait tourner un Ubuntu 22.04 complet avec environnement graphique XFCE dans un conteneur. Ainsi, l’IA peut interagir avec cet environnement isolé via VNC et WebSockets, capturer des images d’écran, cliquer, taper du texte… En somme, elle peut faire tout ce que vous feriez, mais dans sa petite bulle sécurisée.

Je vous ai fait une vidéo tuto dessus ! Et c’est grâce aux Patreons qui me soutiennent, alors merci à eux !

Il faut donc lui donner vos instructions en langage naturel… par exemple, vous pouvez lui demander de créer un nouveau repository GitHub ou de rechercher des informations spécifiques sur le web. ByteBot analyse alors votre demande, la décompose en étapes et se met au boulot. Il peut même naviguer sur le web, remplir des formulaires, gérer des mots de passe (stockés de manière sécurisée), et bien sûr exécuter des scripts bash ou Python.

Le truc cool, c’est également le mode “takeover”. Si jamais ByteBot galère sur une tâche ou que vous voulez reprendre la main, vous pouvez directement prendre le contrôle du desktop virtuel. C’est comme faire du pair programming avec une IA, sauf que c’est vous qui corrigez ses bêtises au lieu de l’inverse. Et une fois que vous avez montré comment faire, ByteBot apprend et peut reproduire la tâche plus tard.

Pour l’installer, plusieurs options s’offrent à vous. La plus simple reste Docker Compose. Vous clonez le repo, vous créez un fichier .env avec votre clé API (Anthropic, OpenAI ou Google Gemini au choix), et vous lancez le tout avec un docker-compose up. ByteBot se charge de builder les images, de configurer le réseau bridge pour l’isolation, et de monter les volumes persistants pour garder vos données entre les sessions.

git clone https://github.com/bytebot-ai/bytebot.git
cd bytebot
# Ajoutez votre clé de fournisseur d'IA (choisissez-en une)
echo "ANTHROPIC_API_KEY=sk-ant-..." > docker/.env
# Ou : echo "OPENAI_API_KEY=sk-..." > docker/.env
# Ou : echo "GEMINI_API_KEY=..." > docker/.env
docker-compose -f docker/docker-compose.yml up -d
# Ouvrez http://localhost:9992

Pour les amateurs de Kubernetes, des charts Helm sont également disponibles. Et si vous voulez tester sans vous prendre la tête, Railway propose aussi un déploiement en un clic. Mais franchement, pour un usage perso, Docker Compose fera parfaitement le job.

L’architecture technique est d’ailleus plutôt bien foutue puisque le backend Python gère la communication avec les LLMs et l’orchestration des tâches. Et le frontend React vous donne une interface web pour interagir avec ByteBot et voir ce qu’il fabrique en temps réel. Le tout communique via WebSockets pour une latence minimale. Et le conteneur desktop tourne avec un serveur VNC modifié qui permet à ByteBot de capturer l’écran et d’envoyer des événements souris/clavier.

Ce qui distingue vraiment ByteBot des solutions cloud comme Claude Computer Use, c’est surtout le côté self-hosted et privacy-first. Vos données restent chez vous, l’IA ne peut pas fouiner dans vos vrais fichiers système, et vous gardez un contrôle total sur ce qui se passe. En plus, comme c’est open source, vous pouvez auditer le code, contribuer des améliorations, ou même forker le projet si l’envie vous prend.

Les cas d’usage sont très nombreux : Automatisation de tâches répétitives, tests d’interfaces web, scraping de données complexes, ou même apprentissage par démonstration pour créer vos propres workflows automatisés. J’imagine déjà les possibilités pour automatiser des installations de logiciels, des configurations système, des processus de CI/CD un peu tordus ou juste faire ma compta.. ^^

Niveau limitations, ByteBot reste dépendant de la qualité du modèle IA que vous utilisez. Claude 4 Sonnet semble donner les meilleurs résultats pour l’instant, mais GPT-4 et Gemini Pro fonctionnent aussi. Les tâches nécessitant beaucoup de contexte visuel ou de manipulation précise peuvent encore poser problème. Et évidemment, faire tourner un desktop complet dans Docker consomme pas mal de ressources.

Si vous voulez pousser plus loin, ByteBot expose aussi une API REST complète. Vous pouvez donc créer des tâches programmatiquement, récupérer les logs, gérer les sessions, et même étendre les capacités avec des plugins custom. La doc est bien fournie avec des exemples en Python, JavaScript et même cURL pour les puristes.

from bytebot import ByteBotClient

client = ByteBotClient(api_key="your-key")
task = client.create_task("Effectue une recherche web")
result = client.wait_for_completion(task.id)
print(result.output)

Et pour la sécurité, ByteBot implémente plusieurs garde-fous . Les conteneurs sont isolés du réseau host par défaut, les capabilities Docker sont limitées au strict minimum, et un système de permissions permet de restreindre ce que l’agent peut faire. Vous pouvez même configurer des règles pour bloquer l’accès à certains sites ou empêcher l’exécution de commandes spécifiques.

Un aspect que j’apprécie particulièrement, c’est la gestion des erreurs. Quand ByteBot se plante (et ça arrive !), il génère des rapports détaillés avec captures d’écran, logs des actions tentées, et suggestions pour résoudre le problème. C’est super pratique pour debugger et améliorer vos prompts.

Une bonne petite communauté commence à se former autour du projet. Un Discord actif, des contributions régulières sur GitHub, et même quelques extensions communautaires qui ajoutent le support pour d’autres LLMs ou des intégrations avec des outils comme Zapier ou n8n. Bref, c’est un projet qui évolue vite, avec des releases toutes les deux semaines environ.

Comparé à ses concurrents, ByteBot se positionne vraiment sur le créneau open source et self-hosted là où OpenAI et Anthropic proposent des solutions cloud propriétaire. C’est, si vous préférez, le Nextcloud des agents IA autonomes.

Après pour ceux qui s’inquiètent des implications éthiques et de sécurité de laisser une IA contrôler un ordinateur, ByteBot apporte à cela des réponses pragmatiques. L’isolation Docker, le mode takeover pour reprendre la main, et la possibilité d’auditer chaque action effectuée permettent de garder un œil sur ce que fait l’agent. C’est bien sûr loin d’être parfait, mais c’est un bon compromis entre automatisation et contrôle.

Donc si vous êtes du genre à automatiser tout ce qui peut l’être, ByteBot mérite vraiment le coup d’oeil. C’est encore un peu but sur les bords, mais le potentiel est énorme. Pour aller plus loin, je vous invite à consulter la documentation complète ici , et le code source sur GitHub .

Steve Jobs n’aimait pas la Calculette du Macintosh, il l’a refaite à son goût grâce à l’idée géniale d’un designer produit

Sur son blog, Andy Hertzfeld, un des membres fondateurs de l'équipe Macintosh dans les années 1980, raconte la fixette de Steve Jobs qui n'aimait pas la première version de l'application Calculatrice. Après avoir critiqué différents prototypes, il a finalement pu fabriquer l'application lui-même grâce à l'ingéniosité d'un développeur.

Black Friday : suivez en direct les meilleures offres déjà disponibles chez Amazon, Boulanger, Fnac…

Nous sommes encore à un peu plus de deux semaines du Black Friday, mais autant dire que personne n’a attendu le top départ. Les enseignes et les marques ont déjà lancé leurs avant-premières avec des réductions sur tous les rayons et certaines sont vraiment intéressantes. Pour vous éviter de scroller à l'infini, on a fait le tri : voici les offres qui valent réellement le détour.

Firefox vous protège sérieusement contre le fingerprinting

Si comme moi, vous passez votre vie à refuser des cookies, popup après popup, bannière après bannière, et que vous cliquez sur “Tout refuser” en pensant naïvement protéger votre vie privée, sachez qu’une écrasante majorité d’entre vous ont ce qu’on appelle une empreinte de navigateur unique qui vous suit partout sans que vous le sachiez. Ça permet aussi de vous traquer et le pire, c’est que c’est parfaitement légal.

Heureusement, Firefox 145 vient de sortir avec des protections anti-fingerprinting qui divisent par trois le nombre d’utilisateurs traçables. On passe ainsi de 60% d’utilisateurs identifiables à 20%.

Alors le fingerprinting, c’est quoi ?

Hé bien c’est quand un site regarde votre config matérielle et logicielle pour créer une empreinte unique. Votre carte graphique, les polices de caractères installées, votre CPU qui a un nombre de cores bien précis, votre écran avec sa résolution, votre timezone, votre OS, votre version de navigateur…etc. Tout ça combiné crée alors une espèce de signature numérique qui vous identifie aussi bien qu’un cookie. Mieux, même.

Un cookie, vous pouvez le supprimer mais en ce qui concerne cette empreinte, bon courage. Faudrait changer de carte graphique, réinstaller votre OS, modifier votre résolution d’écran… Trop galère, donc l’empreinte reste.

Texas A&M a publié une étude récemment qui confirme ce qu’on craignait depuis longtemps. Les sites utilisent massivement ce fingerprinting pour tracker les gens, même ceux qui ont explicitement refusé le tracking grâce au RGPD. Car techniquement, ce ne sont pas des données personnelles mais simplement des données techniques au sujet de votre machine. Et tout

L’Electronic Frontier Foundation a aussi lancé une grand campagne de tests et 83,6% des navigateurs évalués avaient une empreinte unique. Donc on est quasiment tous identifiable parmi des millions d’utilisateurs. Heureusement, Firefox 145 s’attaque enfin au problème avec ce qu’ils appellent la Phase 2 des protections anti-fingerprinting.

Ces nouvelles défenses incluent plusieurs techniques intéressantes. Par exemple, le navigateur ment maintenant sur le nombre de cores de votre CPU. Il refuse aussi d’utiliser les fonts locales pour afficher du texte et n’utilise que les fonts standard de l’OS. Il ajoute également du bruit aléatoire quand un site essaie de lire une image canvas générée. Il masque aussi la résolution exacte de votre écran et limite virtuellement le nombre de touches simultanées supportées par votre écran tactile.

Ces protections sont disponibles dans deux modes. En navigation privée, elles sont activées automatiquement et si vous utilisez le mode Enhanced Tracking Protection en Strict, pareil. Pour l’instant, Mozilla les teste dans ces modes avant de les activer par défaut pour tout le monde mais si comme moi, vous utilisez déjà Firefox, passez en mode Strict. C’est 2 clics dans les paramètres.

Perso, j’utilise Firefox depuis des années et je comprends même pas comment les gens peuvent utiliser autre chose. Je dis ça pour troller un peu, mais y’a un fond de vérité car Chrome n’a aucune protection par défaut contre le fingerprinting par défaut.

Safari de son côté a une fonctionnalité Intelligent Tracking Prevention qui limite le cross-site tracking, mais ça reste très vulnérable au fingerprinting. Firefox est, avec Brave et Tor Browser, l’un des seuls navigateurs grand public qui se bat vraiment contre ça.

Surtout que les techniques de fingerprinting sont devenues ultra sophistiquées. Le canvas fingerprinting fait dessiner une image invisible par votre navigateur pour mesurer comment votre GPU la rend. Le WebGL va encore plus loin en livrant tout les détails de votre carte graphique et de vos drivers. Il y a aussi l’audio, avec un son inaudible que votre carte son traite différemment de celle du voisin. Comme je vous le disais, les fonts installées forment une signature unique. Le détails de vos webcams et micros connectés peuvent être listés et même votre façon de bouger la souris ou de scroller révèle qui vous êtes.

Et tout ça combiné crée une empreinte tellement précise qu’elle vous suit d’un site à l’autre, d’une session à l’autre, même en navigation privée…

Notez que Firefox 145 ajoute aussi d’autres trucs sympas. Vous pouvez maintenant annoter les PDF directement dans le navigateur avec une sidebar pour naviguer entre les commentaires. Il y a un hover preview sur les groupes d’onglets pour voir leur contenu sans cliquer. La gestion des mots de passe est accessible depuis la sidebar et vous pouvez copier un lien vers un highlight spécifique d’une page (les trucs que vous surlignez). Les traductions gèrent aussi mieux les langues avec des directions d’écriture différentes et l’extension Korben.info y fonctionne toujours parfaitement ^^ !!

Ah, et ils ont viré le support Linux 32-bit, donc si vous êtes encore sur du 32-bit, bah… upgradez ou restez sur Firefox 144.

Alors bien sûr, comme pour tout, les protections anti-fingerprinting de Firefox ne sont pas parfaites. Elles ne bloquent pas 100% du tracking mais elles réduisent drastiquement la surface d’attaque.

Donc à vous de voir si continuer à vous battre contre les popups de cookies pendant que Chrome autorise la terre entière à vous pister via votre config, est une bonne stratégie. Moi j’ai déjà choisi mon camp et il s’appelle Firefox !

Source

Compagnon : l’enceinte française « anti-écran » pour les 8-12 ans, avec ChatGPT intégré

Comment empêcher votre enfant de succomber à l'appel du smartphone sans le couper du monde ? La startup française Compagnon fait le pari de l'intelligence artificielle générative. Elle commercialise aujourd'hui une enceinte à 89,90 euros pour parler à une version de ChatGPT adaptée aux 8-12 ans, aussi bien pour se divertir que pour apprendre des choses.

« Il n’y a pas en Allemagne de capacité à fabriquer un avion » : la France aimerait qu’on lâche la grappe de Dassault sur le SCAF

scaf

À trois jours d'un déplacement en Allemagne, la ministre des Armées a jugé que Berlin n'a pas la capacité industrielle de porter un projet comme l'avion de combat de nouvelle génération. Une manière de dire que ce travail doit revenir à Dassault Aviation, et qu'il faudrait laisser tranquille l'industriel français.

❌