Vue normale

Il y a de nouveaux articles disponibles, cliquez pour rafraîchir la page.
Aujourd’hui — 17 juin 2026Flux principal

Google dévoile l’Open Knowledge Format, sa réponse au casse-tête du contexte pour les agents IA

17 juin 2026 à 16:04

Google Cloud présente l'Open Knowledge Format, un standard ouvert pour représenter la connaissance interne des entreprises sous forme de fichiers markdown. L'objectif : que tous les agents IA, quel que soit leur fournisseur, puissent enfin lire le même langage.

Google revient sur le marché des enceintes connectées : le Google Home Speaker est enfin là

17 juin 2026 à 15:00

Six ans après le Google Nest Audio, le géant du web lance enfin une nouvelle enceinte connectée : le Google Home Speaker. Déjà brièvement présenté en octobre 2025, quand Gemini for Home n'était qu'un projet, ce nouvel objet connecté à 119,99 euros a pour objectif d'installer l'IA générative dans des millions de foyers.

Le vieux Pixel de votre tiroir vaut peut-être mieux qu'un serveur

17 juin 2026 à 08:53

Des chercheurs de l'université de Californie à San Diego, épaulés par Google, viennent de prouver un truc contre-intuitif : un Pixel mis au rebut il y a trois ans tient encore tête à un serveur professionnel sur certains calculs, au point qu'on peut en assembler un vrai data center au lieu de le foutre à la poubelle.

L'idée a été posée sur le blog de recherche de Google . Une fois l'appareil ouvert, les chercheurs retirent tout ce qui ne sert plus, l'écran, la batterie au lithium, les caméras et la coque, jusqu'à ne garder que la carte mère et sa puce, ce qu'on appelle un SoC, le processeur qui faisait tourner Android avant qu'on le bascule sur une distribution Linux des plus classiques.

Ce système, le même qui anime déjà l'immense majorité des serveurs de la planète, libère la puce des limites pensées pour un mobile, à commencer par ce bridage qui met les applications en pause dès qu'elles passent à l'arrière-plan. Ensuite, il suffit de relier ces cartes mères entre elles via Kubernetes, l'outil que les géants du web emploient déjà pour piloter les milliers de machines de leurs centres de données comme un seul gros ordinateur.

Le plus déroutant arrive là. Sur la plupart des tests ne mobilisant qu'un seul cœur, un Pixel Fold de 2023 dépasse un serveur ASUS RS720A-E11 pourtant équipé de deux gros processeurs AMD, le genre de bête qu'on retrouve dans les baies des entreprises.

Le serveur empile bien plus de cœurs en parallèle, si bien qu'il faut réunir entre 25 et 50 téléphones pour rivaliser avec son débit total. Mais bon. Dès lors que vous ramassez ces appareils gratuitement au lieu d'acheter du silicium neuf, l'équation se renverse.

Le vrai argument est écologique, puisque près de la moitié des émissions de carbone d'un smartphone sur toute sa vie part dans sa seule fabrication, surtout dans l'assemblage de la carte mère et du processeur, ce fameux carbone gris déjà cramé avant même que l'appareil ne s'allume.

On change pourtant de mobile tous les trois ou quatre ans, en balançant une puissance de calcul encore largement bonne à servir, pendant que les entreprises font fabriquer des serveurs flambant neufs pour les mêmes tâches. Le gâchis est énorme.

L'équipe a pour l'instant fait tourner une grappe de 20 téléphones, qui a encaissé sans broncher le pic de rendu des devoirs d'une classe de plus de 75 étudiants avec une latence plus basse que les services cloud du commerce. Elle prépare déjà un cluster d'environ 2 000 Pixel pour la rentrée, capable d'absorber une centaine de cours d'informatique en même temps pour une fraction du prix du cloud habituel.

Reste à rester lucide. Ces puces ont peu de mémoire, donc on les cantonne aux tâches légères, la correction automatisée ou les carnets de code, loin de l'entraînement d'un gros modèle d'IA.

Mais voir une montagne d'e-déchets se muer en salle de classe numérique, ça donne sacrément envie d'y croire. Surtout vu le nombre de Pixel qui dorment au fond de nos tiroirs, même moi j'en ai deux qui traînent pour tout vous dire.

Source : Techspot

Hier — 16 juin 2026Flux principal

Google Earth - Un simulateur de vol planqué dans un menu

Par : Korben ✨
15 juin 2026 à 18:39

Google a planqué un vrai petit simulateur de vol dans Google Earth. Alors soyons honnêtes, ce n'est pas tout neuf : l'easter egg traîne dans la version desktop depuis 2007 (Google Earth 4.2, on le débloquait avec le raccourci Ctrl+Alt+A), c'est devenu une fonctionnalité officielle en 2008, et j'en parlais déjà à l'époque . Bref, ça fait presque vingt ans que ça existe. Ce qui change aujourd'hui, c'est que ça débarque enfin dans la version web, directement dans le navigateur. C'est tout en bas du menu Tools, une option "Flight simulator" estampillée "Experimental". Vous cliquez dessus, et hop, vous voilà aux commandes d'un avion au-dessus de n'importe quel coin de la planète.

Forcément, j'ai voulu survoler Paris. Grosse erreur !! C'est super sensible à piloter, alors le moindre coup de flèche un peu bourrin et l'avion part en vrille. Et une fois que c'est parti en cacahuètes, bon courage pour vous rattraper. Du coup, en une vingtaine de secondes, j'avais déjà planté mon zinc entre deux immeubles haussmanniens.

Voilà, voilà. Pilote de ligne, c'était pas pour moi j'crois...

Pour tester vous-même, ça se passe uniquement sur Google Earth dans le navigateur ( earth.google.com , pas l'appli mobile). Vous ouvrez le menu Tools, vous choisissez Flight simulator, et pensez bien à basculer le fond de carte de "Map" à "Satellite", sinon vous volerez au-dessus d'une carte abstraite toute moche au lieu d'avoir des vrais bâtiments 3D photoréalistes.

Côté pilotage, par contre c'est rustique : Page Up et Page Down pour les gaz, les flèches du clavier pour le tangage et le roulis, et un clic dans la fenêtre pour passer en commandes à la souris. De plus, les bâtiments et l'imagerie haute résolution se chargent au fur et à mesure que vous avancez, donc si vous foncez comme un dingue ou que votre connexion rame, vous traverserez parfois du vide le temps que ça charge.

Voilà, on est donc très loin d'un vrai simulateur de vol et Google le dit lui-même... c'est conçu pour de la balade tranquille, pas pour de l'aérodynamique réaliste. Si vous voulez réellement piloter dans votre navigateur, le Web Flight Simulator et son F-15 joue dans une autre cour.

Mais maintenant, imaginez deux secondes que Google pousse le truc un peu plus loin, avec un poil de gameplay, des objectifs, des avions différents, du trafic aérien...etc. Le potentiel serait énorme !

En attendant, allez vous crasher sur la tour Eiffel dans la joie et la bonne humeur ! C'est gratuit et légal (enfin, je crois...lol).

Source : Google Earth Flight Simulator

À partir d’avant-hierFlux principal

Vous pouvez désormais piloter un avion directement dans Google Earth

15 juin 2026 à 11:10

Le 12 juin 2026, Google Earth a rendu accessible sur le web son simulateur de vol, longtemps réservé aux utilisateurs de la version desktop. Si l’outil ne transforme pas le navigateur en cockpit réaliste, il offre une façon amusante de survoler la planète depuis les images 3D du service.

Waymo se rapproche encore plus d’Uber en obligeant ses clients à payer pour avoir une course plus vite

12 juin 2026 à 14:02

Waymo lance une offre de fidélité par abonnement à 30 dollars par mois. Destiné aux clients réguliers de San Francisco, Los Angeles et Phoenix, ce programme baptisé « Waymo Premier » propose des trajets prioritaires et du cashback sur les courses. Une stratégie qui vise à sécuriser des revenus récurrents face à la concurrence indirecte d'Uber et Lyft.

DiffusionGemma : le nouveau modèle de Google écrit son texte d'un bloc, et 4 fois plus vite

12 juin 2026 à 09:32

Plus de 1 000 tokens par seconde sur une seule carte H100, l'accélérateur que Nvidia vend aux centres de données, et environ 700 sur une RTX 5090, sa carte gaming haut de gamme. C'est le débit que Google DeepMind annonce pour DiffusionGemma, son nouveau modèle d'IA ouvert, à peu près quatre fois ce que produisent les modèles Gemma classiques de taille comparable.

Toute la différence se joue dans la façon de générer le texte. Les modèles de langage habituels sont autorégressifs : ils écrivent de gauche à droite, un token à la fois, le token étant le petit morceau de mot que manipule une IA. DiffusionGemma fait tout autrement.

Il travaille comme les générateurs d'images, qui partent d'un nuage de bruit et le débruitent petit à petit jusqu'à la photo demandée. Le modèle pose un canevas de 256 tokens fictifs, repasse dessus plusieurs fois pour affiner ses estimations, puis finalise le bloc entier d'un coup.

Sous le capot, on a un Mixture of Experts de 26 milliards de paramètres, une architecture où seule une petite partie du modèle se réveille à chaque calcul, 3,8 milliards ici. Du coup le tout tient dans 18 Go de mémoire vidéo en version compressée, soit une grosse carte graphique grand public.

L'intérêt en local, c'est que cette approche déplace le goulot d'étranglement de la bande passante mémoire, la vitesse à laquelle la carte lit ses propres données, vers le calcul pur. Dans le cloud, les serveurs mutualisent les requêtes de milliers d'utilisateurs et leurs puces tournent en permanence, alors que votre GPU à la maison passe le plus clair de son temps à attendre les données. La diffusion occupe ces cycles perdus.

Et puis il y a les tâches non linéaires, où l'ordre d'écriture ne suit pas l'ordre de lecture. Google a même affiné une version sur le Sudoku, un casse-tête réputé impossible pour les modèles classiques puisque chaque case dépend de cases pas encore écrites. DiffusionGemma, qui corrige son canevas en continu, atteint 80% de réussite en faisant tomber les étapes de calcul de 48 à 12.

Tout n'est pas rose pour autant. Dans une image, un pixel raté passe inaperçu. Un token mal prédit, lui, peut rendre un paragraphe entier incohérent et forcer à tout recommencer. Et pour une réponse de cinq mots, dégrossir un canevas complet gaspille du calcul. C'est d'ailleurs pour ça que les gros Gemini du cloud n'y passent pas.

Le modèle est expérimental, mais il sort sous licence Apache 2.0, la même que le reste de la famille Gemma 4, donc utilisable commercialement sans restriction. Les poids se téléchargent dès maintenant sur Hugging Face, la plateforme de référence des modèles ouverts, avec une optimisation menée main dans la main avec Nvidia. MLX, l'outil d'Apple pour faire tourner l'IA en local, est aussi de la partie, les Mac sont donc servis.

Si vous voulez mon avis, c'est sur ces modèles locaux que Google est le plus intéressant en ce moment, bien plus que sur Gemini.

Source : ARS Technica

TurboQuant : l’IA fonctionne enfin correctement sur PC et téléphone

Par : Fx
11 juin 2026 à 07:00
TurboQuant vision Google - TurboQuant : l'IA fonctionne enfin correctement sur PC et téléphone

Quand vous utilisez une IA pour analyser un document, générer du code ou simplement discuter, le modèle doit conserver en mémoire tout ce qui a été échangé. Cette mémoire temporaire, appelée cache KV (Key-Value Cache), grossit à mesure que le contexte s’allonge. Le problème, c’est que plus une conversation ou un document est long, plus la consommation de mémoire augmente… Sur les grands modèles de langage (LLM), cela peut rapidement représenter plusieurs Go de RAM (ou de VRAM). Mais les choses évoluent…

TurboQuant vision Google - TurboQuant : l'IA fonctionne enfin correctement sur PC et téléphone

TurboQuant, la solution miracle ?

Tether a publié en open source TurboQuant. Il ne s’agit pas d’une nouvelle IA, mais d’une technologie intégrée capable de réduire jusqu’à 5 fois le besoin de mémoire des LLM. La technique repose sur la quantification : les données en cache prennent moins de place, sans impact sur des capacités du modèle. Dans certains cas, un modèle nécessitant 20 Go de VRAM pourrait fonctionner avec seulement 4 Go et donc faciliter l’exécution de LLM en local : sur un PC, un téléphone, voire un NAS.

TurboQuant apporte également un gain de performances sur les contextes très longs. Tether annonce une accélération comprise entre 15% et 19% pour des fenêtres de contexte allant de 128 000 à 256 000 tokens. En revanche, sur les contextes plus courts, le gain reste marginal…

Google l’a déjà intégré… et les marchés ont tremblé

En avril, Google a annoncé l’intégration de TurboQuant dans Gemini et Gemma 4. L’impact a été immédiat ! Côté bourse, SK Hynix a immédiatement chuté de 6,2 % et Samsung Electronics de 4,8 %, entraînant l’indice KOSPI dans une baisse allant jusqu’à 3 % en séance. Aux États-Unis, Micron a perdu 3,4 %, SanDisk 3,5 %, Western Digital 1,63 % et Seagate 4 %.

Le message des marchés est simple : si les modèles d’IA consomment moins de RAM, la demande en modules mémoires pour DataCenters pourrait chuter. Les cours se sont depuis redressés…

Vers une IA décentralisée

Le PDG de Tether positionne TurboQuant dans une ambition plus large : réduire la dépendance aux Clouds. TurboQuant est intégré au SDK QVAC 0.12.0, qui inclut également la génération vidéo à partir de texte et des fonctions de contrôle robotique. Le package propose un pipeline de quantification complet, des adaptateurs pour les principaux frameworks d’inférence, des profils de déploiement prêts à l’emploi et une documentation développeur. La couche d’exécution repose sur QVAC Fabric, le moteur d’IA local de Tether lancé cette année.

En passant à l’open source, Tether cherche à fédérer une communauté de développeurs autour de sa plateforme et à abaisser la barrière d’entrée pour le déploiement de l’IA.

Gemma 4 QAT : une autre approche complémentaire

TurboQuant n’est pas la seule technique qui pousse dans cette direction. Google vient publier des variantes Gemma 4 QAT (Quantization-Aware Training), une approche différente mais complémentaire. Là où TurboQuant « compresse » la mémoire utilisée pendant l’inférence (le cache KV), la QAT réduit la taille des poids du modèle lui-même, en intégrant la compression directement dans la phase d’entraînement plutôt qu’après coup.

Le modèle apprend à rester précis malgré la compression, au lieu de la subir. Google annonce des performances proches du modèle original en bfloat16, avec une empreinte mémoire drastiquement réduite. Le plus petit modèle de la gamme, le Gemma 4 E2B (pour du texte uniquement), passe sous le 1 Go de RAM ce qui est plutôt bienvenu pour nos téléphones.

En synthèse

TurboQuant est une technologie qui permet aux modèles d’IA de consommer moins de mémoire lorsqu’ils traitent de grandes quantités d’informations, tout en améliorant les performances sur les longs contextes. Elle « compresse » les données temporairement stockées par l’IA afin qu’elles occupent moins d’espace en mémoire. Des approches comme la QAT de Google complètent cette évolution en réduisant la taille des modèles eux-mêmes :! Les 2 techniques sont cumulables et pointent dans la même direction.

Est-ce que la demande en mémoire va baisser ? Très probablement dans les Data Centers, où les besoins en VRAM par modèle pourraient se contracter significativement. À plus long terme, cela pourrait aussi détendre le marché grand public, où les pénuries ont fait grimper les prix des modules DDR5 et LPDDR5. À surveiller également, l’arrivée de CXMT (ChangXin Memory Technologies), fabricant chinois qui monte en puissance et pourrait peser sur les prix indépendamment de l’évolution des usages IA.

Les GAFAM sont morts, vive les MANGOS

10 juin 2026 à 18:30

Et si les GAFAM avaient déjà leur successeur ? Né sur X le 9 juin 2026, le mème « MANGOS » remplace les géants historiques par Meta, Anthropic, Nvidia, Google, OpenAI et SpaceX. Un acronyme rigolo, mais surtout révélateur d’un basculement de la tech.

Gemini en panne : l’IA de Google tourne dans le vide depuis ce midi

10 juin 2026 à 14:12

L'assistant conversationnel de Google connaît depuis le milieu de la journée ce mercredi un dysfonctionnement généralisé. Les utilisateurs signalent en masse des requêtes sans réponse, sans que Google n'ait pour l'heure reconnu l'incident.

Gemini en panne : l’IA de Google tourne dans le vide depuis ce midi

10 juin 2026 à 14:12

L'assistant conversationnel de Google connaît depuis le milieu de la journée ce mercredi un dysfonctionnement généralisé. Les utilisateurs signalent en masse des requêtes sans réponse, sans que Google n'ait pour l'heure reconnu l'incident.

Google Chrome : 74 vulnérabilités patchées, dont une faille zero-day déjà exploitée !

10 juin 2026 à 10:23

Mise à jour Google Chrome : 74 vulnérabilités corrigées, dont la CVE-2026-11645, une faille zero-day déjà exploitée. Voici comment vous protéger.

Le post Google Chrome : 74 vulnérabilités patchées, dont une faille zero-day déjà exploitée ! a été publié sur IT-Connect.

Google et Intel main dans la main sur les puces IA ? Tout ne serait pas aussi facile

Alors que l'annonce d'un contrat massif de 3 millions de puces entre Google et Intel agite le secteur de la tech, les analystes de JPMorgan tempèrent l'enthousiasme général. Selon eux, Intel ne fabriquerait pas réellement les processeurs, mais se contenterait de leur assemblage final, laissant la production stratégique entre les mains de son rival TSMC.

L’article Google et Intel main dans la main sur les puces IA ? Tout ne serait pas aussi facile est apparu en premier sur Tom’s Hardware.

full

thumbnail

Le nouveau Siri expliqué : cinq modèles maison, le vrai rôle de Google Gemini et des GPU Nvidia

9 juin 2026 à 09:55

AFM Core, AFM Core Advanced, AFM Cloud, ADM Cloud et AFM Cloud Pro : Apple ne lance pas un, mais cinq modèles d'IA. Contrairement à ce que beaucoup écrivent, la marque californienne ne se contente pas d'utiliser les modèles Gemini de Google pour son nouvel assistant Siri AI : la réalité est bien plus complexe. Numerama a assisté à plusieurs sessions techniques à Cupertino et vous explique tout.

Ne demandez pas à ChatGPT ou Gemini de restaurer une image vide, ou attendez-vous au pire

8 juin 2026 à 16:38

Un prompt repéré en mai 2026 sur X consiste à demander à ChatGPT de restaurer une image... sans joindre quoi que ce soit. Et les résultats sont tous plus étranges les uns que les autres.

❌
❌