Nemotron 3 - Nvidia débarque dans l'open source et crache du token comme jamais

16 décembre 2025 à 12:42

Vous voulez faire tourner un modèle d'IA en local sans avoir besoin d'un serveur de la NASA ? Eh bien Nvidia vient de lâcher une bombe avec Nemotron 3, une famille de modèles open source plutôt impressionnant et surtout, ils ont publié leurs données d'entraînement afin de jouer la transparence totale. Chapeau !

Le modèle phare de cette nouvelle famille s'appelle Nemotron 3 Nano et c'est un modèle de 30 milliards de paramètres, mais attention, il n'en active que 3,5 milliards à la fois grâce à une architecture hybride qui mélange du Mamba-2 et du Mixture-of-Experts ( MoE ). Ça permet de garder des performances de ouf tout en restant léger niveau ressources.

Sous le capot, Nvidia a également mis le paquet puisque le modèle a été entraîné sur 25 trillions de tokens. J'ai bien dit "trillions"... Pour vous donner une idée, les données d'entraînement incluent du Common Crawl de 2013 à 2025, du code dans 43 langages différents, des articles scientifiques, et une tonne de données synthétiques générées par d'autres modèles. Et tout ça, Nvidia l'a rendu public donc vous pouvez télécharger les datasets sur Hugging Face et vérifier par vous-même ce qui a servi à entraîner le bouzin.

Côté performances, Nemotron 3 Nano se défend plutôt bien . Sur les benchmarks de raisonnement mathématique comme AIME25, il atteint 99,2% quand on lui donne accès à des outils. Sur le coding avec LiveCodeBench, il tape du 68,3%, ce qui le place devant Qwen3-30B. Et pour les tâches d'agent logiciel genre SWE-Bench, il monte à 38,8%. Pas mal pour un modèle qu'on peut faire tourner sur du matos grand public.

D'ailleurs, parlons du matos justement. Nemotron 3 Nano tourne sur des cartes comme la H100, la A100, ou même la future RTX PRO 6000 et supporte jusqu'à 1 million de tokens en contexte si vous avez assez de VRAM. Et niveau vitesse, Nvidia annonce un débit de tokens 4 fois supérieur à la génération précédente, avec 60% de tokens de raisonnement en moins. C'est donc exactement ce que tout le monde demande à saoir du token qui sort vite pour les workflows agentiques.

Maintenant, pour l'utiliser, c'est hyper simple. Il est dispo sur Hugging Face, et vous pouvez le lancer avec Transformers, vLLM, TensorRT, ou même llama.cpp. Y'a même un mode "thinking" qu'on peut activer ou désactiver selon si on veut du raisonnement poussé ou des réponses rapides.

Pour ma part, je l'ai testé à l'aide d'Ollama comme ceci :

ollama run nemotron-3-nano:30b

J'ai trouvé que vitesse de génération était vraiment impressionnante, ça débite beaucoup plus qu'un Llama 3 qui est de taille équivalente. Après, je suis sur un Mac M4 avec 128 Go de RAM, donc je suis plutôt bien loti mais j'ai trouvé ce modèle vraiment très rapide. Je pense que je vais vraiment m'en servir pour des trucs comme de la qualification, du résumé, de l'analyse ce genre de choses.

A voir maintenant si en français il s'en sort bien sur les tournures de phrases. Quoi qu'il en soit pour du développement et des workflows agentiques, il n'y a pas photo, ça va être mon nouveau modèle par défaut quand j'ai besoin de choses en local.

La famille Nemotron 3 ne se limite pas au Nano évidemment. Y'a aussi le Super avec environ 100 milliards de paramètres pour les applications multi-agents, et l'Ultra avec 500 milliards pour les tâches vraiment complexes. Ces deux-là arriveront au premier semestre 2026 donc faudra encore être un peu patient. Nvidia a aussi sorti des bibliothèques comme NeMo Gym pour l'entraînement et NeMo RL pour le fine-tuning.

Jensen Huang, le patron de Nvidia, a aussi dit un truc intéressant lors de l'annonce : "L'innovation ouverte est le fondement du progrès de l'IA." Venant d'une boîte qui a longtemps joué la carte proprio sur ses technos, je trouve que c'est un sacré virage et des entreprises comme Accenture, Deloitte, Oracle, Palantir, ou même Cursor sont déjà en train d'intégrer Nemotron dans leurs produits.

Ce qui est cool aussi, c'est que le modèle supporte 24 langues officielles de l'UE plus une dizaine d'autres comme l'arabe, le chinois ou le japonais et côté code, il gère Python, C++, Java, Rust, Go, et même du CUDA. Bref, c'est plutôt polyvalent.

Voilà, donc si vous cherchez un modèle open source sérieux avec des données d'entraînement transparentes et une vitesse de génération qui arrache, Nemotron 3 Nano mérite clairement le coup d’œil !

Source

Les meilleures cartes graphiques de 2025

GinjFo

Jérôme Gianoli

16 décembre 2025 à 09:20

Les meilleures cartes graphiques de 2025 Entre pénuries, hausses de prix et choix stratégiques, le marché des cartes graphiques en 2025 a profondément évolué. Bilan de la situation

Cet article Les meilleures cartes graphiques de 2025 a été publié en premier par GinjFo.

GeForce RTX 5070 (Ti), les prix augmentent la situation se complique

GinjFo

Pascal

15 décembre 2025 à 16:25

GeForce RTX 5070 Ti Vanguard SOC La situation du marché des cartes graphiques commence à inquiéter, avec les premiers signes tangibles de hausses de prix. Elles rappellent de mauvais souvenirs aux joueurs.

Cet article GeForce RTX 5070 (Ti), les prix augmentent la situation se complique a été publié en premier par GinjFo.

Nvidia va vendre ses puces H200 en Chine : comment expliquer le revirement de Donald Trump ?

Numerama

Lisa Imperatrice

9 décembre 2025 à 11:35

Coup de théâtre dans la guerre des semi-conducteurs : Donald Trump a donné le 8 décembre 2025 son feu vert à l’exportation des H200 de Nvidia vers la Chine. Une ouverture inattendue, qui pourrait bien rebattre les cartes pour les deux camps.

NVIDIA met fin au support Game Ready des GeForce GTX 900 et GTX 10

GinjFo

Jérôme Gianoli

3 décembre 2025 à 15:19

Pilotes graphiques GeForce Les GeForce GTX 900 et GTX 10 ne recevront plus de pilotes Game Ready. NVIDIA entame leur dépréciation mais continuera d’assurer des mises à jour de sécurité.

Cet article NVIDIA met fin au support Game Ready des GeForce GTX 900 et GTX 10 a été publié en premier par GinjFo.

Steam, la RTX 5070 s’impose mais les RTX 50 peinent à convaincre

GinjFo

Jérôme Gianoli

3 décembre 2025 à 11:02

Aorus GeForce RTX 5070 Master La RTX 5070 de NVIDIA grimpe dans le classement de l’enquête matérielle Steam et dépasse la RTX 4070. La série RTX 50 s’impose,

Cet article Steam, la RTX 5070 s’impose mais les RTX 50 peinent à convaincre a été publié en premier par GinjFo.

Carte graphique, Nvidia recule et Intel franchit la barre des 1 %

GinjFo

Jérôme Gianoli

2 décembre 2025 à 10:49

Carte graphique Arc B580 Limited Edition d'Intel Intel dépasse pour la première fois 1 % de part de marché sur le marché des cartes graphiques. Nvidia et AMD dominent le marché.

Cet article Carte graphique, Nvidia recule et Intel franchit la barre des 1 % a été publié en premier par GinjFo.

Nvidia s’effrite sur la vente de cartes graphiques, mais écrase toujours la concurrence

Tom’s Hardware : actualités matériels et jeux vidéo

Charles Gouin-Peyrot

2 décembre 2025 à 09:29

Au troisième trimestre 2025, AMD et Intel ont légèrement augmenté leurs parts de marché dans le segment des cartes graphiques dédiées, tandis que NVIDIA recule de deux points tout en conservant 92% du marché.

L’article Nvidia s’effrite sur la vente de cartes graphiques, mais écrase toujours la concurrence est apparu en premier sur Tom’s Hardware.

ventes-cartes-graphiques-intel-nvidia-amd — full

Nvidia change de cap, son PDG a une demande spéciale envers les équipes

Tom’s Hardware : actualités matériels et jeux vidéo

Charles Gouin-Peyrot

1 décembre 2025 à 07:32

Jensen Huang demande impérativement à ses employés d'automatiser toutes les tâches possibles via l'intelligence artificielle, tout en assurant que la forte croissance des effectifs de Nvidia garantit la sécurité de l'emploi.

L’article Nvidia change de cap, son PDG a une demande spéciale envers les équipes est apparu en premier sur Tom’s Hardware.

NVIDIA-CEO-Jensen-Huang-GeForce-RTX-3080 — full

Pénurie, Nvidia envisage de vendre des GPU sans mémoire

GinjFo

Jérôme Gianoli

27 novembre 2025 à 16:17

ROG Astral GeForce RTX 5080 OC Edition Face à une pénurie mondiale de mémoire, NVIDIA envisagerait de ne plus fournir de kits GPU+mémoire à ses partenaires laissant aux fabricants la responsabilité d’acheter eux-mêmes la VRAM.

Cet article Pénurie, Nvidia envisage de vendre des GPU sans mémoire a été publié en premier par GinjFo.

Carte graphique, les ventes augmentent et AMD gagne du terrain !

GinjFo

Jérôme Gianoli

26 novembre 2025 à 07:29

Radeon RX 7900 XTX d'AMD Les ventes mondiales de GPU repartent à la hausse en 2025, avec une croissance de 2,5 % ce trimestre et un gain notable de parts de marché pour AMD

Cet article Carte graphique, les ventes augmentent et AMD gagne du terrain ! a été publié en premier par GinjFo.

GDDR7, Samsung franchit la barre des 36 Gbps

GinjFo

Jérôme Gianoli

25 novembre 2025 à 15:50

GDDR7 Samsung teste des modules GDDR7 à 36 Gbps, une vitesse record destinée aux futures cartes graphiques. NVIDIA prépare sa gamme RTX 50 SUPER

Cet article GDDR7, Samsung franchit la barre des 36 Gbps a été publié en premier par GinjFo.

Quatre hommes inculpés aux États-Unis pour trafic de puces servant à l’IA

Cyberguerre

Eitanite Bellaiche

25 novembre 2025 à 11:25

Les autorités américaines ont mis en examen quatre hommes accusés d’avoir monté, entre 2023 et 2025, un circuit de contrebande de puces d’IA Nvidia vers la Chine en s’appuyant sur une fausse société immobilière et des documents douaniers falsifiés. Ils risquent jusqu’à 20 ans de prison.

Pourquoi le trimestre de Nvidia confirme l’ancrage durable de l’IA

Tom’s Hardware : actualités matériels et jeux vidéo

Charles Gouin-Peyrot

21 novembre 2025 à 08:27

Nvidia enregistre un trimestre marqué par une forte demande en solutions d’intelligence artificielle, portée notamment par ses plateformes de calcul et la croissance continue des data centers.

L’article Pourquoi le trimestre de Nvidia confirme l’ancrage durable de l’IA est apparu en premier sur Tom’s Hardware.

Nvidia publie en urgence les GeForce Hotfix Driver 581.94, quoi de neuf ?

GinjFo

Jérôme Gianoli

20 novembre 2025 à 10:53

GeForce Hotfix Driver de Nvidia NVIDIA déploie un pilote Hotfix pour corriger les baisses de performances liées à la mise à jour Windows 11 d’octobre 2025.

Cet article Nvidia publie en urgence les GeForce Hotfix Driver 581.94, quoi de neuf ? a été publié en premier par GinjFo.

Samsung et Nvidia s’associent pour construire une « mégafabrique » d’IA équipée de 50 000 GPU

Tom’s Hardware : actualités matériels et jeux vidéo

Charles Gouin-Peyrot

4 novembre 2025 à 08:37

Samsung et Nvidia annoncent la création d’une mégafabrique d’intelligence artificielle équipée de 50 000 GPU afin d’améliorer la production de puces et renforcer leur coopération technologique.

L’article Samsung et Nvidia s’associent pour construire une « mégafabrique » d’IA équipée de 50 000 GPU est apparu en premier sur Tom’s Hardware.

Cette carte graphique Nvidia est quasiment irréparable et agace les réparateurs

Tom’s Hardware : actualités matériels et jeux vidéo

Charles Gouin-Peyrot

27 octobre 2025 à 07:02

La NVIDIA RTX 5090 Founders Edition est critiquée par les experts en réparation pour son design interne complexe et fragile, rendant toute intervention risquée et la carte souvent irréparable en cas de dommage, faute de pièces détachées disponibles.

L’article Cette carte graphique Nvidia est quasiment irréparable et agace les réparateurs est apparu en premier sur Tom’s Hardware.

Nvidia RTX 50 Super : voici quand le fabricant devrait annoncer ses prochains GPUs

Tom’s Hardware : actualités matériels et jeux vidéo

Charles Gouin-Peyrot

29 septembre 2025 à 11:54

Les RTX 50 SUPER (18 Go pour la 5070 Super, 24 Go pour la 5070 Ti Super) pourraient sortir entre mars et mai 2026, selon des rumeurs non confirmées par NVIDIA.

L’article Nvidia RTX 50 Super : voici quand le fabricant devrait annoncer ses prochains GPUs est apparu en premier sur Tom’s Hardware.

OpenAI et Nvidia signent un accord colossal : 100 milliards pour accélérer la révolution de l’IA

Tom’s Hardware : actualités matériels et jeux vidéo

Charles Gouin-Peyrot

23 septembre 2025 à 07:15

OpenAI et NVIDIA ont annoncé un partenariat stratégique de 100 milliards de dollars pour déployer 10 gigawatts de puissance de calcul via la plateforme Vera Rubin dès 2026, marquant une étape majeure dans le développement des infrastructures d’intelligence artificielle.

L’article OpenAI et Nvidia signent un accord colossal : 100 milliards pour accélérer la révolution de l’IA est apparu en premier sur Tom’s Hardware.

Vue lecture