Vue normale

Il y a de nouveaux articles disponibles, cliquez pour rafraîchir la page.
À partir d’avant-hierFlux principal

Réserver son accès à l’IA avant d’en manquer : OpenAI propose de sécuriser sa puissance de calcul à long terme

20 mai 2026 à 13:25

OpenAI propose désormais aux entreprises de réserver sa puissance de calcul sur plusieurs années, une offre qui répond à une pénurie de GPU que la société reconnaît elle-même.

Lemonade - L'IA locale sur NPU AMD, GPU et Mac

Par : Korben ✨
18 mai 2026 à 13:37

Vous n'avez pas de Mac Silicon, mais vous avez vu passer mon article de ce matin sur vLLM-MLX et son serveur d'IA local ? Hé bien bonne nouvelle, je suis tombé ce midi sur Lemonade SDK , un serveur d'IA local communautaire sponsorisé par AMD (et largement codé par leurs ingénieurs), qui joue dans la même cour, mais côté PC + Mac !

C'est la même logique qu'avec vLLM-MLX, vous installez le serveur (un paquet clé en main selon votre OS, pas de bidouille pip), et il expose un endpoint compatible API OpenAI sur http://localhost:13305/api/v1. Vos scripts tapent dessus au lieu d'envoyer vos prompts, et votre pognon, chez OpenAI.

Le démarrage tient en une ligne. Un lemonade run Gemma-4-E2B-it-GGUF lance un modèle, et un lemonade launch claude branche carrément Claude Code sur votre machine.

Sauf que là où vLLM-MLX s'appuie sur MLX pour les puces Apple, Lemonade vise les NPU Ryzen AI et les GPU Radeon. Et c'est tout l'intérêt du truc car depuis la 10.0 sortie en mars, le NPU XDNA2 des machines Ryzen AI récentes sert enfin à faire tourner des LLM sous Linux, et plus juste à décorer la fiche technique !

La 10.5 apporte également 2 nouveautés qui valent le coup. D'abord, le support macOS passe de bêta à officiel. Toutes les grosses fonctions sont validées sur Mac (le texte via llama.cpp et Metal, le reste via les autres moteurs embarqués) et ensuite, ça bascule sur ROCm 7.13 pour llama.cpp et la génération d'images.

J'ai pas de PC Ryzen AI sous la main pour tâter du fameux NPU, donc j'ai fait mes tests sur mon GPU Metal à moi. Notez qu'un lemonade list crache tout le catalogue, Qwen, Gemma, Llama, DeepSeek et compagnie.

Et ça dépote ! Un petit Qwen3-0.6B dans le chat intégré tourne à ~96 tokens par seconde avec mes 32 Go de RAM, c'est donc une réponse quasi instantanée. Après un modèle de 0,6 milliard de paramètres, c'est le poids plume du ring, donc comptez nettement moins sur un gros 8B, mais ça tourne nickel.

Du coup, sur Mac, vLLM-MLX joue la carte du natif Apple via MLX, alors que l'intérêt de Lemonade c'est surtout le cross-plateforme et le NPU Ryzen AI. Et comparé à Ollama , vous gagnez ce NPU mais aussi les fonctions audio (synthèse vocale, transcription) + un gestionnaire graphique de modèles pour piocher vos modèles. Et tout ça est sous licence Apache 2.0.

Bref, que vous soyez team Mac ou team Ryzen, c'est zéro ligne de facture API en fin de mois et surtout vos données qui restent chez vous !

Source : Phoronix

Pour activer ce nouveau pilote graphique libre, il faut littéralement réclamer un pilote cassé

14 mai 2026 à 17:01

Je ne vous apprends rien, un GPU, c'est la puce qui calcule l'image que vous voyez à l'écran. Pour qu'elle fonctionne, il lui faut un pilote, le logiciel qui fait le lien entre le matériel et le système d'exploitation.

Sur les puces Arm Mali, qu'on retrouve dans des tas de smartphones et de cartes type Raspberry Pi, Arm ne fournit pas de pilote libre. Du coup une bande de développeurs a monté Panfrost, un pilote libre reconstruit en grande partie par reverse-engineering, c'est-à-dire en observant le comportement du matériel pour deviner comment il marche.

Panfrost et son cousin PanVK, la version dédiée à Vulkan (l'interface graphique moderne pour les jeux et les applications 3D), viennent de prendre en charge le Mali G1 Pro. C'est le GPU le plus récent d'Arm, basé sur l'architecture maison baptisée "v14". Jusqu'ici, le haut du panier supporté s'arrêtait au Mali-G725 sorti en 2024. Le support arrivera officiellement avec Mesa 26.2, la prochaine grosse version de la bibliothèque graphique libre, attendue le trimestre prochain.

Pour comprendre pourquoi c'est un gros sujet, il faut savoir qui utilise Panfrost. Tous ceux qui font tourner Linux sur du matériel Arm, des cartes de bricolage aux ordinateurs portables ou aux téléphones reconvertis, en dépendent pour avoir une accélération graphique digne de ce nom.

Sans ces pilotes libres, ce matériel reste à moitié aveugle côté affichage. Que le projet suive d'aussi près les puces les plus récentes d'Arm, c'est donc tout sauf un détail.

Attention quand même, on est très loin d'un truc fini. Les tests sont encore limités, des morceaux peuvent manquer ou être carrément cassés. Et les développeurs ne s'en cachent pas : pour activer le pilote Vulkan sur ces nouvelles puces, il faut passer par une variable d'environnement nommée, je vous jure que c'est vrai, PAN_I_WANT_A_BROKEN_VULKAN_DRIVER=1. Soit "je veux un pilote Vulkan cassé" en français. Difficile d'être plus honnête.

Côté modèles, le G1 Pro est pris en charge mais ses grands frères, les G1-Premium et G1-Ultra, ne sont pas encore de la partie. Ça viendra sûrement, c'est souvent comme ça que le projet avance : une puce après l'autre, à mesure que le reverse-engineering progresse et que les développeurs comprennent les entrailles de chaque nouvelle architecture.

Source : Phoronix

ffmpeg-over-ip - Le transcodage GPU distant pour Jellyfin

Par : Korben ✨
4 mai 2026 à 16:15

Jellyfin sans GPU, c'est la croix et la bannière dès que quelqu'un lance un film en 4K. Mais c'était sans compter sur ffmpeg-over-ip qui est capable de transformer un serveur équipé d'un GPU en endpoint de transcoding distant, accessible via un simple binaire qui se fait passer pour ffmpeg. Y'a pas de passthrough GPU, ni besoin de vous lancer dans la config de point de montage réseau exotique.

Le principe c'est que le client reçoit les commandes ffmpeg de Jellyfin (ou Emby), les sérialise et les envoie ensuite via TCP (port 5050) vers un serveur qui lui dispose d'un bon GPU. Et côté Jellyfin, rien ne change puisque le binaire répond exactement comme ffmpeg le ferait (et je vous rassure, y'a un peu d'authentification pour éviter de vous faire squatter votre serveur de transcoding à l'insu de votre plein gré).

Alors imaginons un peu dans quelle situation ça peut être utile... Par exemple, vous pourriez avoir un NUC ou mini-PC tout neuf qui fait tourner Jellyfin dans Docker, et à côté une vieille tour avec une GTX qui traîne dans un coin pour le transcodage. L'avantage c'est que plusieurs clients peuvent ainsi partager le même serveur GPU en parallèle, donc ffmpeg-over-ip peut valoir le coup si vous avez du matériel qui dort dans un coin.

L'outil est signé Anees Iqbal (steelbrain) et voici comment l'installer (pensez à vérifier le contenu du .sh avant) :

curl -fsSL https://ffmpeg-over-ip.com/install-client.sh | sh

Windows a aussi droit à son équivalent PowerShell si vous voulez.

Pour brancher ça sur Jellyfin ensuite, c'est direction Dashboard → Playback → chemin ffmpeg → et faites pointer vers ffmpeg-over-ip-client. Notez que ffprobe doit aussi être redirigé car Jellyfin l'appelle séparément pour les métadonnées. Vous pouvez faire un lien symbolique pour être tranquille :

ln -s ffmpeg-over-ip-client ffprobe

Et ensuite, pour vérifier, cette commande : ./ffmpeg-over-ip-client -version devrait vous retourner les infos de l'instance ffmpeg distante. Si ça répond, c'est que c'est bon !

Notez que la config permet de passer par des variables d'environnement du genre FFMPEG_OVER_IP_CLIENT_ADDRESS pour l'adresse du serveur, FFMPEG_OVER_IP_CLIENT_AUTH_SECRET pour la clé HMAC. Et pour tout ce qui est paramètres avancés, disons que les remappings de filtres complexes qu'on peut faire avec ffmpeg nécessitent encore un fichier .jsonc à créer et paramétrer.

Côté serveur, les accélérations supportées sont : NVENC (NVIDIA), QSV (Intel), VAAPI (Linux), AMF (AMD), VideoToolbox (macOS). Et comme c'est basé sur jellyfin-ffmpeg, du coup y'a toutes les accélérations habituelles sans avoir à recompiler.

Par contre, attention si le serveur GPU tombe, y'aura aucun fallback automatique vers le CPU local. Et si votre réseau interne est en 100Mbps et que vous transcodez du 4K HEVC, le goulot d'étranglement sera le transit réseau, pas le GPU. Donc optez pour un réseau en gigabit minimum dans ce cas.

Bref, c'est simple, propre, et très bien pensé par exemple pour les setups Docker qui n'ont pas d'accès direct au matériel.

Super ZSNES - les devs originaux reviennent après 19 ans

Par : Korben ✨
28 avril 2026 à 11:20

J'sais pas si vous avez remarqué, mais aujourd'hui, TOUT LE MONDE "vibe code" : On balance des prompts à un LLM, on accepte le diff sans comprendre, on commit sans relire et tadaaaa, ça fait des chocapics !

Sauf pour zsKnight et Demo qui viennent de relâcher Super ZSNES , après 19 ans de silence, avec un message bien en évidence sur leur page d'accueil... "No Vibe Coding. Classic development style." C'est incroyable, les deux développeurs originaux de ZSNES se sont enfin retrouvés pour réécrire leur émulateur SNES légendaire intégralement, et cette fois c'est le GPU qui prend en charge le rendu vidéo !! Youpi !

Pour ceux qui n'ont pas connu parce que ce sont des bébés qui viennent de naître, sachez que ZSNES c'était l'émulateur Super Nintendo incontournable de la fin des années 90, écrit totalement en assembleur x86 par zsKnight, avec Demo en renfort sur le son et la 2D. À l'origine, la première version, sortie en octobre 1997 sur DOS, tournait à plein régime sur des Pentium MMX, ce qui était déjà assez ouf à l'époque. Et la dernière mise à jour officielle datait de janvier 2007 et après ça, plus RIEN.:-(( sniiif... Le projet était donc considéré comme mort et enterré malgré quelques forks communautaires qui ont essayé de garder le truc en vie.

Mais voilà, ils sont de retour et ce qui change avec ce Super ZSNES, c'est l'architecture. En gros, au lieu de tout faire faire au CPU comme à l'époque, le rendu vidéo et le pipeline graphique sont maintenant déportés sur le GPU.

Du coup le Mode 7 peut tourner en haute résolution, vous pouvez activer le widescreen quand le jeu le permet, overclocker ceux qui galéraient en framerate (coucou Gradius III), remplacer les samples audio compressés par des versions non compressées, et même balancer du 3D height-mapped sur les scènes en Mode 7 perspective.

Tout ça jeu par jeu, via leur Super Enhancement Engine qui supporte 7 jeux pour l'instant et qui s'enrichira au fil des releases. Après si vous préférez jouer sur vos vraies cartouches plutôt que sur des ROMs, jetez quand même un oeil à SN Operator que j'ai couvert récemment.

Les CPU et audio cores sont annoncés comme bien plus précis que ceux de l'original, qui était connu pour être rapide mais pas hyper fidèle. L'UI conserve la neige qui tombe en arrière-plan, parce que faut pas déconner avec les classiques, mais en HD cette fois. Save states, rewind, fast forward, cheat codes, save bookmarks, auto-save history, quick load, tout y est. C'est dispo sur Windows, Mac, Linux et Android (Google Play), avec une version iOS qui suivra bientôt.

Cela dit, le projet est en early build donc si vous comptez l'utiliser pour vos jeux fétiches, sachez que le DSP1 et SuperFX ne sont pas encore implémentés. Donc oubliez Star Fox et Super Mario Kart pour l'instant, et puis n'oubliez pas que des bugs d'émulation traînent encore, et que pas mal d'optimisation reste à faire.

Avec toutes les options activées en 4K, ça peut surtout mettre à genoux un Mac Studio M4 Max, donc voilà, ce Super Enhancement Engine, ça pompe sec. Côté qualité visuelle, certains rendus de textures laissent également à désirer d'après les premiers retours, sauf le bump mapping 3D sur F-Zero qui semble plaire à pas mal de monde.

Reste à voir si d'autres projets comme Nesticle et Genecyst vont suivre le mouvement, parce que la nostalgie 90s est à fond les manettes en ce moment. Et surtout, y'a encore pas mal de marge à côté des solutions web pour jouer aux jeux rétro qui se multiplient comme des petits pains.

A tester ici !

Please Power Down And Connect The PCIe Power Cables: Fixed on Windows 11

12 février 2024 à 13:04

While using your computer, did you run into the message Please power down and connect the PCIe cables? Most times, this message indicates a power mismatch for your graphics card. You may experience a sudden crash before you get this error message.

This is a problem some of our readers have encountered, and we will help you walk through fixing it in this comprehensive guide.

1. Change the Power Connection for the Graphics Card

Changing the power connection that goes into your graphics card is essential when you change your graphics card. This is because a less powerful power cable may have powered the old graphics card, hence a mismatch for the new unit.

If you also purchased a new power supply, ensure it powers your graphics card directly. If you do not know how the internal workings of your PC are done, you may have to seek help from a technician.

2. Power the Graphics Card with a PCIe connector, not a CPU Connector

The problem with powering your graphics card is that the CPU connector looks very similar to the PCIe connector in most instances. In fact, it may fit properly and click, but it would not have enough power to run it.

3. Ensure all the Connectors are Making Contact

When you get the error message: Please power down and connect the PCIe power cables, you should check for contact. This is even more important if you use a spit connector.

Even though you have used the correct kind of connectors, there are chances that some pins have not made contact. You may need to reconnect them inverted. Once there is proper contact, the power problem should be solved.

4. Upgrade your Power Supply

In the past, you would have gotten away with 250 or 400 Watts, but more recent graphics cards require much more power, and you will keep experiencing the problem until you upgrade to a newer and more powerful power supply.

You should note that some graphics cards will now require as much as 1000 watts.

What Are PCIe Power Cables, and Why Are They Necessary?

We have discussed the video card problem, and most solutions refer to your connector or cables. You may be wondering what these PCIe cables are.

These cables supply power from the PSU (Power Supply Unit) to a PCIe device, such as graphics cards, sound cards, and expansion cards.

In most cases, these devices will have a higher requirement than the motherboard can supply through the PCIe slot. With PCIe cables, the needed devices get the required power and can function optimally.

You should know more about your Graphics card to know what connectors it may need.

Please Power Down And Connect The PCIe Power Cables: Fixed

You should have successfully fixed the power and video card problem with the solutions we have explored. All the solutions would require some technical knowledge, so you may also consider contacting a technician if you have no experience with opening up a computer.

FAQ

Is it safe to connect PCIe power cables while my computer is running?

No, while your computer is operating, connecting or unplugging PCIe power cords is unsafe. Always turn off your system entirely before performing any hardware modifications to protect your components and your safety.

How do I know if my device requires PCIe power cables?

To determine if your equipment needs PCIe power cords, look up the specs or consult the user manual. Furthermore, your device probably needs more power from PCIe cables if you experience performance problems or error warnings about low power.

The post Please Power Down And Connect The PCIe Power Cables: Fixed on Windows 11 appeared first on Next of Windows.

❌
❌