Vue lecture

Il y a de nouveaux articles disponibles, cliquez pour rafraîchir la page.

La Fnac brade cette carte microSD Express pour Nintendo Switch 2

[Deal du jour] Si vous craignez de manquer de place sur votre Switch 2, c’est peut-être le moment idéal d'étendre votre stockage pour profiter des futures sorties sans avoir à supprimer constamment des jeux de votre bibliothèque. La Fnac vous a entendu : l’e-commerçant propose actuellement la Lexar Play Pro microSDXC Express en promo.

Aoostar WTR Max INTEL i5 VERSION Revealed

Aoostar WTR Max… but with an Intel i5 Now

The Aoostar WTR Max Intel version is best understood, at least at this stage, as an early preview of a known NAS design rather than a finished retail product. The unit sent to me appears to retain the same general WTR Max concept as the earlier 2025 model, built around a compact 6-bay SATA layout plus 5 M.2 NVMe slots, while replacing the Ryzen 7 8845HS used in the current WTR Max 8845 with Intel’s Core i5-1235U. That CPU change is significant because these 2 processors target different kinds of systems: the Ryzen 7 8845HS is an 8-core, 16-thread chip with a 45W default TDP and boost speeds up to 5.1GHz, whereas the Core i5-1235U is a 10-core, 12-thread Alder Lake-U part with 2 performance cores, 8 efficiency cores, a 15W processor base power, and a launch date going back to Q1 2022. On paper, that makes the Intel version a potentially more efficiency-focused or cost-focused variation of the same platform, rather than a direct step up from the AMD model. That distinction matters, because this is not yet a product with confirmed pricing, confirmed availability, or a final release timetable, so the more useful question at this stage is not whether it definitively replaces the existing WTR Max 8845, but whether Aoostar is preparing to turn this chassis into a broader platform with multiple hardware tiers built around different CPUs and buyer priorities.

If this version works as intended, its appeal is fairly easy to understand even before full launch details are known. The original WTR Max formula already stands out because it combines high drive density, modern external connectivity, and small-footprint DIY NAS flexibility in a way that relatively few systems currently do, and an Intel alternative could broaden that appeal for buyers who prefer Intel media features, lower-power mobile silicon, or simply a lower entry point than the Ryzen-based model if Aoostar prices it accordingly. At the same time, this remains a first look at hardware provided by the brand, not a final buying recommendation. Until Aoostar confirms retail positioning, regional availability, and exact specifications for this Intel edition, it makes more sense to treat the device as an interesting platform variation with clear practical potential, rather than a confirmed replacement for the existing AMD version already listed by Aoostar at $669 in its current storefront


The Aoostar WTR MAX Nas is available from the following places:
  • Aoostar WTR Max NAS $699 on Amazon – HERE
  • Aoostar WTR Max NAS $679 on Official Site – HERE
  • Aoostar R1 N150 2-Bay NAS $179 – HERE
  • Aoostar R7 4-Bay NAS $419 – HERE
  • Aoostar R7 2-Bay 5825U NAS $399 – HERE
  • Aoostar Oculink 800W ePCIe Docking Station $169 – HERE
  • Aoostar GEN12 Gen4 PC $374 on AliExpress – HERE

Aoostar WTR Max Intel Version – Storage

The storage layout appears to be unchanged from the earlier WTR Max 8845 design. Physically, this platform combines 6 SATA drive bays with 5 M.2 2280 NVMe slots, giving it a mixed storage approach that is more flexible than most compact DIY NAS systems in the same size class. Aoostar’s official specification for the current WTR Max 8845 lists support for up to 6 x 24TB SATA HDDs and 5 NVMe SSDs, with the M.2 allocation split across PCIe 4.0 x2 and PCIe 4.0 x1 links rather than giving every slot the same bandwidth. In practical terms, that matters less for bulk storage and more for how the system is likely to be used: large-capacity SATA bays can be assigned to primary data, backup, or archive duties, while the NVMe slots are better suited to cache, application storage, containers, VMs, or high-speed working data. For a NAS aimed at users choosing their own OS and storage strategy, that mixed topology is one of the main reasons the WTR Max platform is notable in the first place.

The Intel Core i5-1235U is also a sensible fit for this kind of storage-heavy design because, like the Ryzen 7 8845HS used in the existing AMD version, it supports up to 20 PCIe lanes and PCIe 4.0 connectivity. That does not automatically mean the Intel model will perform identically in every storage scenario, because lane routing, controller choice, and motherboard implementation still determine how those lanes are divided between SATA, NVMe, USB4, OCuLink, and networking. Even so, on an early preview basis, the key point is that Aoostar does not appear to have changed the overall storage proposition of the WTR Max by moving to Intel. The appeal here remains the same: this is a compact chassis that can hold a large amount of slower capacity storage alongside a meaningful amount of flash storage, which makes it suitable for users who want both traditional NAS volume space and a faster SSD tier in the same enclosure.

Aoostar WTR Max Intel Version – Ports and Connections

The Aoostar WTR Max platform is already unusually well equipped on connectivity, and the Intel preview unit appears to preserve that same approach. On the currently listed WTR Max 8845 model, Aoostar specifies 2 x 10GbE SFP+ ports based on the Intel X710 controller, alongside 2 x 2.5GbE LAN ports, 1 x USB4 port, 1 x OCuLink port, 2 x USB 3.2 Gen 2 ports, 1 x USB 3.2 Gen 1 port, 1 x Type C port, 1 x HDMI output, a 3.5mm audio jack, a microSD card slot, and DC input. In practical terms, that gives the system a broader mix of storage, networking, and external expansion connectivity than most compact DIY NAS solutions, especially once the dual 10GbE and OCuLink are factored in. For an early preview, that matters because the appeal of the Intel version is not just the CPU change itself, but the fact that Aoostar seems to be pairing that CPU with the same high-connectivity platform rather than trimming the I/O to create a lower-tier model.

From the CPU side, the Core i5-1235U also makes sense in a system that leans heavily on external I/O. Intel’s official specifications list support for Thunderbolt 4 and PCIe 4.0, which aligns well with the inclusion of USB4 and helps explain why this processor can still fit into a NAS design with multiple high-bandwidth ports despite being a lower-power mobile chip. By comparison, the Ryzen 7 8845HS used in the current AMD version is the stronger processor in raw core configuration and sustained power class, but the Intel option may still hold practical appeal for buyers who place more value on Intel platform familiarity, media handling, or a potentially lower-cost entry point into the same chassis.

At this stage, though, the key observation is simply that Aoostar does not appear to have repositioned the WTR Max Intel model as a cut-down connectivity variant. Based on the preview hardware and the existing WTR Max specification, this still looks like a NAS platform built around unusually broad networking and expansion options first, with the CPU choice acting as the variable element.

Aoostar WTR Max Intel Version – Internal Hardware

Internally, the previewed WTR Max Intel unit appears to follow the same motherboard and chassis logic as the existing AMD-based design, with the main change being the move to Intel’s Core i5-1235U. That processor combines 10 cores and 12 threads in a hybrid layout made up of 2 performance cores and 8 efficiency cores, supports PCIe 4.0, and provides up to 20 PCIe lanes to distribute across storage, networking, and external expansion.

*Thanks to TechnicalCity and Nanoreview for their comparisons of these two processors

Category

 

Intel Core i5-1235U

AMD Ryzen 7 8845HS

Release date 23 February 2022 6 December 2023
Segment Laptop Laptop
Architecture Alder Lake-U Hawk Point-HS / Zen 4
Cores / Threads 10 / 12 8 / 16
Core layout 2 P-cores + 8 E-cores 8 cores
Base clock 1.3 GHz 3.8 GHz
Boost clock 4.4 GHz 5.1 GHz
L3 cache 12 MB 16 MB
Process node Intel 7 / 10 nm class 4 nm
TDP 15 W 45 W
PCIe version PCIe 4.0 PCIe 4.0
PCIe lanes 20 20
Supported memory DDR4, DDR5 DDR5
Max memory 64 GB 256 GB
Memory channels 2 2
ECC support No No
Integrated graphics Intel Iris Xe Graphics Radeon 780M
iGPU performance 1.5 TFLOPS 4.1 TFLOPS
Quick Sync Video Yes No
Aggregate score 7.24 16.24
NanoReview final score 45/100 63/100
Single-core score 63 73
Multi-core score 19 43
Power efficiency score 58 75
Integrated graphics score 40 81
Cinebench R23 Single 1640 1775
Cinebench R23 Multi 6601 16232
Cinebench 2024 Single 98 100
Cinebench 2024 Multi 368 893
Geekbench 6 Single 2089 2580
Geekbench 6 Multi 6362 13018
PassMark Single 3106 3734
PassMark Multi 12713 28449
Blender CPU 80.33 205.32

It also supports up to 64GB of memory officially on Intel’s own specification pages, across 2 channels, and does not list ECC memory support. By comparison, the Ryzen 7 8845HS commonly associated with this class of WTR Max hardware is an 8-core, 16-thread processor with PCIe 4.0, 20 usable PCIe lanes, support for DDR5-5600, and a much higher maximum supported memory capacity on AMD’s specification sheet. In simple terms, the Intel version looks less like a redesign of the platform and more like a rebalancing of it, using a lower-power mobile CPU that still has enough I/O resources to support the dense hardware layout that defines the WTR Max.

That internal trade-off is likely where the Intel model will either make sense or not, depending on the intended workload. The Ryzen 7 8845HS remains the stronger chip on paper for sustained multi-threaded tasks, heavier virtualization, and broader memory headroom, while the Core i5-1235U shifts the system toward a more efficiency-oriented profile and brings Intel’s integrated graphics stack into the equation. For a NAS like this, that could matter for media-focused deployments, lighter VM use, or users who simply prefer Intel’s platform characteristics, but it also means the Intel version should not automatically be viewed as equivalent to the AMD model in raw processing terms.

It is also worth noting that Aoostar’s current public WTR Max 8845 materials refer to the retail model as using a Ryzen 7 PRO 8845HS rather than the standard Ryzen 7 8845HS, which suggests the final retail naming and CPU positioning around this series may still vary depending on region or configuration. As an early preview, the most accurate conclusion is that the internal hardware remains recognisably WTR Max in structure, but the CPU choice changes the expected character of the system more than the exterior suggests.

Aoostar WTR Max Intel Version – Price, Launch Date, More?

At the time of writing, Aoostar has not publicly listed this Intel Core i5-1235U version of the WTR Max on its storefront, so price, release date, and regional availability remain unconfirmed. By contrast, the currently listed WTR Max 8845 is shown on Aoostar’s site at $669, reduced from $699, and the product naming has shifted to specifically identify that model as the WTR Max 8845 rather than simply the WTR Max. That naming detail is relevant because it suggests Aoostar may be preparing the chassis for more than 1 CPU configuration, even if the Intel variant has not yet been formally announced. The Core i5-1235U itself is not a new processor, having launched in Q1 2022 with a 15W processor base power, while the Ryzen 7 8845HS used in the 2025 WTR Max model is a newer and higher-power chip with an 8-core, 16-thread design and a 45W default TDP. Taken together, that makes the Intel preview unit look less like a replacement for the existing AMD version and more like a possible alternative tier within the same product family.

The more important question is what Aoostar intends to do with this platform next. If the company keeps the same chassis, storage layout, and broad I/O design while offering multiple CPU variants, the WTR Max could become a more flexible series rather than a single fixed model. In that context, an Intel version would make sense as a lower-cost or differently positioned option for buyers who do not need the stronger processing profile of the Ryzen 7 8845HS, or who specifically want an Intel-based media and virtualization platform. At this stage, though, that remains an informed reading of the hardware direction rather than a confirmed launch plan. Since this unit was sent as an early preview sample and Aoostar has not yet published a retail page for the Intel edition, the most accurate conclusion is that the WTR Max Intel version is promising as a product idea, but still undefined in the areas that matter most for a final purchasing decision: official pricing, shipping regions, final specification sheet, and release timing.

The Aoostar WTR MAX Nas is available from the following places:
  • Aoostar WTR Max NAS $699 on Amazon – HERE
  • Aoostar WTR Max NAS $679 on Official Site – HERE
  • Aoostar R1 N150 2-Bay NAS $179 – HERE
  • Aoostar R7 4-Bay NAS $419 – HERE
  • Aoostar R7 2-Bay 5825U NAS $399 – HERE
  • Aoostar Oculink 800W ePCIe Docking Station $169 – HERE
  • Aoostar GEN12 Gen4 PC $374 on AliExpress – HERE

 

📧 SUBSCRIBE TO OUR NEWSLETTER 🔔
[contact-form-7]
🔒 Join Inner Circle

Get an alert every time something gets added to this specific article!


Want to follow specific category? 📧 Subscribe

This description contains links to Amazon. These links will take you to some of the products mentioned in today's content. As an Amazon Associate, I earn from qualifying purchases. Visit the NASCompares Deal Finder to find the best place to buy this device in your region, based on Service, Support and Reputation - Just Search for your NAS Drive in the Box Below

Need Advice on Data Storage from an Expert?

Finally, for free advice about your setup, just leave a message in the comments below here at NASCompares.com and we will get back to you. Need Help? Where possible (and where appropriate) please provide as much information about your requirements, as then I can arrange the best answer and solution to your needs. Do not worry about your e-mail address being required, it will NOT be used in a mailing list and will NOT be used in any way other than to respond to your enquiry. [contact-form-7] TRY CHAT Terms and Conditions
If you like this service, please consider supporting us. We use affiliate links on the blog allowing NAScompares information and advice service to be free of charge to you.Anything you purchase on the day you click on our links will generate a small commission which isused to run the website. Here is a link for Amazon and B&H.You can also get me a ☕ Ko-fi or old school Paypal. Thanks!To find out more about how to support this advice service check HEREIf you need to fix or configure a NAS, check Fiver Have you thought about helping others with your knowledge? Find Instructions Here  
 
Or support us by using our affiliate links on Amazon UK and Amazon US
    
 
Alternatively, why not ask me on the ASK NASCompares forum, by clicking the button below. This is a community hub that serves as a place that I can answer your question, chew the fat, share new release information and even get corrections posted. I will always get around to answering ALL queries, but as a one-man operation, I cannot promise speed! So by sharing your query in the ASK NASCompares section below, you can get a better range of solutions and suggestions, alongside my own.

☕ WE LOVE COFFEE ☕

 

Jurassic Park dans votre cluster k8s

Le navigateur 3D de Jurassic Park, vous savez, celui avec lequel Lex hackait le parc en 1993 pendant que les vélociraptors grattaient à la porte... bah quelqu'un vient de le recréer, mais pour Kubernetes.

Le projet s'appelle k8s-unix-system et c'est exactement ce que vous imaginez. Vos namespaces deviennent des îles flottantes roses, vos pods des blocs 3D colorés et vous naviguez dans le tout en vue FPS avec WASD + souris. Genre comme Quake, mais pour surveiller vos pods.

Les pods Kubernetes version Jurassic Park ( Source )

Un pod vert c'est un pod qui tourne, jaune c'est en attente, et rouge c'est erreur ou CrashLoopBackOff, bref le truc que personne n'aime voir. Le truc sympa, c'est que la hauteur des blocs augmente avec le nombre de restarts. Du coup, le pod qui galère depuis ce matin, c'est celui qui ressemble à une tour bien haute. Par contre, attention, les pods en erreur tremblent carrément (pas nerveux hein, c'est voulu) et les pods running bougent doucement... c'est plutôt zen je trouve.

Les nodes, eux, ne sont pas mélangés avec les namespaces. Ils ont leur propre île bleu foncé à part, avec des cubes cyan pour ceux qui sont Ready et rouge pour les NotReady. Survolez un node et hop, vous avez son nom, son statut, sa capacité CPU et sa RAM affichées dans un tooltip. Les services, eux, sont visualisés sous forme d'arcs cyan semi-transparents qui connectent les pods entre eux en topologie étoile. Tout fonctionne, suffit de demander, on l'a ! (reeeef ^^)

Les namespaces et nodes, chacun sur leur île ( Source )

Pour lancer le truc, un Docker one-liner suffit (attention quand même, ça monte votre kubeconfig en lecture seule dans le conteneur, donc à réserver au cluster de dev) :

docker run --rm -it -v ~/.kube/config:/root/.kube/config:ro -p 8080:8080 ghcr.io/jlandersen/k8s-unix-system:main

Vous ouvrez localhost:8080 dans Chrome et vous volez à travers votre cluster avec la barre espace pour monter, Ctrl pour descendre, Shift pour accélérer. Tout est en temps réel grâce à la Watch API K8s, du coup si un pod tombe pendant que vous survolez son île, vous le voyez passer au rouge direct. Finalement, c'est kubectl get pods mais en 100 fois plus fun.

C'est codé en Go côté serveur et Three.js pour la 3D dans le navigateur. Le dev derrière bosse chez LEGO (ça ne s'invente pas). Et d'ailleurs si vous êtes du genre à recycler vos smartphones en cluster , ça ferait un combo d'enfer pour frimer devant les collègues.

Bref, vous allez pouvoir enfin lâcher un « Je connais ce système... il fonctionne sous Unix ! » sans mentir.

Cette mini borne d'arcade tient dans la main et tourne sur un ESP32

Un développeur a créé Galagino, un émulateur open source qui fait tourner Pac-Man, Galaga, Donkey Kong et trois autres classiques de l'arcade sur un simple microcontrôleur ESP32. Le projet est gratuit, le code est sur GitHub, et avec quelques composants et une imprimante 3D vous fabriquez votre propre mini borne pour presque rien.

Six jeux d'arcade sur une puce à quelques euros

Galagino est un projet open source développé par Till Harbaum. Le principe : émuler des jeux d'arcade des années 80 sur un ESP32, cette petite puce à double coeur cadencée à 240 MHz qui coûte une poignée d'euros. Et ça ne rigole pas côté catalogue, puisque six titres sont pris en charge : Galaga, Pac-Man, Donkey Kong, Frogger, Dig Dug et 1942.

L'émulation est complète, avec le son et la vidéo, le tout affiché sur un petit écran TFT de 320 x 240 pixels en 2 à 3 pouces. Pour les contrôles, cinq boutons poussoirs suffisent, ou un joystick si vous préférez. Le Galaga d'origine tournait sur trois processeurs Z80 plus deux puces dédiées aux entrées et au son. Ici, l'ESP32 gère tout seul, et les deux coeurs sont quand même bien sollicités.

Le Cheap Yellow Display, la solution tout-en-un

Pour ceux qui ne veulent pas souder trop de composants, il existe une alternative bien pratique : le Cheap Yellow Display. C'est une carte ESP32 qui intègre l'écran tactile, un slot micro SD, la sortie audio et le module Wi-Fi dans un seul boîtier.

Il suffit d'y brancher une manette Nunchuk de Wii et un petit haut-parleur pour avoir une borne fonctionnelle. La communauté a aussi développé des boîtiers imprimés en 3D, et certains ont même recyclé des coques de mini bornes My Arcade du commerce pour y glisser la carte.

Tout le code, les fichiers 3D et les instructions de montage sont disponibles sur GitHub. Seul détail : les ROM des jeux ne sont pas incluses pour des raisons évidentes de licence, il faut les fournir vous-même.

Un projet qui vit bien

Le dépôt GitHub compte 186 commits et une communauté active qui continue d'ajouter des jeux comme Frogger, Dig Dug et 1942, et des contributeurs travaillent sur d'autres titres. Davide Gatti, du collectif Survival Hacking, a même porté le projet sur Arduino et publié un tuto vidéo complet pour fabriquer sa borne de A à Z. Le résultat tient dans la paume de la main, avec en option un éclairage LED pour le fronton, histoire de faire comme les vraies.

C’est trop chouette, et c’est exactement le genre de projet qui donne envie de ressortir le fer à souder. Pour quelques euros de composants et un week-end de bricolage, vous repartez avec une borne d'arcade de poche qui fait tourner Pac-Man et Donkey Kong.

Difficile de faire plus chouette en termes de rapport effort/résultat. Et puis le fait que la communauté continue d'ajouter des jeux montre que le projet a de beaux restes devant lui. En tout cas, si vous cherchiez une excuse pour acheter un ESP32, la voilà.

Source : Hackster

Cloudflare /crawl - Aspirez un site entier en un seul appel API

Crawler un site entier, ça devrait pas être aussi compliqué. Et pourtant, entre les scripts maison qui cassent tous les 2 jours et les headless browsers qui bouffent de la RAM comme pas permis, c'est assez la galère ! Du coup, Cloudflare, dans sa grande bonté (lol) vient de sortir un endpoint /crawl (en open beta) dans la section Browser Rendering qui simplifie tout ça... vous balancez une URL dessus et hop, ça ASPIRE tout le site (oui oui).

En gros, vous envoyez une requête POST avec l'URL de départ, et le service se charge de découvrir les pages (via le sitemap, les liens internes, ou les deux), de les générer dans un navigateur headless, et de vous renvoyer le contenu en HTML, Markdown ou même en JSON structuré grâce à Workers AI. Le tout de manière asynchron ! Vous, vous récupérez juste un job ID et vous revenez plus tard chercher les résultats quand c'est prêt.

Créer votre token API

Avant toute chose, il vous faut un token API Cloudflare avec la permission "Browser Rendering - Edit". Rendez-vous dans votre dashboard Cloudflare, section API Tokens, et créez-en un nouveau. Notez aussi votre Account ID (visible dans l'URL du dashboard ou dans la section Overview de n'importe quel domaine).

Lancer un crawl

Là, ensuite c'est hyper simple. Un seul appel curl suffit :

curl -X POST "https://api.cloudflare.com/client/v4/accounts/VOTRE_ACCOUNT_ID/browser-rendering/crawl" \
 -H "Authorization: Bearer VOTRE_TOKEN" \
 -H "Content-Type: application/json" \
 -d '{"url": "https://example.com"}'

Et là, vous récupérez un job ID en retour (genre c7f8s2d9-a8e7-4b6e-...). Par défaut, le crawler va explorer 10 pages max avec une profondeur quasi illimitée. Mais bon, 10 pages c'est vite limité, du coup vous pouvez ajuster tout ça comme ceci :

curl -X POST "https://api.cloudflare.com/client/v4/accounts/VOTRE_ACCOUNT_ID/browser-rendering/crawl" \
 -H "Authorization: Bearer VOTRE_TOKEN" \
 -H "Content-Type: application/json" \
 -d '{
 "url": "https://example.com/docs",
 "limit": 50,
 "depth": 3,
 "formats": ["markdown"],
 "render": false,
 "options": {
 "includePatterns": ["https://example.com/docs/**"],
 "excludePatterns": ["**/changelog/**"]
 }
 }'

Le paramètre render: false permet de récupérer le HTML brut sans lancer de navigateur headless, c'est carrément plus rapide pour les sites statiques. Sachez quand même que pendant la beta, ce mode n'est pas facturé ! Youpi !

Récupérer les résultats

Une fois le crawl lancé, vous interrogez le job avec un GET :

curl "https://api.cloudflare.com/client/v4/accounts/VOTRE_ACCOUNT_ID/browser-rendering/crawl/VOTRE_JOB_ID" \
 -H "Authorization: Bearer VOTRE_TOKEN"

Vous obtenez alors le statut (running, completed, errored...) et la liste des pages crawlées avec leur contenu dans le format demandé. Si le résultat dépasse 10 Mo, un curseur de pagination est inclus pour récupérer la suite.

Les options qui tuent

Y'a quelques paramètres bien pensés pour les cas plus avancés :

  • modifiedSince et maxAge pour du crawling incrémental (ne re-crawler que les pages modifiées récemment)
  • source: "sitemaps" pour ne suivre que le sitemap au lieu de parser tous les liens
  • jsonOptions avec un prompt Workers AI pour extraire des données structurées automatiquement (genre récupérer le nom, le prix et le stock de 500 fiches produit d'un e-commerce en une seule passe)
  • rejectResourceTypes pour bloquer images, fonts et CSS et accélérer le crawl
  • authenticate pour les sites protégés par une auth HTTP basique

Attention quand même, y'a quelques subtilités à savoir. Un job peut tourner 7 jours max et les résultats sont conservés 14 jours seulement, du coup pensez à les récupérer vite. Le crawler respecte le robots.txt (y compris le crawl-delay), et si un site vous bloque, les URLs apparaissent comme "disallowed" dans les résultats. Sauf que ça ne vous dit pas pourquoi, faudra aller checker le robots.txt vous-même.

Voilà, cette "merveille" pour les scrappeurs fous est dispo sur les plans Free et Paid de Workers , et si vous voulez aller plus loin, Cloudflare propose aussi des endpoints pour les screenshots, les PDF et le scraping ciblé .

Voilà, un petit crawler inclus dans le plan Free de Workers, qui respecte le robots.txt et qui sort du Markdown ou du JSON structuré... je vais surveiller ça de près !

MLX-Audio - Faites parler votre Mac sans le cloud

Faire de la synthèse vocale , de la transcription et du voice cloning en local sur son Mac, sans envoyer le moindre octet dans le cloud... hey bien c'est possible mes petits foufous et en plus comme je sais que vous avez des oursins dans les poches, hé bien bonne nouvelle : C'est gratuit !

MLX-Audio , c'est donc une bibliothèque Python qui exploite le framework MLX d'Apple pour faire tourner des modèles audio directement sur les puces M1, M2, M3, M4 et maintenant M5. Cette liste est trop longue, la prochaine fois, j'écrirais M* ou M1-5 ^^. Avec cette lib, du coup, tout se fait en local sur votre machine. Si je devais oser une comparaison un peu casse gueule, je dirais que c'est un peu le Ollama de l'audio.

Côté text-to-speech, y'a surtout du choix. Une dizaine de modèles sont disponibles, dont Kokoro pour du multilingue (français, anglais, japonais, chinois, espagnol...), Chatterbox qui gère 23 langues, ou encore Dia pour les dialogues. Et voici comment ensuite avec une commande dans le terminal, on peut faire parler la machine :

mlx_audio.tts.generate --model mlx-community/Kokoro-82M-bf16 --text "Salut les copains" --lang_code f --play

Le truc sympa, c'est que ça ne s'arrête pas à la synthèse vocale. Côté transcription, on retrouve Whisper (le modèle d'OpenAI qui gère 99 langues), Parakeet de NVIDIA pour les langues européennes, et même VibeVoice-ASR de Microsoft qui fait de la diarization (identifier qui parle dans une conversation).

Pour transcrire un fichier audio, c'est donc tout aussi simple :

python -m mlx_audio.stt.generate --model mlx-community/whisper-large-v3-turbo-asr-fp16 --audio meeting.wav --verbose

Y'a aussi le voice cloning avec CSM, où vous filez un fichier audio de référence et le modèle reproduit la voix. Perso, ça fait un peu flipper mais qui est carrément bluffant ! Sauf si vous avez une voix super particulière (trop de clope hein ^^), au final le résultat est assez bon.

Attention, tout ça a besoin de mémoire ! Heureusement, la bibliothèque gère la quantization (de 3 à 8 bits), du coup les modèles sont compressés pour tenir dans la mémoire unifiée des puces Apple Silicon. Le plus léger, Kokoro, fait 82M de paramètres et le plus costaud, Ming Omni, monte à 16.8 milliards de paramètres (mais en mixture-of-experts, donc seulement 3B activés à la fois). Pour ce dernier, faut donc un Mac avec pas mal de RAM.

D'ailleurs, si vous êtes développeur, la bibliothèque expose également une API REST compatible OpenAI. Ça veut dire que vos apps qui causent déjà avec l'API d'OpenAI peuvent basculer sur du local sans changer une ligne de code... enfin presque. Car faut quand même pointer vers localhost au lieu des serveurs d'OpenAI, mais c'est à peu près tout. Y'a même un package Swift pour intégrer ça dans une app iOS ou macOS native.

Voilà, pour ceux qui préfèrent une interface graphique, un mode web avec visualisation 3D de l'audio est même intégré. C'est super joli !

Ce projet est sous licence MIT, et le mainteneur, Prince Canuma, est un ancien ingénieur ML chez Arcee AI, donc pas un random qui a forké un truc un dimanche ^^.

Voilà, si vous avez un Mac et que l'audio IA en local vous branche, c'est open source, c'est gratuit et ça marche carrément bien !

❌