Site icon IA-insights

Flux 2 : Black Forest Labs dégaine son nouveau modèle et vient chatouiller Midjourney

Flux-2

Flux-2

La startup allemande Black Forest Labs vient de sortir Flux 2, et autant dire que ça envoie du lourd. Génération d’images en 4 mégapixels, édition multi-références, rendu de texte qui fonctionne vraiment… Si vous pensiez que le marché de l’image IA était figé entre Midjourney, DALL-E et Stable Diffusion, il va falloir réviser vos fiches.

Black Forest Labs, c’est qui déjà ?

Pour ceux qui auraient raté les épisodes précédents : Black Forest Labs, c’est l’équipe derrière les modèles Flux. Fondée en 2024 par d’anciens créateurs de Stable Diffusion, la boîte allemande s’est fait un nom avec Flux 1, devenu le modèle open-source de génération d’images le plus utilisé au monde.

Leur approche ? L’open-core. En gros, ils publient des modèles open-source pour la communauté tout en proposant des versions commerciales optimisées pour les entreprises. Adobe et Meta utilisent déjà leurs modèles en production, histoire de donner une idée du niveau.

Ce que Flux 2 apporte de neuf

Du photoréalisme à tomber

Le truc qui saute aux yeux avec Flux 2, c’est la qualité visuelle. On parle d’images jusqu’à 4 mégapixels avec un niveau de détail qui commence sérieusement à se confondre avec de vraies photos. Éclairage naturel, physique réaliste, textures de tissus, reflets… Le modèle comprend comment fonctionne le monde réel et ça se voit.

Fini le fameux “AI look” qui trahissait les images générées. Flux 2 gère les mains correctement (oui, enfin), les visages sont cohérents, et les petits détails comme les logos ou les objets de petite taille sont rendus proprement.

L’édition multi-références, la vraie innovation

C’est probablement la feature la plus intéressante : Flux 2 peut prendre jusqu’à 10 images en référence et maintenir la cohérence entre elles. Concrètement, ça veut dire :

  • Générer des dizaines de variantes d’un même personnage avec le même style
  • Placer un produit dans différents contextes tout en gardant son identité visuelle
  • Créer des assets marketing cohérents en série

Pour les créatifs et les équipes marketing, c’est un game-changer. Plus besoin de retoucher à la main pour harmoniser une série d’images.

Du texte qui se lit vraiment

Si vous avez déjà essayé de générer une image avec du texte via IA, vous connaissez la galère. Lettres inversées, mots illisibles, typographies chaotiques… Flux 2 règle le problème avec un rendu de texte qui fonctionne réellement, même pour des cas complexes comme des infographies, des maquettes UI ou du contenu multilingue.

Besoin d’une couleur précise pour respecter votre charte graphique ? Flux 2 accepte les codes hex et les applique sans approximation. Pratique.

4 modèles pour 4 usages différents

Black Forest Labs a décliné Flux 2 en plusieurs versions :

Flux 2 [Pro] : Le haut de gamme. Qualité maximale, latence minimale. Disponible uniquement via l’API et le playground de BFL. C’est la version pour la production sérieuse où chaque détail compte.

Flux 2 [Flex] : La version paramétrable. Vous pouvez ajuster le nombre d’étapes de sampling et l’échelle de guidage pour trouver votre équilibre entre qualité et vitesse. Idéal pour les développeurs qui veulent du contrôle fin.

Flux 2 [Dev] : Le modèle open-weight. Téléchargeable sur Hugging Face, il tourne en local si vous avez le hardware (attention, c’est un monstre de 32 milliards de paramètres qui demande 90 Go de VRAM en natif). Licence non-commerciale, parfait pour la recherche et l’expérimentation.

Flux 2 [Klein] : La version distillée, bientôt disponible sous licence Apache 2.0. Plus légère mais avec les mêmes capacités que son modèle parent. Un programme bêta est ouvert.

Et en bonus, le Flux 2 VAE (l’autoencoder) est publié sous Apache 2.0, utilisable même commercialement.

NVIDIA entre dans la danse

Petit détail qui a son importance : NVIDIA a collaboré avec Black Forest Labs pour optimiser Flux 2 sur les GPU RTX. Résultat ? Des quantifications FP8 qui réduisent les besoins en VRAM de 40% et améliorent les performances de 40%.

Avec ComfyUI, vous pouvez maintenant faire tourner Flux 2 sur du hardware plus accessible. Une RTX 4090 suffit pour la version quantifiée, alors que le modèle natif demandait une H100. C’est pas encore du “laptop gaming” mais ça démocratise quand même pas mal l’accès.

Tarification : au mégapixel

Black Forest Labs utilise un système de crédits simple : 1 crédit = 0,01$. Le prix varie ensuite selon la résolution de sortie (tarification au mégapixel). Pour Flux 2 [Flex], comptez environ 0,048$ par mégapixel via les plateformes partenaires.

Le modèle est accessible via l’API BFL directement, mais aussi via Replicate, Fal.ai, Cloudflare Workers AI, TogetherAI et d’autres. Options multiples pour intégrer ça dans vos workflows.

Face à la concurrence

Le timing n’est pas anodin. Flux 2 débarque en même temps que Gemini 3, Claude Opus 4.5 et les dernières itérations de GPT-5. Le marché de l’IA générative est en ébullition et Black Forest Labs veut clairement sa part du gâteau.

Sur les benchmarks internes (win-rate comparisons), Flux 2 [Dev] domine les alternatives open-weight sur trois catégories : génération text-to-image, édition single-reference et édition multi-reference. Face aux modèles propriétaires comme Midjourney ou DALL-E 3, la bataille est plus serrée mais Flux 2 [Pro] tient la comparaison.

L’avantage compétitif ? La flexibilité. Vous pouvez utiliser l’API managée pour la prod, télécharger les weights pour expérimenter en local, ou mixer les deux. Midjourney ne vous donne pas cette liberté.

Pour qui c’est fait ?

Flux 2 cible clairement les professionnels :

  • Équipes créatives qui ont besoin de cohérence visuelle sur des séries d’assets
  • E-commerce pour la génération de visuels produits à grande échelle
  • Agences marketing qui produisent du contenu en volume
  • Développeurs qui veulent intégrer de la génération d’images dans leurs apps
  • Chercheurs qui expérimentent avec les modèles open-weight

Si vous faites juste quelques images de temps en temps pour le fun, Midjourney reste probablement plus accessible. Mais pour des usages pro avec des besoins de personnalisation et de volume, Flux 2 devient très pertinent.

Verdict

Black Forest Labs frappe fort avec Flux 2. Le modèle coche toutes les cases de ce qu’on attend d’un générateur d’images IA en 2025 : qualité photoréaliste, cohérence stylistique, rendu de texte fiable et flexibilité de déploiement.

L’approche open-core est maline. Elle permet à la communauté d’expérimenter et de contribuer tout en générant du revenu via les offres commerciales. Et les partenariats avec NVIDIA et les plateformes cloud assurent une accessibilité décente malgré les specs exigeantes du modèle.

Est-ce que Flux 2 va détrôner Midjourney ? Pas forcément sur le marché grand public. Mais pour les pros qui ont besoin de plus que de jolies images – cohérence, contrôle, intégration – c’est clairement une alternative à considérer très sérieusement.

Disponibilité : Flux 2 est dispo maintenant via le playground BFL, l’API, et les plateformes partenaires. Les weights de Flux 2 [Dev] sont sur Hugging Face.

FAQ

Quelle est la différence entre Flux 2 et Flux 1 ?

Flux 2 améliore significativement la qualité d’image (jusqu’à 4 MP vs 1 MP), ajoute l’édition multi-références (jusqu’à 10 images), et propose un meilleur rendu de texte et de typographie. L’architecture utilise un nouveau VAE plus performant et une meilleure compréhension du monde physique.

Peut-on faire tourner Flux 2 en local ?

Oui, avec Flux 2 [Dev]. Mais attention aux specs : le modèle natif demande 90 Go de VRAM. Avec les optimisations NVIDIA (quantification FP8), une RTX 4090 peut suffire. Des versions quantifiées 4-bit sont aussi disponibles via Hugging Face pour réduire encore les besoins.

Flux 2 est-il gratuit ?

Le VAE et la future version Klein sont sous Apache 2.0 (gratuits, même pour usage commercial). Flux 2 [Dev] est open-weight mais avec une licence non-commerciale. Pour un usage commercial, il faut passer par l’API payante ou obtenir une licence spécifique.

Comment accéder à Flux 2 ?

Plusieurs options : le playground BFL (bfl.ai), l’API directe, ou via les plateformes partenaires (Replicate, Fal.ai, Cloudflare, TogetherAI). Pour la version Dev en local, téléchargez les weights sur Hugging Face et utilisez ComfyUI ou le code de référence.

Flux 2 est-il meilleur que Midjourney ?

Ça dépend de l’usage. Midjourney excelle en artistique stylisé et reste très accessible. Flux 2 brille en photoréalisme, cohérence multi-références et intégration technique (API, local). Pour de la production à grande échelle ou des besoins techniques spécifiques, Flux 2 prend l’avantage.

Quitter la version mobile