À quelle fréquence ce classement est-il mis à jour ?

Les données sont synchronisées automatiquement chaque jour avec l'API d'Artificial Analysis. Vous consultez toujours les derniers résultats disponibles, incluant les nouveaux modèles et mises à jour de prix.

Pourquoi certains modèles connus ne sont pas dans le classement ?

Seuls les modèles accessibles publiquement via API sont testés et comparés. Les modèles privés, en bêta fermée ou sans API publique ne peuvent pas être inclus dans ce classement indépendant.

Le prix affiché est-il le prix réel que je paierai ?

Le prix "blended" est une estimation basée sur un ratio 3:1 input/output qui représente un usage typique. Votre coût réel peut varier selon votre cas d'usage. Consultez toujours la tarification officielle de chaque fournisseur pour des chiffres précis.

Un modèle plus cher est-il forcément meilleur ?

Non ! Le rapport qualité/prix varie énormément. Certains modèles "Budget" comme GPT-4o mini ou Gemini Flash offrent d'excellentes performances pour un coût très faible. Le choix dépend de votre cas d'usage : pour du contenu simple, un modèle budget suffit amplement.

Comment sont calculés les scores de qualité ?

Artificial Analysis utilise des benchmarks académiques standardisés (MMLU Pro, GPQA, Math-500, etc.) et teste tous les modèles dans les mêmes conditions pour garantir une comparaison objective. Les tests sont automatisés et régulièrement mis à jour.

Puis-je utiliser ces données pour mon projet ?

Les données sont fournies par Artificial Analysis via leur API. Pour toute utilisation commerciale ou redistribution, veuillez consulter leurs conditions d'utilisation sur https://artificialanalysis.ai. Ce classement est fourni à titre informatif.

Puis-je réutiliser ces données ?

Oui, pour un usage informatif en citant la source. Vérifiez néanmoins les licences et mentions légales des fournisseurs d’origine.

Quelle différence entre GPT-4, GPT-4 Turbo et GPT-4o ?

GPT-4 est la version originale (mars 2023), GPT-4 Turbo est une version optimisée plus rapide et moins chère, et GPT-4o ("omni") est la dernière version multimodale (texte + image + audio). GPT-4o offre le meilleur rapport performance/prix de la gamme GPT-4.

Quel est le meilleur modèle pour du code ?

Pour la programmation, Claude Sonnet 3.5, GPT-4o et DeepSeek Coder excellent. Ils offrent d'excellentes capacités de génération de code, debugging et explication technique. Claude Sonnet 3.5 est particulièrement apprécié des développeurs pour sa compréhension du contexte.

Meilleurs LLM : Classement des IA Performantes

Benchmark et comparatif des meilleurs LLM, mis à jour automatiquement chaque jour. Données consolidées, couvrant précision, multimodalité, coût et performance. Faites défiler pour explorer les classements par catégorie. Face à l’explosion des modèles d’IA, choisir le bon LLM devient un casse-tête : GPT-5, Claude 4.5 Sonnet, Gemini 2.5 Pro, Grok 4… Ce classement compare le top 100 des modèles sur des critères objectifs (qualité, vitesse, coût, capacités multimodales) grâce aux benchmarks indépendants d’Artificial Analysis. Les données sont synchronisées automatiquement chaque jour pour garantir un comparatif toujours à jour. Utilisez les filtres ci-dessous pour trouver le modèle adapté à votre usage et budget.

📊 Classements des modèles IA

🧠 Top 100 des meilleurs Llm

Dernière mise à jour: il y a 8 heures

Données: Artificial Analysis

Modèle	Créateur	Quality Index	Speed (tok/s)	Prix ($/1M)
Gemini 3.1 Pro Preview	Google	57.2	119.0	$4.50 Standard
GPT-5.4 (xhigh)	OpenAI	57.0	73.2	$5.63 Standard
GPT-5.3 Codex (xhigh)	OpenAI	54.0	70.5	$4.81 Standard
Claude Opus 4.6 (Adaptive Reasoning, Max Effort)	Anthropic	53.0	56.6	$10.00 Premium
Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)	Anthropic	51.7	68.5	$6.00 Standard
GPT-5.2 (xhigh)	OpenAI	51.3	76.6	$4.81 Standard
GLM-5 (Reasoning)	Z AI	49.8	50.7	$1.55 Budget
Claude Opus 4.5 (Reasoning)	Anthropic	49.7	62.0	$10.00 Premium
GPT-5.2 Codex (xhigh)	OpenAI	49.0	75.1	$4.81 Standard
Gemini 3 Pro Preview (high)	Google	48.4	114.7	$4.50 Standard
GPT-5.1 (high)	OpenAI	47.7	105.5	$3.44 Standard
Kimi K2.5 (Reasoning)	Kimi	46.8	41.6	$1.20 Budget
GPT-5.2 (medium)	OpenAI	46.6	0.0	$4.81 Standard
Claude Opus 4.6 (Non-reasoning, High Effort)	Anthropic	46.5	49.1	$10.00 Premium
Gemini 3 Flash Preview (Reasoning)	Google	46.4	165.4	$1.13 Budget
Qwen3.5 397B A17B (Reasoning)	Alibaba	45.0	54.0	$1.35 Budget
GPT-5 (high)	OpenAI	44.6	68.5	$3.44 Standard
GPT-5 Codex (high)	OpenAI	44.6	187.4	$3.44 Standard
Claude Sonnet 4.6 (Non-reasoning, High Effort)	Anthropic	44.4	53.4	$6.00 Standard
GPT-5.1 Codex (high)	OpenAI	43.1	121.1	$3.44 Standard
Claude Opus 4.5 (Non-reasoning)	Anthropic	43.1	53.8	$10.00 Premium
Claude 4.5 Sonnet (Reasoning)	Anthropic	43.0	56.7	$6.00 Standard
Claude Sonnet 4.6 (Non-reasoning, Low Effort)	Anthropic	42.6	52.5	$6.00 Standard
Qwen3.5 27B (Reasoning)	Alibaba	42.1	90.8	$0.83 Budget
GLM-4.7 (Reasoning)	Z AI	42.1	105.9	$1.00 Budget
GPT-5 (medium)	OpenAI	42.0	65.4	$3.44 Standard
MiniMax-M2.5	MiniMax	41.9	42.9	$0.53 Budget
DeepSeek V3.2 (Reasoning)	DeepSeek	41.7	28.8	$0.32 Budget
Qwen3.5 122B A10B (Reasoning)	Alibaba	41.6	131.2	$1.10 Budget
Grok 4	xAI	41.5	38.3	$6.00 Standard
MiMo-V2-Flash (Feb 2026)	Xiaomi	41.5	118.2	$0.15 Budget
Gemini 3 Pro Preview (low)	Google	41.3	116.0	$4.50 Standard
GPT-5 mini (high)	OpenAI	41.2	68.9	$0.69 Budget
Kimi K2 Thinking	Kimi	40.9	66.0	$1.08 Budget
o3-pro	OpenAI	40.7	14.6	$35.00 Premium
GLM-5 (Non-reasoning)	Z AI	40.6	47.7	$1.55 Budget
Qwen3.5 397B A17B (Non-reasoning)	Alibaba	40.1	52.2	$1.35 Budget
Qwen3 Max Thinking	Alibaba	39.9	34.9	$2.40 Standard
MiniMax-M2.1	MiniMax	39.4	43.0	$0.53 Budget
GPT-5 (low)	OpenAI	39.2	56.4	$3.44 Standard
MiMo-V2-Flash (Reasoning)	Xiaomi	39.2	116.4	$0.15 Budget
GPT-5 mini (medium)	OpenAI	38.9	80.1	$0.69 Budget
Claude 4 Sonnet (Reasoning)	Anthropic	38.7	55.4	$6.00 Standard
GPT-5.1 Codex mini (high)	OpenAI	38.6	162.7	$0.69 Budget
Grok 4.1 Fast (Reasoning)	xAI	38.6	109.7	$0.28 Budget
o3	OpenAI	38.4	73.4	$3.50 Standard
Step 3.5 Flash	StepFun	37.8	157.4	$0.15 Budget
Kimi K2.5 (Non-reasoning)	Kimi	37.3	37.4	$1.20 Budget
Qwen3.5 27B (Non-reasoning)	Alibaba	37.2	91.5	$0.83 Budget
Claude 4.5 Haiku (Reasoning)	Anthropic	37.1	140.6	$2.00 Standard
Qwen3.5 35B A3B (Reasoning)	Alibaba	37.1	135.6	$0.69 Budget
Claude 4.5 Sonnet (Non-reasoning)	Anthropic	37.1	49.4	$6.00 Standard
MiniMax-M2	MiniMax	36.1	42.9	$0.53 Budget
KAT-Coder-Pro V1	KwaiKAT	36.0	56.9	$0.53 Budget
Qwen3.5 122B A10B (Non-reasoning)	Alibaba	35.9	137.6	$1.10 Budget
Nova 2.0 Pro Preview (medium)	Amazon	35.7	162.4	$3.44 Standard
Grok 4 Fast (Reasoning)	xAI	35.1	173.1	$0.28 Budget
Gemini 3 Flash Preview (Non-reasoning)	Google	35.0	163.4	$1.13 Budget
Claude 3.7 Sonnet (Reasoning)	Anthropic	34.7	0.0	$6.00 Standard
Gemini 2.5 Pro	Google	34.6	124.9	$3.44 Standard
GLM-4.7 (Non-reasoning)	Z AI	34.2	106.2	$0.94 Budget
DeepSeek V3.2 Speciale	DeepSeek	34.1	0.0	$0.00 Budget
DeepSeek V3.1 Terminus (Reasoning)	DeepSeek	33.9	0.0	$0.80 Budget
GPT-5.2 (Non-reasoning)	OpenAI	33.6	61.3	$4.81 Standard
Gemini 3.1 Flash-Lite Preview	Google	33.5	296.9	$0.56 Budget
Doubao Seed Code	ByteDance Seed	33.5	0.0	$0.00 Budget
gpt-oss-120B (high)	OpenAI	33.3	267.9	$0.26 Budget
o4-mini (high)	OpenAI	33.1	139.2	$1.93 Budget
Claude 4 Sonnet (Non-reasoning)	Anthropic	33.0	49.8	$6.00 Standard
DeepSeek V3.2 Exp (Reasoning)	DeepSeek	32.9	29.7	$0.32 Budget
Mercury 2	Inception	32.8	794.9	$0.38 Budget
Qwen3 Max Thinking (Preview)	Alibaba	32.5	43.1	$2.40 Standard
GLM-4.6 (Reasoning)	Z AI	32.5	89.6	$0.98 Budget
Qwen3.5 9B (Reasoning)	Alibaba	32.4	0.0	$0.00 Budget
DeepSeek V3.2 (Non-reasoning)	DeepSeek	32.1	29.6	$0.32 Budget
Grok 3 mini Reasoning (high)	xAI	32.1	197.7	$0.35 Budget
K-EXAONE (Reasoning)	LG AI Research	32.1	0.0	$0.00 Budget
Nova 2.0 Pro Preview (low)	Amazon	31.9	179.7	$3.44 Standard
Claude 4.1 Opus (Reasoning)	Anthropic	31.9	44.6	$30.00 Premium
Qwen3 Max	Alibaba	31.4	32.5	$2.40 Standard
Claude 4.5 Haiku (Non-reasoning)	Anthropic	31.1	104.1	$2.00 Standard
Gemini 2.5 Flash Preview (Sep '25) (Reasoning)	Google	31.1	0.0	$0.85 Budget
Kimi K2 0905	Kimi	30.9	78.4	$1.20 Budget
o1	OpenAI	30.8	118.0	$26.25 Premium
Claude 3.7 Sonnet (Non-reasoning)	Anthropic	30.8	0.0	$6.00 Standard
Qwen3.5 35B A3B (Non-reasoning)	Alibaba	30.7	134.4	$0.69 Budget
MiMo-V2-Flash (Non-reasoning)	Xiaomi	30.4	121.0	$0.15 Budget
Gemini 2.5 Pro Preview (Mar' 25)	Google	30.3	0.0	$0.00 Budget
GLM-4.6 (Non-reasoning)	Z AI	30.2	88.6	$1.00 Budget
GLM-4.7-Flash (Reasoning)	Z AI	30.1	119.6	$0.15 Budget
Nova 2.0 Lite (medium)	Amazon	29.7	220.1	$0.85 Budget
Qwen3 235B A22B 2507 (Reasoning)	Alibaba	29.5	42.7	$2.63 Standard
Gemini 2.5 Pro Preview (May' 25)	Google	29.5	0.0	$3.44 Standard
ERNIE 5.0 Thinking Preview	Baidu	29.1	0.0	$0.00 Budget
Grok Code Fast 1	xAI	28.7	167.2	$0.53 Budget
DeepSeek V3.1 Terminus (Non-reasoning)	DeepSeek	28.5	0.0	$0.63 Budget
DeepSeek V3.2 Exp (Non-reasoning)	DeepSeek	28.4	29.7	$0.32 Budget
Qwen3 Coder Next	Alibaba	28.3	150.8	$0.53 Budget
Apriel-v1.5-15B-Thinker	ServiceNow	28.3	150.3	$0.00 Budget
DeepSeek V3.1 (Non-reasoning)	DeepSeek	28.1	0.0	$0.83 Budget

🎬 Meilleurs modèles Text-to-Video

Dernière mise à jour: il y a 8 heures

Données: Artificial Analysis

Rang	Modèle	Créateur	ELO Rating
#1	Kling 3.0 1080p (Pro)	KlingAI	1,246
#2	Kling 3.0 Omni 1080p (Pro)	KlingAI	1,234
#3	grok-imagine-video	xAI	1,228
#4	PixVerse V5.6	PixVerse	1,226
#5	Runway Gen-4.5	Runway	1,225

📹 Meilleurs modèles Image-to-Video

Dernière mise à jour: il y a 8 heures

Données: Artificial Analysis

Rang	Modèle	Créateur	ELO Rating
#1	grok-imagine-video	xAI	1,336
#2	GenFlare 2.0	Baidu	1,329
#3	PixVerse V5.6	PixVerse	1,299
#4	Kling 3.0 Omni 1080p (Pro)	KlingAI	1,298
#5	Kling 2.5 Turbo 1080p	KlingAI	1,298

🎙️ Meilleurs modèles Text-to-Speech

Dernière mise à jour: il y a 8 heures

Données: Artificial Analysis

Rang	Modèle	Créateur	ELO Rating
#1	Inworld TTS 1 Max	Inworld	1,162
#2	Inworld TTS 1.5 Max	Inworld	1,115
#3	TTS-1	OpenAI	1,111
#4	Speech-02-Turbo	MiniMax	1,107
#5	Multilingual v2	ElevenLabs	1,105

✏️ Meilleurs modèles Image Editing

Dernière mise à jour: il y a 8 heures

Données: Artificial Analysis

Rang	Modèle	Créateur	ELO Rating
#1	Riverflow 2.0	Sourceful	1,284
#2	GPT Image 1.5 (high)	OpenAI	1,270
#3	Nano Banana Pro (Gemini 3 Pro Image)	Google	1,251
#4	Nano Banana 2 (Gemini 3.1 Flash Image Preview)	Google	1,241
#5	grok-imagine-image	xAI	1,227

❓ Pourquoi ce classement ?

Face à l’explosion du nombre de modèles d’IA (GPT, Claude, Gemini, Llama, Mistral…), il devient difficile de s’y retrouver. Ce classement compare plus de 300 modèles des principaux acteurs du marché sur plusieurs dimensions clés :

🎯 Qualité

Performance sur des benchmarks académiques reconnus (MMLU Pro, GPQA, Math-500)

⚡ Vitesse

Rapidité de génération mesurée en tokens par seconde

💰 Prix

Coût par million de tokens pour optimiser votre budget

💻 Coding

Capacités de programmation et d’assistance au développement

🔬 Méthodologie

Source des données

Les données proviennent de Artificial Analysis, une plateforme indépendante qui réalise des tests automatisés sur tous les modèles LLM disponibles publiquement. Notre plugin synchronise automatiquement ces données pour vous garantir un classement toujours à jour.

Critères d’évaluation

Intelligence Index (0-100)

Score composite qui agrège plusieurs benchmarks académiques de référence :

MMLU Pro : Questions à choix multiples couvrant 57 domaines de connaissances
GPQA : Questions de niveau doctorat en sciences
Math-500 : Problèmes mathématiques avancés

Vitesse (tokens/seconde)

Vitesse de génération mesurée en conditions réelles via les API officielles. Plus le score est élevé, plus le modèle génère rapidement du texte (crucial pour les applications temps réel).

Prix ($/1M tokens)

Tarification “blended” calculée avec un ratio 3:1 (3 tokens en entrée pour 1 token en sortie), représentant un usage typique. Les prix évoluent régulièrement avec la compétition du marché.

📖 Comment lire ce tableau ?

🎯 Intelligence Index

Score global de performance intellectuelle. Un score de 85+ indique un modèle “frontier” capable de raisonnement avancé.

90-100 : Excellence (GPT-4, Claude Opus)
80-90 : Très performant
70-80 : Performant
< 70 : Basique

⚡ Speed (tokens/s)

Vitesse de génération. Important pour les applications nécessitant des réponses rapides (chatbots, assistance).

> 100 tok/s : Très rapide
50-100 tok/s : Rapide
20-50 tok/s : Moyen
< 20 tok/s : Lent

💰 Prix ($/1M tokens)

Coût par million de tokens. Les prix ont fortement baissé grâce à la compétition.

Gratuit : $0 (modèles open-source)
Budget : < $2/1M (GPT-4o mini, Gemini Flash)
Standard : $2-10/1M (GPT-4o, Claude Sonnet)
Premium : > $10/1M (Claude Opus)

🎨 Badges de prix

Des badges colorés indiquent rapidement la catégorie de prix :

🟢 Budget : Excellent rapport qualité/prix
🔵 Standard : Équilibre performance/coût
🟡 Premium : Qualité maximale

💡 Quel modèle choisir selon votre besoin ?

💻 Développement / Code

Pour de l’assistance au code, privilégiez les modèles avec un fort score Coding : Claude Sonnet 3.5, GPT-4o, DeepSeek Coder.

Ces modèles excellent en génération de code, debugging et explication technique.

✍️ Rédaction / Contenu

Pour créer du contenu, optez pour un bon équilibre qualité/prix : GPT-4o mini, Gemini Pro, Claude Haiku.

Parfaits pour articles, emails, descriptions produits à volume élevé.

🔬 Analyse / Recherche

Pour du raisonnement complexe, choisissez les modèles “frontier” (Intelligence Index > 85) : Claude Opus, GPT-4 Turbo, Gemini Ultra.

Idéaux pour analyse de données, synthèse de recherche, résolution de problèmes.

💸 Usage intensif / Budget

Pour un volume élevé avec budget limité, les modèles open-source ou très abordables : Llama 3, Mistral, Gemini Flash.

Excellent rapport qualité/prix pour applications de production.

📰 Tendances actuelles du marché LLM

Guerre des prix : Les tarifs ont été divisés par 10 en 2 ans grâce à la compétition entre OpenAI, Anthropic, Google et Meta.
Explosion des performances : Les modèles récents (2024-2025) dépassent désormais les humains sur de nombreux benchmarks académiques.
Spécialisation : Émergence de modèles optimisés pour des tâches spécifiques (code, maths, langues) plutôt que généralistes.
Open-source en hausse : Meta (Llama), Mistral et Alibaba proposent des modèles gratuits de niveau quasi-professionnel.
Modèles de raisonnement : Nouvelle génération capable de “réfléchir” étape par étape (OpenAI o1, DeepSeek R1).

🏆 LLM Leaderboard : le classement des meilleurs IA et des meilleurs LLM

📊 Classements des modèles IA

🧠 Top 100 des meilleurs Llm

🎬 Meilleurs modèles Text-to-Video

📹 Meilleurs modèles Image-to-Video

🎙️ Meilleurs modèles Text-to-Speech

✏️ Meilleurs modèles Image Editing

❓ Pourquoi ce classement ?

🎯 Qualité

⚡ Vitesse

💰 Prix

💻 Coding

🔬 Méthodologie

Source des données

Critères d’évaluation

Intelligence Index (0-100)

Vitesse (tokens/seconde)

Prix ($/1M tokens)

📖 Comment lire ce tableau ?

🎯 Intelligence Index

⚡ Speed (tokens/s)

💰 Prix ($/1M tokens)

🎨 Badges de prix

💡 Quel modèle choisir selon votre besoin ?

💻 Développement / Code

✍️ Rédaction / Contenu

🔬 Analyse / Recherche

💸 Usage intensif / Budget

📰 Tendances actuelles du marché LLM

FAQ

Plus De Filtres

🏆 LLM Leaderboard : le classement des meilleurs IA et des meilleurs LLM

📊 Classements des modèles IA

🧠 Top 100 des meilleurs Llm

🎬 Meilleurs modèles Text-to-Video

📹 Meilleurs modèles Image-to-Video

🎙️ Meilleurs modèles Text-to-Speech

✏️ Meilleurs modèles Image Editing

❓ Pourquoi ce classement ?

🎯 Qualité

⚡ Vitesse

💰 Prix

💻 Coding

🔬 Méthodologie

Source des données

Critères d’évaluation

Intelligence Index (0-100)

Vitesse (tokens/seconde)

Prix ($/1M tokens)

📖 Comment lire ce tableau ?

🎯 Intelligence Index

⚡ Speed (tokens/s)

💰 Prix ($/1M tokens)

🎨 Badges de prix

💡 Quel modèle choisir selon votre besoin ?

💻 Développement / Code

✍️ Rédaction / Contenu

🔬 Analyse / Recherche

💸 Usage intensif / Budget

📰 Tendances actuelles du marché LLM

✉️ Restez informé des évolutions de l’IA

FAQ