LLM Leaderboard : le classement des meilleurs IA et des meilleurs LLM
Benchmark et comparatif des meilleurs LLM, mis à jour automatiquement chaque jour. Données consolidées, couvrant précision, multimodalité, coût et performance. Faites défiler pour explorer les classements par catégorie.
Classement des meilleurs LLM
Organisation | Modèle | Licence | Param. (B) | Contexte | Entrée $/M | Sortie $/M | GPQA | MMLU | MMLU Pro |
---|---|---|---|---|---|---|---|---|---|
Grok-4 Heavy | Propriétaire | - | 0 | - | - | 88.4% | - | - | |
Grok-4 | Propriétaire | - | 256,000 | $3.00 | $15.00 | 87.5% | - | - | |
Gemini 2.5 Pro Preview 06-05 | Propriétaire | - | 1,048,576 | $1.25 | $10.00 | 86.4% | - | - | |
GPT-5 | Propriétaire | - | 400,000 | $1.25 | $10.00 | 85.7% | 92.5% | - | |
Claude 3.7 Sonnet | Propriétaire | - | 200,000 | $3.00 | $15.00 | 84.8% | - | - | |
Grok-3 | Propriétaire | - | 128,000 | $3.00 | $15.00 | 84.6% | - | - | |
Grok-3 Mini | Propriétaire | - | 128,000 | $0.30 | $0.50 | 84.0% | - | - | |
Claude Sonnet 4.5 | Propriétaire | - | 200,000 | $3.00 | $15.00 | 83.4% | - | - | |
o3 | Propriétaire | - | 200,000 | $2.00 | $8.00 | 83.3% | - | - | |
Gemini 2.5 Pro | Propriétaire | - | 1,048,576 | $1.25 | $10.00 | 83.0% | - | - | |
Gemini 2.5 Flash | Propriétaire | - | 1,048,576 | $0.30 | $2.50 | 82.8% | - | - | |
GPT-5 mini | Propriétaire | - | 400,000 | $0.25 | $2.00 | 82.3% | - | - | |
o4-mini | Propriétaire | - | 200,000 | $1.10 | $4.40 | 81.4% | - | - | |
Qwen3-235B-A22B-Thinking-2507 | Open | 235 | 256,000 | $0.30 | $3.00 | 81.1% | - | 84.4% | |
DeepSeek-R1-0528 | Open | 671 | 131,072 | $0.50 | $2.15 | 81.0% | - | 85.0% | |
GLM-4.6 | Open | 357 | 131,072 | $0.60 | $2.00 | 81.0% | - | - | |
Claude Opus 4.1 | Propriétaire | - | 200,000 | $15.00 | $75.00 | 80.9% | - | - | |
GPT OSS 120B | Open | 116.8 | 131,072 | $0.09 | $0.45 | 80.1% | - | - | |
DeepSeek-V3.2-Exp | Open | 685 | 163,840 | $0.27 | $0.41 | 79.9% | - | 85.0% | |
Claude Opus 4 | Propriétaire | - | 200,000 | $15.00 | $75.00 | 79.6% | - | - |
Classements IA
Meilleurs modèles et fournisseurs d’API dans chaque catégorie
FAQ
Nous agrégeons automatiquement les chiffres publics de LLM Stats (tableau et cartes) afin de proposer un classement synthétique.
Quotidiennement via un script automatisé. Un rafraîchissement manuel peut ponctuellement être déclenché si besoin.
Code (Aider Polyglot) / Multimodal (MMMU) / Connaissances (GPQA) : scores de benchmark en %.
Contexte : longueur maximale d’entrée (en tokens).
Coût : prix d’input par 1M tokens. Débit : tokens générés par seconde.
C’est le coût facturé pour traiter un million de tokens d’entrée (hors sortie). Les tarifs peuvent varier selon le modèle et la région.
Non. Le débit mesure la vitesse de génération soutenue ; la latence initiale n’est pas directement représentée.
Il peut être absent des tableaux publics, renommé, ou retiré temporairement par son fournisseur. Nous reflétons l’état public du moment.
Les fournisseurs ajustent fréquemment modèles et tarifs. Les écarts viennent aussi des conditions de test (versions, régions, quotas).
Oui, pour un usage informatif en citant la source. Vérifiez néanmoins les licences et mentions légales des fournisseurs d’origine.
Contactez-nous via la page contact avec le modèle concerné et une source publique (page prix, doc ou benchmark).
Nous utilisons “IA” au sens large et “LLM” pour désigner les modèles de langage évalués ; le classement cible principalement les LLM et leurs API.