- Les IA réussissent des examens difficiles, mais un score de QI n'a pas le même sens pour une machine que pour un humain.
- Elles excellent en vitesse et en volume, mais échouent parfois sur des questions élémentaires.
- L'humain reste devant pour l'apprentissage à partir d'un seul exemple, le bon sens et la compréhension incarnée.
- La bonne question n'est pas « qui est le plus intelligent », mais « en quoi ces intelligences diffèrent ».
Depuis 2022, une succession de démonstrations spectaculaires a bouleversé le débat public sur l'intelligence artificielle. Les grands modèles de langage — GPT-4, Claude, Gemini — réussissent l'examen du barreau américain mieux que 90 % des candidats humains, obtiennent la médaille d'or aux Olympiades internationales de mathématiques, rédigent des diagnostics médicaux d'une qualité comparable à celle des internes en médecine. Faut-il en conclure que les machines sont désormais "plus intelligentes" que nous ? La question est plus piégée qu'elle ne paraît, et la réponse exige de clarifier ce que nous entendons, au fond, par intelligence.
Les performances mesurées : un inventaire honnête
Sur les tests psychométriques conçus pour les humains, les grandes IA contemporaines obtiennent effectivement des scores élevés. Un article publié par OpenAI en 2023 rapporte que GPT-4 atteint :
- le 90e percentile à l'Uniform Bar Exam (examen américain du barreau) ;
- le 99e percentile au USA Biology Olympiad Semifinal ;
- le 89e percentile au SAT Math ;
- le 93e percentile au SAT Reading.
Sur des tests de raisonnement verbal et analogique — type Raven simplifié, analogies, séries — les scores extrapolés donnent des équivalents de QI souvent cités entre 130 et 160. Ces chiffres alimentent les titres sensationnalistes, mais ils méritent une lecture prudente que nous allons détailler.
Ce que les IA font spectaculairement mieux que nous
Il serait malhonnête de relativiser les succès des IA. Sur plusieurs dimensions, les modèles actuels surpassent très largement les capacités humaines :
- Vitesse de traitement — une IA lit et synthétise un rapport de 100 pages en quelques secondes, là où un humain expert met des heures.
- Mémoire de travail — les modèles récents traitent des contextes de plusieurs centaines de milliers de mots simultanément. Aucun humain ne peut maintenir 100 000 tokens d'information active en mémoire de travail.
- Largeur encyclopédique — une IA entraînée sur des trillions de mots a été exposée à plus de textes qu'aucun humain ne pourrait lire en dix vies.
- Cohérence syntaxique — elles produisent rarement des phrases grammaticalement incorrectes ou incohérentes localement.
- Disponibilité permanente — pas de fatigue, pas de jour off, pas de biais d'humeur.
Ces capacités expliquent pourquoi les IA s'avèrent déjà utiles dans une grande variété de tâches professionnelles — relecture, synthèse, recherche documentaire, génération de code, traduction, éducation. Elles ne remplacent pas les humains, mais augmentent considérablement leur productivité dans les tâches cognitives répétitives.
Ce que les IA font moins bien, parfois catastrophiquement moins bien
Les mêmes modèles qui résolvent des problèmes de mathématiques de niveau olympiade commettent régulièrement des erreurs absurdes sur des questions élémentaires. Ils affirment avec assurance des choses fausses, inventent des sources inexistantes (phénomène des "hallucinations"), échouent à compter le nombre de lettres dans un mot ou à comparer deux dates, se laissent piéger par des questions reformulées de manière inhabituelle.
Ces échecs ne sont pas anecdotiques. Ils révèlent une différence profonde entre ce que font les IA et ce que fait le cerveau humain. Un humain qui connaît le théorème de Pythagore peut répondre à une question sur Pythagore reformulée de n'importe quelle façon. Les IA reposent sur des corrélations statistiques apprises à partir d'énormes masses de texte, et restent fragiles lorsque la distribution des données d'entrée s'écarte de ce qu'elles ont vu à l'entraînement. On parle de brittleness — fragilité — et de faible robustesse à la distribution.
Plus fondamentalement, les IA ne comprennent pas la causalité. Elles capturent magnifiquement ce qui se produit ensemble, mais pas pourquoi. Elles peuvent prédire que la foudre est suivie du tonnerre sans comprendre qu'il s'agit du même phénomène observé selon deux sens différents. Le chercheur Judea Pearl, prix Turing 2011, a fait de cette limite le cœur de sa critique des systèmes d'apprentissage statistique.
Le test de QI mesure-t-il la même chose chez une IA ?
Quand un humain obtient 155 à un test de QI, ce chiffre signifie quelque chose de précis : il résume la position relative de cet individu dans une distribution de capacités cognitives humaines qui corrèlent fortement entre elles — la fameuse "intelligence générale" ou facteur g. Il prédit, avec une certaine fiabilité, d'autres performances cognitives non testées, la réussite scolaire, la santé, et même la longévité.
Rien de tel ne se passe quand on "teste" une IA. Son score ne prédit pas ses performances sur des tâches légèrement différentes (elle peut exceller à l'examen du barreau et échouer à organiser un emploi du temps). Il ne se maintient pas à travers le temps (une modification du prompt peut faire chuter le score de 30 points). Il ne reflète aucune propriété biologique stable — juste la proximité entre les questions et ce que le modèle a vu pendant son entraînement.
Comparer "le QI de GPT-4" au "QI d'Einstein" est donc une erreur de catégorie — comme dire qu'un avion est "plus rapide qu'un cheval". L'échelle est la même, la signification est différente. L'IA excelle dans un ensemble de tâches de manière impressionnante ; elle n'a pas pour autant "plus d'intelligence" qu'un humain au sens global que ce mot revêt dans la recherche sur l'intelligence humaine.
La question philosophique : compréhension ou simulation ?
Ce débat ressurgit avec les IA : produit-on de l'intelligence ou simule-t-on des comportements intelligents ? John Searle, avec son expérience de pensée de la "chambre chinoise" (1980), défendait que la manipulation syntaxique de symboles, aussi sophistiquée soit-elle, n'équivaut pas à la compréhension sémantique. Un homme dans une chambre, manipulant des symboles chinois selon des règles, peut produire des réponses qui semblent compréhensives sans comprendre un mot de chinois.
Les IA d'aujourd'hui ressemblent troublantement à cette chambre chinoise industrielle : elles produisent des réponses pertinentes sans qu'il y ait quelqu'un "à l'intérieur" pour comprendre. La philosophie de l'esprit continue de débattre de ce que cela implique, et les réponses dépendent lourdement de ce qu'on considère comme nécessaire pour parler d'intelligence ou de conscience.
Ce que les humains restent seuls à faire (pour l'instant)
Au-delà des performances mesurables, plusieurs capacités distinguent radicalement la cognition humaine :
- L'apprentissage "one-shot" — un humain peut apprendre un concept nouveau à partir d'un seul exemple. Les IA ont besoin de milliers, parfois de millions d'exemples.
- L'intentionnalité — les humains ont des buts, des préférences qui émergent de leur histoire vécue. Les IA n'ont que les objectifs qu'on leur impose lors de l'entraînement.
- La créativité "hors distribution" — produire quelque chose de radicalement nouveau, au sens d'une rupture avec les patterns existants. Les IA extrapolent brillamment dans l'espace de leurs données ; les ruptures scientifiques majeures (relativité, théorie de l'évolution) semblent appartenir encore à l'humain.
- L'expérience subjective — le qualia, l'impression d'"être quelque chose" de l'intérieur. Personne ne sait, à ce jour, si une IA en a — mais il n'y a aucune raison positive de le croire.
Conclusion : comparer vaut moins qu'articuler
La question "qui est le plus intelligent, l'humain ou l'IA ?" est mal posée. Les intelligences artificielles ne sont pas des humains améliorés ; elles sont une forme radicalement différente de traitement de l'information, avec ses forces et ses faiblesses propres. La question productive est plutôt : comment articuler ces deux formes d'intelligence pour résoudre ensemble des problèmes ? C'est là que se joue la transformation en cours — dans la coopération homme-machine plus que dans la substitution.
Questions fréquentes
Une IA a-t-elle un QI ?
L'IA est-elle plus intelligente que l'homme ?
Pourquoi les IA font-elles parfois des erreurs absurdes ?
Sources
Chaque reference est cliquable vers la recherche correspondante sur Google Scholar pour verification.
- OpenAI, GPT-4 Technical Report, 2023.
- Bubeck S. et al., "Sparks of Artificial General Intelligence: Early experiments with GPT-4", Microsoft Research, 2023.
- Pearl J., Mackenzie D., The Book of Why, Basic Books, 2018.
- Searle J., "Minds, Brains, and Programs", Behavioral and Brain Sciences, 1980.
- Marcus G., Davis E., Rebooting AI, Pantheon, 2019.