- L’équilibre de Nash décrit une situation stable où aucun joueur n’a intérêt à changer seul sa stratégie.
- Il repose sur les meilleures réponses de chaque joueur, dans un jeu non coopératif et rationnel.
- Un équilibre de Nash peut être stable sans être optimal collectivement, comme dans le dilemme du prisonnier.
- Pour le repérer, comparez les gains, identifiez les meilleures réponses et cherchez leur intersection.
- Les stratégies mixtes deviennent utiles quand il faut rester imprévisible ou qu’aucun équilibre pur n’existe.
L’équilibre de Nash sert à répondre à une question très simple : que fait chaque joueur lorsqu’il anticipe les choix des autres ? Si, compte tenu de ce que font les autres, personne n’a intérêt à changer seul de stratégie, on se trouve dans une situation stable. Ce n’est pas forcément une bonne nouvelle pour tout le monde. C’est simplement un point d’arrêt crédible dans une interaction stratégique, et cela change beaucoup de choses quand il faut décider vite et juste.
Équilibre de Nash : la définition simple à retenir
L’idée de départ tient en une phrase, puis on peut passer à une version plus rigoureuse sans perdre le fil.
Une définition simple, puis la version formelle
Définition simple : un équilibre de Nash est une situation où, compte tenu du choix des autres, aucun joueur n’a intérêt à changer seul de stratégie. C’est donc un point d’équilibre dans un jeu non coopératif, où chacun cherche à maximiser son gain sans pouvoir imposer sa décision aux autres.
La version formelle est très proche, mais plus précise. On parle d’un profil de stratégies dans lequel chaque stratégie est une meilleure réponse aux stratégies des autres joueurs. Autrement dit, chaque joueur choisit la réponse qui lui donne le meilleur paiement possible, sachant ce que font les autres.
Vous voyez la logique ? Ce n’est pas “le meilleur résultat pour tous”. C’est plutôt la situation où personne ne gagne à bouger seul, ce qui donne une forme de stabilité.
Pourquoi ce n’est pas forcément le meilleur résultat pour tous
C’est là que le concept devient intéressant. Un équilibre peut être stable sans être optimal collectivement. Comme une caisse de supermarché mal répartie, ou un embouteillage où tout le monde choisit la voie la plus rassurante et finit quand même coincé.
Dans beaucoup de situations, chacun raisonne correctement de son point de vue, mais le résultat global est décevant. On parle alors d’inefficacité : tout le monde aurait pu gagner davantage avec un autre agencement, souvent grâce à un peu de coopération ou à des règles mieux pensées.
Le dilemme du prisonnier illustre très bien ce point, mais on peut déjà retenir l’idée suivante. L’équilibre de Nash n’est pas un synonyme de bon résultat, c’est un synonyme de résultat stable sous des comportements rationnels.
Le cadre du jeu : ce que chaque joueur anticipe vraiment
Pour utiliser le concept correctement, il faut regarder le contexte du jeu, la quantité d’information disponible et la manière dont les décisions s’enchaînent.
Jeu non coopératif, décisions simultanées, information disponible
Un jeu non coopératif est une interaction où chacun décide pour son propre compte, sans accord contraignant avec les autres. Cela ne veut pas dire qu’il n’y a pas de coopération informelle, mais simplement qu’aucun engagement n’oblige les joueurs à tenir leur promesse.
Le cas le plus classique est le jeu simultané : les joueurs choisissent en même temps, ou sans connaître exactement le choix des autres. On peut aussi avoir des jeux séquentiels, où l’ordre compte, mais l’équilibre de Nash reste un premier cadre de lecture utile.
Selon les cas, on dispose d’information complète ou d’information imparfaite. Quand tout le monde connaît les règles, les gains et les options, l’analyse est plus simple. Dans le cas contraire, l’anticipation devient centrale, et la décision ressemble vite à un pari raisonné.
Meilleure réponse, stratégie dominante, stratégie dominée : ne mélangez pas tout
La meilleure réponse est la stratégie qui maximise votre paiement pour un choix donné de l’autre joueur. Si l’autre joue A, quelle est votre meilleure action ? Si l’autre joue B, quelle est votre meilleure action ? C’est cette logique de réponse conditionnelle qui structure l’équilibre.
Une stratégie dominante est plus forte encore. Elle reste la meilleure quelle que soit la décision des autres. À l’inverse, une stratégie dominée est toujours moins bonne qu’une autre, et on peut souvent l’écarter sans regret.
Voici la différence, en version très simple :
| Notion | Idée clé | Dépend du choix des autres ? |
|---|---|---|
| Meilleure réponse | Maximise votre gain dans un cas donné | Oui |
| Stratégie dominante | Meilleure dans tous les cas | Non |
| Stratégie dominée | Toujours moins bonne qu’une autre | Non, elle est inférieure partout |
| Équilibre de Nash | Les meilleures réponses se croisent | Oui |
On peut donc avoir un équilibre sans stratégie dominante. On peut aussi repérer une stratégie dominée à éliminer avant même de chercher l’équilibre. Question simple, mais utile : qu’est-ce qui change si l’autre bouge ?
Comment repérer une solution stable dans une matrice de gains
Quand on passe à une matrice des gains, la lecture devient beaucoup plus concrète. On cherche les croisements de meilleures réponses, pas une formule magique.
La méthode en trois étapes pour trouver l’issue stable
D’abord, lisez les gains joueur par joueur, sans vous tromper entre les paiements. Dans une matrice 2×2, on regarde souvent le premier chiffre pour le joueur en ligne, le second pour le joueur en colonne, puis on compare les options.
Ensuite, marquez la meilleure réponse de chaque joueur pour chaque action adverse. Si l’autre choisit telle case, quelle option vous donne le gain le plus élevé ? Cette étape ressemble à une check-list, et honnêtement, elle évite pas mal d’erreurs.
Enfin, repérez les cases où les meilleures réponses se croisent. Ce sont les équilibres en stratégie pure, aussi appelés équilibres en stratégie pure quand chacun choisit une action fixe, sans hasard.
Exemple pas à pas : le dilemme du prisonnier
Prenons l’exemple classique. Deux joueurs peuvent coopérer ou faire défection. La matrice de gains ressemble souvent à cela, avec un résultat individuel plus sûr en cas de défection, mais un résultat collectif meilleur si les deux coopèrent.
| Joueur 2 | Coopérer | Faire défection |
|---|---|---|
| Joueur 1 coopère | 3, 3 | 0, 5 |
| Joueur 1 fait défection | 5, 0 | 1, 1 |
Si le joueur 2 coopère, le joueur 1 préfère faire défection, car 5 est mieux que 3. Si le joueur 2 fait défection, le joueur 1 préfère encore faire défection, car 1 est mieux que 0. La défection est donc la meilleure réponse de chacun.
Le point clé est là : (défection, défection) est un équilibre de Nash, car aucun joueur ne peut améliorer son gain en changeant seul. Pourtant, (coopération, coopération) donne un meilleur résultat pour les deux. C’est la version la plus nette de l’idée “stable mais pas optimal”.
Autre cas utile : le jeu de coordination
Dans un jeu de coordination, deux joueurs ont intérêt à choisir la même option. Pensez à deux standards technologiques, ou à deux personnes qui doivent se retrouver au même café sans se parler. Ici, le problème n’est pas de se battre, mais de tomber d’accord sur le même point.
Ce type de jeu peut générer des équilibres multiples. Si tout le monde pense que les autres vont choisir A, alors A devient rationnel. Si tout le monde pense que les autres vont choisir B, alors B devient rationnel aussi.
La question devient alors celle de la sélection d’équilibre. Les habitudes, les signaux, la réputation ou une convention commune permettent souvent d’orienter les anticipations. Vous avez déjà vu cela dans les marchés où une norme finit par s’imposer sans être “meilleure” au sens absolu ?
Quand il faut mélanger ses choix plutôt que les figer
Tous les jeux ne se résolvent pas avec une stratégie fixe. Dans certains cas, il faut randomiser.
Stratégie pure ou stratégie mixte : la différence qui change la lecture
Une stratégie pure consiste à choisir une action fixe. Une stratégie mixte consiste à attribuer une probabilité à plusieurs actions possibles, un peu comme une loterie stratégique. On ne dit pas “je fais toujours X”, on dit “je fais X dans 60 % des cas et Y dans 40 % des cas”.
Pourquoi faire cela ? Parce qu’un joueur trop prévisible devient exploitable. Si l’autre peut lire votre comportement, il ajuste sa réponse et capte la valeur. La randomisation sert donc à garder l’adversaire indifférent entre plusieurs options.
Dans certains jeux, aucun équilibre n’existe en stratégie pure, ou bien la stratégie mixte est la seule manière d’obtenir un point stable. On calcule alors la probabilité qui rend l’autre joueur indifférent entre deux actions. C’est très mathématique, mais l’idée opérationnelle reste simple : éviter d’être lisible.
| Élément | Stratégie pure | Stratégie mixte |
|---|---|---|
| Choix | Fixe | Mélangé avec probabilités |
| Visibilité | Forte | Faible |
| Objectif | Stabilité simple | Imprévisibilité |
| Usage fréquent | Jeu simple ou coordination | Jeu concurrentiel ou mixte |
Le cas du poker : randomiser pour ne pas devenir lisible
Le poker est un bon exemple, parce qu’il mêle information imparfaite, anticipation et calcul des fréquences. Miser, suivre ou bluffer ne se réduit pas à l’intuition du moment. On construit plutôt une distribution de décisions qui protège votre jeu sur la durée.
Si vous bluffez toujours, vous êtes vite exploité. Si vous ne bluffez jamais, vous devenez facile à lire. La bonne logique consiste donc à doser, pour conserver une forme d’absence de regret sur le long terme.
Le poker appartient aussi aux jeux à somme nulle dans leur version simplifiée, où le gain de l’un correspond à la perte de l’autre. Là encore, l’équilibre de Nash aide à comprendre pourquoi une stratégie apparemment bizarre peut être rationnelle. Le saviez-vous ? Dans ce cadre, l’objectif n’est pas de gagner à chaque main, mais de ne pas offrir de prise.
Ce que ce concept éclaire… et ce qu’il ne résout pas
L’équilibre de Nash est un excellent outil pour lire une interaction stratégique, mais il ne ferme pas tous les sujets. Il faut encore regarder les incitations, la séquence des décisions et l’information disponible.
Équilibres multiples, issue inefficace, coopération : les trois limites à garder en tête
Premier point, un jeu peut avoir plusieurs équilibres. Cela complique la prévision, parce que la théorie dit “voici des points stables”, sans toujours dire lequel sera observé. Dans la vraie vie, les conventions et les signaux font souvent la différence.
Deuxième point, un équilibre peut être sous-optimal. Les joueurs s’y tiennent parce que s’en écarter seul serait pire, pas parce que tout le monde y gagne vraiment. C’est exactement là que la coopération, les contrats ou les règles du jeu peuvent changer la donne.
Troisième point, certaines situations appellent des engagements crédibles. Un dirigeant, par exemple, peut vouloir éviter une guerre des prix, mais sans mécanisme de coordination, chacun a intérêt à casser les marges. On retrouve alors la tension classique entre non-coopération et amélioration collective.
Aller un cran plus loin : fonction de meilleure réponse et équilibre parfait en sous-jeux
La fonction de meilleure réponse, parfois appelée à tort “fonction de Nash”, associe à chaque choix adverse votre meilleure action. Elle sert à visualiser les points où les réactions se croisent. C’est un outil très pratique pour voir la dynamique d’un jeu sans se perdre dans les détails.
Pour les jeux séquentiels, on va plus loin avec l’équilibre parfait en sous-jeux. L’idée est simple : la stratégie doit rester cohérente à chaque étape, pas seulement au départ. On élimine ainsi des menaces non crédibles et des promesses impossibles à tenir.
Si vous devez retenir une chose, gardez celle-ci : l’équilibre de Nash est un très bon point de départ, pas forcément le dernier mot. Il vous dit si une issue tient debout quand chacun agit pour soi. Ensuite, il faut encore regarder la séquence, l’information et les possibilités de coopération.

Passer à l’action avec le bon critère
L’intérêt concret du concept est simple : il vous aide à lire une décision stratégique sans vous raconter d’histoires. Quand vous analysez un marché, une négociation ou un arbitrage interne, posez toujours la même question : qu’est-ce que chacun fait quand il anticipe les autres ?
Si vous voyez les incitations, les meilleures réponses et le niveau d’information, vous voyez déjà beaucoup plus clair. Et si l’équilibre obtenu est stable mais mauvais pour tous, alors le sujet n’est pas le calcul, mais la règle du jeu. C’est souvent là que se joue la vraie décision.
Foire aux questions
Qu’est-ce qu’un équilibre de Nash, simplement ?
C’est une situation où chaque joueur a choisi sa meilleure réponse compte tenu des choix des autres, donc personne n’a intérêt à changer seul de stratégie. L’équilibre de Nash décrit une stabilité stratégique, pas forcément un résultat optimal pour tous.
Pourquoi un équilibre de Nash peut-il être stable mais défavorable collectivement ?
Parce que chaque joueur raisonne individuellement et protège son propre gain, même si ce comportement mène à une issue moyenne ou médiocre pour le groupe. Le dilemme du prisonnier illustre bien ce décalage entre rationalité individuelle et intérêt collectif.
Comment repérer un équilibre de Nash dans une matrice de gains ?
On compare d’abord les gains de chaque joueur selon la décision de l’autre, puis on cherche les meilleures réponses de part et d’autre. La case où ces meilleures réponses se croisent correspond à un équilibre de Nash en stratégie pure.
Quelle différence entre stratégie pure et stratégie mixte dans l’équilibre de Nash ?
Une stratégie pure consiste à choisir toujours la même action, alors qu’une stratégie mixte répartit les décisions selon des probabilités. Cette seconde approche devient utile quand être trop prévisible permet à l’autre de vous exploiter, comme au poker.
Qu’appelle-t-on un équilibre parfait en sous-jeux ?
C’est une version plus exigeante de l’équilibre de Nash pour les jeux séquentiels. La stratégie doit rester cohérente à chaque étape du jeu, pas seulement au départ, ce qui élimine les menaces ou promesses qui ne tiennent pas quand on arrive au moment de jouer.