Pourquoi faisons-nous parfois de mauvais choix ? L’un des principaux responsables est le biais de redoublement

La raison pour laquelle les humains prennent des décisions apparemment irrationnelles n’est pas un dysfonctionnement aléatoire du cerveau, mais le produit de mécanismes d’apprentissage spécifiques qui, bien que avantageux sur le plan évolutif, peut échouer dans des contextes modernes. À la base de nos décisions se trouve le « renforcement« , un processus cognitif fondamental partagé avec de nombreuses espèces animales, qui nous pousse à répéter les actions suivies de récompenses et éviter celles suivies de punitions. Cependant, des recherches récentes ont montré que ce système n’est pas tant une question de précision que d’efficacité pratique : le cerveau souhaite survivre et obtenir des résultats immédiatsn’ayant pas forcément une solution parfaite, même au prix d’une représentation incorrecte de la réalité. Cet écart entre réalité objective et perception subjective génère des biais systématiques qui influencent nos choix de manière prévisible.

Qu’est-ce que le biais de répétition

Le premier grand responsable de nos mauvais choix est une forme d’inertie cognitive connue sous le nom de «biais de répétition« . Contrairement à la théorie économique classique, qui imagine l’homme comme un calculateur rationnel qui évalue chaque option en fonction de sa valeur attendue, nous avons tendance à répéter un choix simplement parce que nous l’avons déjà fait dans le passé, quel que soit le résultat obtenu. Ce phénomène, qui rappelle la « Loi de l’Exercice » formulée par Thorndike il y a plus d’un siècle, suggère que leacte même de choisir une option augmente la probabilité de le sélectionner à nouveau dans le futur, créant ainsi un cercle vicieux de persévérance.

Des études récentes ont montré que cette tendance à la répétition altère notre perception de la valeur : nous finissons par surestimer les options que nous choisissons souvent et à développer une certitude injustifiée sur leur bonté, même lorsqu’il existe des alternatives objectivement meilleures. Il a été observé que la répétition d’un choix réduit le sentiment d’incertitude perçueun mécanisme qui sert probablement à économiser de l’énergie mentale dans des environnements complexes. En pratique, le cerveau préfère la cohérence et la facilité d’une action habituelle à l’effort de réévaluation constante des alternatives, ce qui nous amène à persévérer dans l’erreur même face à des preuves contraires.

Esclaves du contexte

Un deuxième facteur déterminant est l’incapacité du cerveau à évaluer les options de manière isolée : nous sommes plutôt esclaves du contexte et de l’optimisme. Nos évaluations internes sont soumises à distorsions dans la façon dont nous stockons et traitons les informations. Si une option médiocre est présentée dans un contexte d’alternatives terribles, elle nous semblera excellente, et nous continuerons à la choisir même lorsque le contexte changera et qu’elle deviendra désavantageuse.

À cela s’ajoute le « biais de positivité » : nous avons tendance à mettre à jour nos croyances beaucoup plus rapidement lorsque nous recevons une « bonne nouvelle » que lorsque nous recevons une mauvaise nouvelle. Cet optimisme inhérent nous amène à surestimer notre probabilité de succès et ignorer les signes avant-coureurs, un trait qui peut favoriser l’ingéniosité mais conduit souvent à des évaluations irréalistes. Par ailleurs, nous sommes naturellement plus confiants lorsque nous essayons de réaliser un profit que lorsque nous essayons d’éviter une perte, même si la difficulté objective de la tâche est identique. Le cortex préfrontal ventromédian joue un rôle crucial dans ce processus, codant une sorte de « confiance inconditionnelle« un subjectif qui intègre ces biais affectifs, se détachant parfois de la précision réelle de nos performances.

Même cerveau, décisions différentes

Enfin, nos mauvais choix sont souvent le résultat d’un conflit ancestral entre différents systèmes de décision: Le Système pavlovien (par le grand physiologiste Ivan Pavlov, lauréat du prix Nobel) et que instrumental.

Pavlov expérimente le conditionnement du behaviorisme canin

Le système pavlovien est un mécanisme « préprogrammé » qui nous pousse à nous approcher de stimuli prometteurs de récompenses et à nous inhiber ou à fuir face à des menaces de punition. Bien qu’utile dans la nature, cet instinct peut entrer en conflit avec des objectifs modernes plus complexes exigeant, par exemple, d’agir activement pour éviter tout préjudice ou de se retenir pour obtenir un avantage futur. Lorsque nous nous trouvons dans des contextes de perte ou de punition potentielle, un temps de réaction lents et une baisse de confiance, comme si le cerveau « gelait » les ressources cognitives et motrices.

Des études de neurostimulation ont montré que Cortex préfrontal dorsolatéral il est essentiel de supprimer ces impulsions automatiques et de favoriser un comportement axé sur les objectifs. Lorsque cette zone du cerveau ne parvient pas à exercer un contrôle efficace, le biais pavlovien prévaut et les réactions automatiques prennent le dessus : on finit ainsi par éviter les actions nécessaires Oh effectuer des actions impulsives. Il est intéressant de noter que la stimulation de cette zone cérébrale peut spécifiquement réduire les biais, ce qui suggère que notre cerveau gère les circuits de récompense et de punition par des voies partiellement distinctes. En conséquence, l’erreur n’est pas seulement un court-circuit logique, mais souvent le résultat d’un manque de médiation neuronale entre les instincts de survie immédiats et la planification rationnelle.

Sources

Degni et al., 2026, La mise à jour réduite de la valeur pavlovienne modifie la prise de décision dans les trackers de signes. Wagner et al., 2024, Expliquer les biais décisionnels par la répétition dépendante du contexte. Badioli et al., 2024, Démêler l’influence des indices pavloviens sur la prise de décision : une méta-analyse pré-enregistrée sur le transfert pavlovien-instrumental. Kim et al., 2023, Rôle causal du cortex préfrontal dorsolatéral dans la modulation de l’équilibre entre les systèmes pavlovien et instrumental dans le domaine de la punition. Palmintieri, 2025, Processus et biais d’apprentissage par renforcement humain : caractérisation informatique et applications possibles aux politiques publiques comportementales. Ting et al., 2020, Transferts robustes de pavlovien à instrumental et de pavlovien à métacognitif dans l’apprentissage par renforcement humain. Ting et al., 2023, Fondements neuronaux et informatiques d’une confiance biaisée dans l’apprentissage par renforcement humain. Sosa et al., 2021, Le rôle de l’Habenula latérale dans l’apprentissage inhibiteur par omission de récompense.