vendredi 3 septembre 2021

Qu'est-ce qu'une explication scientifique ?

Enrico Fermi at the blackboard

La notion d'explication est indéniablement centrale en science. Nous avons vu dans l'article précédent qu'elle est associée à un mode d'inférence particulier, l'abduction, ou inférence à la meilleure explication. On peut dire que le rôle principal des théories scientifiques, des modèles et des hypothèses est d'expliquer les phénomènes du monde, et donc que le but principal de la science est de produire des explications à ces phénomènes.

En effet, une théorie scientifique ne se contente généralement pas de simplement décrire et classifier les phénomènes : elle les explique, par exemple en postulant des entités inobservables ou des lois qui les produisent (on explique la chute des corps en postulant des forces de gravitation). On a souvent tendance à penser que ce faisant, elles nous offrent une compréhension du monde plus profonde, moins superficielle que ne le ferait un simple compte rendu synthétique des régularités observables.

Mais c'est quoi exactement expliquer ? Et pourquoi est-ce si important pour nous d'expliquer les choses ?

Le modèle nomologico-deductif

Dans les années 1940, Hempel et Oppenheim proposent un modèle général d'explication qui servira de point de départ pour les débats autour de cette notion. 

Quand on plonge un thermomètre au mercure dans de l'eau chaude, la colonne de mercure commence par descendre légèrement avant de remonter rapidement. Ceci s'explique par le fait que la chaleur affecte d'abord le verre, qui se dilate et fait baisser la colonne, avant d'atteindre le mercure. On trouve dans cette explication la spécification des éléments suivants :

Des conditions
le thermomètre est un tube de verre contenant du mercure, le thermomètre est plongé dans l'eau chaude.
Des lois générales
la dilatation du verre, celle du mercure, la conductivité thermique du verre (voir l'article sur les lois de la nature).

Selon Hempel et Oppenheim, ces éléments, lois et conditions, sont nécessaires à toute explication, et ils expliquent le phénomène observé dans la mesure où l'on peut déduire logiquement le phénomène à expliquer à partir de ces lois et de ces conditions. Une explication prend donc la forme d'un argument déductif dont la conclusion est ce que l'on souhaite expliquer : nous avons telles conditions et telles lois, donc, le phénomène se produit. En ce sens elle n'est pas fondamentalement différente d'une prédiction, si ce n'est que l'on sait déjà que le phénomène prédit s'est produit : l'explication nous montre seulement pourquoi le phénomène devait se produire, pourquoi on devait s'y attendre, pourquoi il était inévitable, ou au moins pourquoi il était très probable (Hempel a étendu son modèle aux lois statistiques).

Muddy car tire

C'est une idée somme toute assez intuitive. On pourrait objecter que la plupart des explications de la vie courante ne suivent pas strictement ce modèle. Ainsi on expliquera un accident de voiture par le fait qu'un pneu a éclaté, sans fournir de circonstances et de lois suffisamment précises pour prédire l'accident à partir de l'éclatement du pneu. Mais selon Hempel et Oppenheim, c'est parce que ce que nous appelons explication dans la vie courante est en général seulement une ébauche d'explication. Nous donnons certains éléments qui laissent penser qu'il doit exister une explication plus complète, et cette explication plus complète prendra la forme de conditions et de lois permettant de déduire le phénomène à expliquer.

Cependant cette réponse ne convainc pas tout le monde. Est-il vraiment nécessaire qu'il existe une loi de la nature pour toute explication ? Est-ce que ça ne reviendrait pas à ramener toutes les explications aux sciences physiques, alors que la biologie, par exemple, pourrait disposer d'une certaine autonomie explicative sans faire référence à des lois parfaitement générales ? On peut au moins douter que les lois doivent forcément rendre le phénomène à expliquer probable. On pourra par exemple expliquer une maladie par des prédispositions génétiques quand bien même les cas sont extrêmement rares, y compris chez les gens ayant ces prédispositions. Ainsi la notion d'explication de Hempel et Oppenheim semble trop exigeante à certains égards.

Elle est trop permissive, ou incomplète, à d'autres égards. Notons par exemple que les lois de la physique sont souvent symétriques. Ainsi il est possible de déduire la taille de l'ombre d'un poteau en connaissant la taille du poteau et la position du soleil, à partir des lois de l'optique, mais on peut aussi déduire la taille du poteau en connaissant celle de son ombre à l'aide des mêmes lois. Pourtant, si l'on peut dire que la taille du poteau explique la taille de l'ombre, l'inverse semble plutôt bizarre. De même, on pourra associer par des lois le fait que l'aiguille de mon baromètre se déplace et le fait qu'il y ait une tempête, pourtant les deux n'ont pas de rapports explicatifs (ils s'expliquent plutôt tous deux par une cause commune, l'augmentation de la pression atmosphérique). Il manque donc quelque-chose à ce modèle d'explication pour rendre compte du fait que contrairement aux lois, les explications ne sont pas symétriques.

Plus généralement, cette conception des explications souffre d'un problème de pertinence des facteurs explicatifs. Au sens de Hempel, "les êtres humains prenant une pilule contraceptive n'ont pas de grossesse" est une loi (un énoncé parfaitement général). On peut déduire de cette loi que Jean, un homme qui a pris la pilule contraceptive, n'aura pas de grossesse. Mais le fait qu'il ait pris la pilule n'est pas le facteur pertinent : puisque Jean n'a pas d'uterus, il n'aurait pas eu de grossesse de toute façon. Il faudrait donc ajouter des critères au modèle de Hempel et Oppenheim pour distinguer les facteurs explicatifs pertinents de ceux qui ne le sont pas.

South pole flags sundog

Explication et causalité

Vers les années 1970-80, ces remarques ont amené les philosophes à associer plus étroitement explication et causalité. En effet, dans l'exemple mentionné plus haut, c'est le poteau qui est la cause de la formation d'une ombre d'une certaine taille et non l'inverse : contrairement aux lois de la physique, la causalité n'est pas symétrique. De même, c'est l'absence d'utérus, et non la pilule, qui est la cause de l'absence de grossesse de Jean. La causalité est plus sélective que ne le sont les lois générales.

L'idée est qu'expliquer, ce ne serait pas produire un argument déductif. Ce serait plutôt situer les phénomènes dans une histoire ou une structure causale. La relation liant le phénomène et son explication ne serait pas une relation purement logique située dans le langage, mais une relation causale située dans le monde. Pour comprendre ce qu'est une explication, il suffirait donc de comprendre ce qu'est la causalité. Ce changement de perspective suit un mouvement plus général en philosophie des sciences, à cette époque, de renouveau de la métaphysique et d'éloignement des approches purement empiriques, uniquement centrées sur l'analyse linguistique des énoncés scientifiques en termes d'observations, approches dans lesquelles se situaient Hempel et Oppenheim : voir l'article sur l'empirisme logique.

Constatant les problèmes de pertinence qui affectent le modèle nomologico-deductif, le philosophe Salmon a proposé de comprendre la causalité en termes de pertinence statistique. Suivant une approche répandue en fin de 20e siècle, on peut dire que A cause B si la probabilité de B sachant A est supérieure à la probabilité de B seule. En d'autre terme, une cause est ce qui augmente la probabilité d'un effet. La pilule contraceptive ne change pas la probabilité de Jean d'avoir une grossesse, et n'est donc pas une cause pertinente. Il faut juste en dire un peu plus pour éviter les effets statistiques trompeurs, comme le paradoxe de Simpson. Selon Salmon, pour bien identifier une cause, il convient de caractériser le système de la manière la plus fine possible, mais pas trop fine, de façon à ce que les différents états possibles du système impliquent toujours des probabilités différentes pour l'effet.

Rembrandt Christ in the Storm on the Lake of Galilee

[Une illustration du paradoxe de Simpson: le tabac cause le cancer du poumon, mais la pollution atmosphérique des villes également. Imaginez qu'il y ait plus de fumeurs à la campagne qu'en ville, et que la pollution atmosphérique soit un facteur plus aggravant que le tabac. Dans ce cas, on pourrait observer que les fumeurs ont globalement moins de cancer du poumon. Cependant ça ne signifie pas que le tabac diminue le risque de cancer : si l'on considère isolément les villes et les campagnes, les fumeurs ont plus de risque de cancer du poumon dans l'un ou dans l'autre. À l'échelle globale, ils sont simplement moins exposés à la pollution atmosphérique pour des raisons indépendantes. Dans ce cas, une bonne caractérisation du système suppose de différencier vivre en ville ou à la campagne pour la probabilité de cancer du poumon, afin d'éviter les corrélations fortuites, mais pas avoir les cheveux blonds ou bruns, car alors différents états du système donneraient la même probabilité.]

Cette première approche ne permet pas cependant de toujours différencier les rapports causaux des corrélations dues à une cause commune, comme dans le cas du baromètre et de la tempête.

Ces difficultés ont amené Salmon à développer des théories de la causalité plus substantielles, allant au-delà des simples relations statistiques superficielles. Son projet, et celui d'autres auteurs, était de caractériser la causalité dans des termes plus métaphysiques et moins superficielles que par les simples statistiques. Par exemple, la causalité correspondrait à la transmission d'une quantité physique conservée comme l'énergie ou le moment cinétique, transmise de proche en proche.

Un problème de ce type de conception est qu'elles semblent trop dépendre de nos théories physiques actuelles (voire même de théories du passé comme la mécanique newtonnienne !). Or on aurait voulu obtenir une conception de ce qu'expliquer veut dire en général, indépendamment du contenu de telle ou telle théorie explicative en physique ou de telle époque de l'histoire des sciences.

En outre, il semble douteux que cette notion d'explication s'applique aussi bien aux domaines en dehors de la physique : expliquer un krach boursier en économie ne devrait pas faire référence à des processus physiques microscopiques, ces derniers sont non seulement inconnaissables en pratique, mais ils ne semblent pas du tout pertinents pour la compréhension. Même en physique d'ailleurs, on peut trouver des explications macroscopiques, par exemple l'expansion d'un gaz, sans que les détails microscopiques comme la trajectoire exacte des particules du gaz ne soient vraiment pertinents : de multiples trajectoires sont compatibles avec la même expansion, donc peu importe laquelle est réalisée (voir également l'article sur la réduction et l'émergence).

Finalement le problème de pertinence qui affectait le modèle nomologico-deductif réapparait si l'on veut caractériser la causalité en termes physiques : on trouvera toujours de nombreux transferts de quantité physique dans un système, y compris quand un homme prend une pilule contraceptive, mais ils ne sont pas forcément pertinents pour l'explication. Certains rapports explicatifs ne semblent même pas impliquer d'interaction physique. On peut dire que le fait que je n'ai pas arrosé une plante explique qu'elle soit morte, mais c'est plutôt l'absence d'interaction physique que leur présence qui est explicative dans ce cas.

Contrefactuels et mécanismes

Pregnancy1-150DPI

Peut-être que ces théories ont voulu donner trop de détails métaphysiques sur ce que serait la causalité. En fait, il est possible de s'en tenir à des analyses de type probabiliste, comme proposé initialement par Salmon, et de résoudre les problèmes de corrélations fortuites dans ce cadre. C'est ce que permettent les analyses en termes de graphes causaux, développées notamment par Pearl.

Si l'on accepte certains présupposés (notamment une direction temporelle : les effets sont toujours dans le futur de leurs causes), et à supposer que l'on a correctement identifié toutes les variables pertinentes, il est possible de déterminer de manière unique la structure causale des phénomènes sur la base de statistiques. Les graphes causaux ont ceci d'intéressant qu'ils correspondent aux analyses faites par les scientifiques dans de nombreux domaines (la question de l'interprétation des probabilités se pose dans ce cadre : voir l'article sur les probabilités).

Une structure causale permet de déterminer les causes et effets potentiels pour un type de système, par exemple différents facteurs pour une maladie. Mais une cause potentielle n'est pas toujours une cause réelle. Si deux personnes jettent un caillou sur une vitre avec une certaine probabilité de réussite, les deux jets augmentent la probabilité de briser la vitre, donc les deux jets sont des causes potentielles, mais un seul des deux cailloux, celui qui atteint la vitre en premier, sera la cause réelle du bris de vitre. Cependant, en tenant compte de l'état réel du système, on peut fournir des critères pour déterminer les causes réelles à partir de la structure causale.

Ce type d'analyse prend la forme d'un raisonnement contrefactuel : on imagine ce qui se serait produit si la cause n'avait pas eu lieu, en tenant pour fixe le reste du système, c'est-à-dire qu'on imagine des interventions ponctuelles affectant uniquement certaines variables du système en les isolant de leurs causes naturelles. A cause B revient à dire, en somme, que si A n'avait pas eu lieu, tenant pour fixes les autres variables, alors la probabilité de B aurait été différente.

Clock Cogs

Ce type d'analyse contrefactuelle a été proposé par Woodward comme modèle d'explication scientifique. Pour Woodward, expliquer reviendrait à identifier des facteurs ou conditions telles que des manipulations ou changements de ces facteurs produiraient un changement dans le phénomène à expliquer. Le propre des analyses contrefactuelles est de faire référence à des possibilités alternatives pour expliquer. Ces idées ont également donné lieu à une littérature importante sur la notion de mécanisme, notamment appliquée aux explications biologiques (le mécanisme de transcription de l'ADN, etc.). Selon ces approches, expliquer reviendrait à proposer un mécanisme causal produisant le phénomène à expliquer, chaque partie du mécanisme pouvant être associé à une fonction analysable en termes de rapports causaux. Les mécanismes pourraient être imbriqués les uns dans les autres, les parties constituantes d'un mécanisme étant elles-mêmes des mécanismes plus petits, mais on peut rendre compte du mécanisme global indépendamment de ces détails. Tout ceci s'accompagne d'une certaine vision du monde, hiérarchisé en mécanismes à tous les niveaux.

Pragmatique et unification

Le fait d'associer ainsi explication et causalité ou mécanisme soulève un certain nombre de questions. Un premier type de question concerne l'objectivité des explications. Existe-t-il toujours une unique "histoire causale" pour expliquer un phénomène ?

Un conducteur ayant bu de l'alcool conduit une voiture qui dérape sur la chaussée dans un virage un peu serré. Il décède. Qu'est-ce qui explique cet accident mortel ? Un médecin pourra diagnostiquer une hémorragie et décrire différents mécanismes biologiques. Ce sera non pertinent pour un mécanicien, qui proposera plutôt d'expliquer l'accident par un défaut d'adhérence des pneus. Un architecte urbain mettra plutôt l'emphase sur le fait que le virage était trop serré et que des obstacles étaient présents. Enfin un responsable de la santé publique impliquera la consommation d'alcool. Il semble que la réponse à la question "pourquoi" dépend de nos intérêts : qu'attend-on de l'explication ? Qu'elle nous aide à améliorer la santé publique, l'architecture urbaine, la sécurité des véhicules ?

Van Fraassen a proposé dans les années 1980 une analyse pragmatique des explications. Il note qu'une question "pourquoi" peut être associée à un contraste (pourquoi X plutôt que Y ?) et à une relation de pertinence. On pourrait considérer que la question "pourquoi cet accident mortel ?" est ambiguë, et que généralement, le contexte de la conversation permet de lever cette ambiguïté en spécifiant implicitement une relation et un contraste pertinents. Ceci implique de "tenir pour fixe" des éléments différents dans l'explication (étant donné cet architecture urbaine, et ce véhicule, si le conducteur n'avait pas bu, il ne serait pas mort). Il faut bien tenir des choses pour fixe (c'est-à-dire non pertinentes) pour pouvoir expliquer, sinon on risque de multiplier à l'infini les explications : ma plante est morte parce que je ne l'ai pas arrosée, mais si la reine d'Angleterre était venue l'arroser à ma place, elle ne serait pas morte. Pour autant la reine d'Angleterre ne fait pas partie de l'explication. L'idée que les explications seraient contextuelles continue de se poser aujourd'hui dans le cadre de la philosophie mécaniste décrite plus haut.

Basil in a pot

Cependant selon Van Fraassen, les relations de pertinence ne se limitent pas aux relations causales. Ainsi on pourrait finalement expliquer la taille d'un poteau à partir de la taille de son ombre si le poteau a été conçu spécialement pour avoir une ombre d'une certaine taille à certains instants de la journée. L'explication est finaliste plutôt que causale : c'est la finalité qui explique un état de fait. Dans d'autres cas elle sera causale, ou impliquera des lois. On peut parler à ce sujet de pluralisme

Un partisan d'une association étroite entre explication et causalité pourra toutefois accepter l'idée de contextualité, mais maintenir que la relation la plus pertinente en science est toujours causale et que les causes sont objectives. Le contexte permettrait seulement de sélectionner les causes qui sont plus saillantes que d'autres en fonction de nos intérêts. Les explications finalistes elles-mêmes pourraient peut-être se ramener à des causes.

Mais toutes les explications sont-elles causales ? Est-ce que toute forme de compréhension du monde, ou d'un sujet, revient simplement à mettre au jour des mécanismes ?

Ce ne semble pas être le cas des explications en mathématiques par exemple. En outre, il existe des modes d'explication dit "structuraux" qui ne sont pas vraiment causaux, mais s'appuyent plus directement sur des caractéristiques mathématiques des modèles utilisés.  Huneman propose cette notion d'explication structurale en donnant plusieurs exemples issus de la biologie, dans lesquels l'explication repose par exemple sur l'existence de points d'équilibre parmi les états possibles d'un système. L'explication est alors plus abstraite : c'est la structure même du modèle qui explique plutôt qu'une histoire causale particulière.

Peut-on rendre compte de la notion d'explication scientifique de manière plus générale, sans se limiter aux explications causales ? Ou bien n'a-t-il rien de plus de commun entre les différentes formes d'explication que le fait qu'elles répondent à des questions "pourquoi" ?

Kitcher a proposé dans les années 1980 d'associer les explications à l'unification. L'idée est la suivante : une théorie est explicative dans la mesure où elle permet d'appliquer les mêmes motifs d'inférence à de nombreux cas. Savoir expliquer, ce serait être capable d'utiliser un nombre minimal de concepts pour rendre compte d'un nombre maximal de phénomènes, et ainsi, une explication serait d'autant plus profonde qu'elle utiliserait des systèmes conceptuels "économiques", unifiés mais fructueux. La compréhension viendrait du fait qu'on parvienne à relier entre elles des choses qui, de prime abord, paraissent étrangères entre elles. Ce modèle n'est pas si éloigné de celui proposé initialement par Hempel et Oppenheim, qu'on peut considérer comme un cas particulier (les lois correspondent à des motifs d'inférence généraux), mais il intègre une dose de pluralisme, et selon Kitcher, il ne souffre pas des mêmes difficultés.

La notion d'unification employée par Kitcher n'est pas étrangère à l'analyse contrefactuel de Woodward mentionnée précédemment, plus récente. Selon lui, considérer ce qui se serait produit si les choses avait été différentes pour identifier les relations causales suppose une stabilité dans les relations de cause à effet, et plus ces stabilités sont robustes, c'est-à-dire plus elles s'appliquent à des phénomènes variés et à des changements importants, plus on a affaire à une explication profonde. En outre, il a été proposé d'étendre le modèle contrefactuel de Woodward pour rendre compte des explications non causales, y compris en mathématiques. En effet, on peut affirmer que la structure mathématique d'un modèle explique un phénomène dans la mesure où un changement de cette structure donne lieu à un changement dans le phénomène prédit. L'analyse contrefactuelle n'a pas à être restreinte à la causalité si l'on considère différentes notions de "possibles" (notamment métaphysiques ou conceptuelles).

Finalement peut-être que les idées avancées par ces différents auteurs, faisant appel aux lois de la nature, à la pertinence statistique, aux relations causales ou contrefactuelles ou encore à l'unification, ne sont pas incompatibles entre elles mais correspondent à différents aspects de ce qui peut constituer une explication en science.

2 commentaires:

  1. Je ne comprends pas très bien pourquoi l'explication par intérêt n'est pas entièrement satisfaisante. Certes on peut rechercher toujours une causalité pour servir ses intérêts, mais c'est bien parce que j'ai intérêt à trouver une explication que j'invoque la causalité. Les deux semblent aller ensemble du moins. Article lumineux au demeurant !

    RépondreSupprimer
    Réponses
    1. Bonjour, le fait que les explications peuvent dépendre de nos intérêts ne s'oppose pas en effet à la recherche de causes. Il n'est pas dit que ce ne serait pas satisfaisant dans l'article, c'est plutôt quelque chose qui remet en question une certaine vision de la notion d'explication.

      Supprimer