lundi 30 juin 2014

Le problème de la mesure et l'interprétation de la mécanique quantique

John Stewart Bell (physicist) portrait
Nous avons parlé dans le dernier article du théorème de Bell qui permet d'établir que certains aspects de la nature sont non-locaux. Nous avons vu qu'il existe une tension entre ce que ça implique et un autre principe bien établi dans le cadre de la relativité, qui est qu'aucune influence causale ne peut se propager plus vite que la lumière (même si ces deux aspects ne sont pas nécessairement contradictoires).

Nous allons maintenant nous intéresser aux différentes théories et interprétations qui permettent de donner sens à cette non-localité qui caractérise la mécanique quantique. Pour suivre cette présentation, je renvoie les lecteurs à l'article précédent, et notamment à l'expérience de pensée que j'avais proposé pour illustrer le théorème de Bell, sur laquelle nous allons nous appuyer ici. Rappelez-vous : il s'agissait d'imaginer deux personnes qui quittent une pièce par des portes opposées. On leur pose ensuite une question chacune parmi plusieurs possibles, et leurs réponses sont étrangement corrélées, elles respectent certaines règles, d'une manière qui ne peut s'expliquer par une préméditation de ces réponses.

Une question philosophique

En préambule on peut se demander si tous ces problèmes sont vraiment philosophiques plutôt que strictement scientifiques. Il y a plusieurs raisons pour lesquelles ils devraient nous intéresser d'un point de vue philosophique.

La première est qu'il s'agit de questions indépendantes du succès empirique ou des applications pratiques de la mécanique quantique : il s'agit de lui donner sens, de comprendre de quoi peut être fait le monde si la mécanique quantique est vraie, et quels sont les principes métaphysiques (le déterminisme ? la localité ?) auxquels il obéit.

La seconde est que ces aspects de la physique moderne nous forcent à revoir certaines conceptions de ce qu'est le monde physique qui n'étaient pas vraiment questionnées auparavant. Ils informent donc la philosophie.

La troisième raison, enfin, est que la philosophie a contribué à éclaircir ces débats. Certes ce sont souvent des physiciens qui ont proposé des théories pour interpréter la mécanique quantique. Cependant des philosophes ont parfois participé au développement de ces théories, mais surtout ils se sont intéressés à formaliser clairement le problème, ce qui a permit de classifier les différentes solutions possibles.

Le principal problème d'interprétation de la mécanique quantique est ce qu'on appelle le "problème de la mesure".

La fonction d'onde

QuantumHarmonicOscillatorAnimation
Le problème vient de ce que la mécanique quantique décrit l'état des systèmes physique de particules par des fonctions d'ondes, qu'on peut voir comme des "superpositions d'états". C'est de cette façon qu'on parvient à formaliser cette façon qu'ont les particules fondamentales de se comporter, et notamment les corrélations entre phénomènes distants que nous avons illustré dans l'article précédent.

Dans l'expérience de pensée de l'article précédent, imaginons que l'on décide de poser la question A à nos deux protagonistes. Nous avons vu que ces réponses ne pouvaient être préméditées, ce qui laisse penser qu'avant que la question ne soit posée, toutes les réponses sont encore possibles. Cependant on veut tout de même associer à nos protagonistes un état physique qui rende compte de la manière dont ils vont réagir à nos questions. Une solution est de décrire nos protagonistes, avant que la question ne soit posée, par un objet mathématique qui correspondra à une superposition de trois états possibles : soit ils répondront tous les deux "non", soit seulement l'un, soit seulement l'autre (mais pas les deux). En physique, cet objet mathématique s'appelle la fonction d'onde.

Dualite
Si on choisit de poser d'autres questions (par exemple A à l'un et B à l'autre), la fonction d'onde se décomposera d'une manière différente de manière à refléter les règles de corrélation entre les réponses, mais l'objet mathématique, lui, reste le même : il nous permet de prévoir les probabilités correspondant à toutes les mesures possibles. Il est simplement décomposables de plusieurs façons différentes, mutuellement incompatibles, chaque décomposition correspondant à une façon de poser des questions.

Une autre façon de voir les choses est de dire que la fonction d'onde serait, dans notre exemple, la traduction mathématique des trois règles auxquelles obéissent les protagonistes. Ces règles décrivent en fait l'état physique du système.

Notons qu'il n'existe qu'une seule fonction d'onde associée aux deux protagonistes, et non deux, précisément parce qu'il faut pouvoir rendre compte des corrélations entre leurs réponses, et pas seulement des réponses individuelles qu'ils vont fournir. On peut dire alors qu'ils sont dans un état "intriqué", non séparable. Dans le cas de particules, une fonction d'onde exprimera par exemple le fait que si une particule a un spin haut, l'autre a un spin bas, et inversement (le spin est une propriété des particules, peu importe d'en savoir plus pour notre propos) mais sans préciser quelle valeur de spin a précisément chacune des particules. La fonction d'onde n'est donc pas localisée, c'est un objet étendu dans l'espace.

Le problème de la mesure

Le problème est qu'il semble manquer quelque chose à cette description. En effet quand on pose une question, on obtient une réponse déterminée, pas une superposition de réponses. Peut-être alors faut-il compléter la théorie pour rendre compte de ce qu'il se passe au moment de la mesure. Mais comment compléter notre théorie sachant que, comme nous l'avons vu, les réponses des protagonistes ne peuvent avoir été préméditées ? En pratique, on utilise une règle, la règle de Born, pour calculer les probabilités de mesures à partir de la fonction d'onde. Mais quel sens donner à cette règle ?

Ce "problème de la mesure" peut être formulé sous la forme de trois propositions incompatibles (on doit cette formulation à Maudlin). Il est impossible d'accepter les trois en même temps, il faut donc rejeter l'une d'elle. Ce sont les propositions suivantes :
  1. La fonction d'onde est une description complète de l'état d'un système
  2. La fonction d'onde suit une loi d'évolution linéaire (déterministe et réversible)
  3. Nos mesures donnent des résultats déterminés
On peut voir que ces propositions sont incompatibles en les appliquant à un système et un appareil de mesure, qu'on considère comme un autre système physique. Si on accepte les deux premières propositions et qu'on fait les maths, partant d'un système dans une superposition d'état, on aboutit à la conclusion que l'appareil de mesure lui-même sera, à la fin d'une expérience, dans une superposition d'état, ce qui contredit la troisième proposition.

Cette formulation permet de voir qu'il existe deux façons distinctes de compléter la théorie pour résoudre le problème. Soit on considère que la fonction d'onde n'est pas vraiment une description de l'état complet du système. On complète alors cette description par des "variables cachées", qui sont découvertes au moment de la mesure (c'est à dire qu'on rejette la première proposition -- c'est ce que fait par exemple la théorie de Bohm). Soit on pense qu'il se produit quelque chose à un moment donné qui fixe l'état du système en lui donnant une valeur précise pour ce qui est mesuré. On complète alors la loi d'évolution du système par des processus aléatoires qui "réduisent la fonction d'onde", qui transforment la superposition en un état déterminé (on rejette la seconde proposition -- ce que font par exemple les théories GRW).

Nyhavn-panorama
C'est généralement une version de la seconde solution qui est proposée dans les manuels de physique quantique, et qui correspondait à l'interprétation "classique" (dite "de Copenhague") de la mécanique quantique : on nous dit que la mesure provoque la "réduction du paquet d'onde". Le problème est que cette manière de dire les choses est imprécise, et que la théorie ne nous dit pas exactement à quel moment la fonction d'onde est réduite. Est-ce quand on s'intéresse à des objets suffisamment gros, comme nos appareils de mesure ? Ou bien quand un observateur conscient intervient ? Une bonne théorie de type réduction de la fonction d'onde devrait nous dire exactement comment cette réduction se produit, de manière objective.

Nous avons donc deux façons de compléter la théorie pour résoudre le problème de la mesure : soit la théorie ne nous dit pas tout de l'état des systèmes, et ce qu'elle nous cache est dévoilé au moment de la mesure, soit elle nous dit tout, mais il se produit quelque chose de particulier au moment de la mesure. Examinons un peu plus en détail ces deux approches.

Les théories à variables cachées

David Bohm
Les approches de type "variables cachées" visent plutôt la complétude de la théorie. Il s'agit de pouvoir expliquer l'ensemble des phénomènes observables en invoquant des particules ponctuelles ayant une position bien définie, ce qui permet éventuellement d'avoir une théorie déterministe dénuée de hasard, quand bien même les phénomènes restent, à toute fin pratique, imprévisibles.

Dans le cas de l'expérience proposée dans l'article précédent, on postulera donc que tout a une explication en terme de propriétés définies, y compris par exemple le fait que les deux protagonistes répondent "oui" à la question B. Comme si les protagonistes avaient préparés leurs réponses. Mais nous avons vu que le théorème de Bell interdit de penser que les réponses aux questions aient été décidées par avance, avant que les questions ne soient posées. On se voit alors obligé de faire intervenir une transmission instantanée d'information entre les deux protagonistes pour expliquer comment leurs réponses peuvent être ainsi systématiquement conformes : ils doivent "tricher". Au moment où les questions sont posées, les protagonistes peuvent changer leurs réponses en fonction non seulement de la question qui leur est posée, mais aussi de celle qui est posée à leur acolyte à l'autre bout de la pièce. C'est à dire qu'on adopte une théorie non-locale.

Lt Mike Hunter 1
Dans le cas de la théorie de Bohm, on affirmera qu'il existe une "onde pilote" (correspondant en gros à la fonction d'onde de la théorie standard) ainsi que des particules, et on invoquera, en plus de la théorie standard, une loi d'interaction non-locale entre cette onde et les particules, de manière à obtenir exactement les prédictions de la théorie standard, mais de manière parfaitement déterministe.

Le principe relativiste d'Einstein, qui stipule que les influences causales sont locales, est alors clairement violé et c'est un problème pour ces théories, notamment du fait que selon la relativité, la notion de simultanéité entre événement est relative au point de vue (on s'y intéressera peut-être dans un article dédié à la philosophie du temps). Parfois il n'y a pas lieu d'affirmer qu'une personne a répondu à sa question avant ou après l'autre, tout dépendra du point de vue, et donc il n'y a pas lieu d'affirmer qu'un événement est la cause de l'autre plutôt que l'inverse. Les théories à variable cachées sont obligées d'introduire une simultanéité absolue (un "point de vue privilégié") permettant d'ordonner dans le temps les événements distants, même si cette ordre est inconnaissable par l'expérience, pour rendre compte de manière sensée de cette transmission d'information à distance.

Enfin ce type de théories peut être vu comme une forme de contorsion qui a pour seul but de revenir à des conceptions antérieures à la mécanique quantique (avec des particules localisées, et un déterminisme, au moins tant qu'on ne se préoccupe pas trop de la théorie des champs), ce qui peut paraître être une motivation assez faible : pourquoi vouloir sauver à tout prix une telle conception du monde ?

Sans doute pour ces différentes raisons, cette solution est rarement adoptée par les physiciens.

Les théories à effondrement de la fonction d'onde

Ganzfeld
Les approches de type réduction du paquet d'onde postulent que les particules restent dans un état indéterminé, une superposition étendue dans l'espace, telle que décrite par la fonction d'onde, qui se propagent causalement, pas plus vite que la lumière, jusqu'à ce que des événements viennent actualiser cet état indéterminé en des propriétés bien définies. Un peu comme si les deux protagonistes de notre exemple partageaient un esprit commun un peu indécis qui répond en bloc aux deux questions le moment venu, de manière imprévisible, mais cohérente. La théorie GRW, qui en est la principale représentante, postule que cette réduction est spontanée, mais très rare pour une particule seule. Seulement quand on s'intéresse à de gros objets comme nos appareils de mesure, composés de milliards de particules, il y a bien une chance qu'une au moins de ces particules soit réduite, entraînant les autres avec elles, ce qui explique que les résultats de nos mesures soient déterminés. Ainsi on rend compte à la fois des "bizarreries" microscopiques et de la détermination des résultats macroscopiques.

Certes l'événement indéterministe lui-même agit de manière non locale (puisque la fonction d'onde est étendue), mais le principe de localité de la relation de causalité qui régit l'évolution de l'état des particules en dehors de ces événements particuliers est sauf. Pas de contradiction, donc, avec la théorie de la relativité et l'impossibilité de transmettre une information à distance. Le prix à payer, c'est l'indéterminisme associé à ces événements.

Il existe ensuite plusieurs interprétations possibles pour cette théorie. On peut penser que la fonction d'onde décrit une densité de matière. Ou bien on peut envisager que ces événements indéterministes, ces "flashs", sont les véritables objets fondamentaux du monde et que la fonction d'onde décrit les rapports entre ces flashs.

Lightning strike jan 2007
Si ces théories semblent mieux s'accorder avec les principes de la relativité (même s'il y a d'autres difficultés techniques, elles ne permettent pas la transmission d'information à distance), le fait de rendre objectif la "réduction du paquet d'onde", d'ajouter des processus à la théorie, amène à faire des prédictions légèrement différentes de celles de la théorie standard, même si ces différences ne sont pas aujourd'hui observables. C'est un avantage (ces théories sont testables) mais aussi un inconvénient : certains doutent que la théorie quantique, qui connaît un succès prédictif impressionnant, ait réellement besoin d'être modifiée en ce sens juste pour "sauver" les apparences. Les postulats de réduction de la fonction d'onde semblent ad-hoc : ils ne sont pas motivés par de réelles anomalies expérimentales, uniquement par un problème d'interprétation, donc pourrait-on penser par des présupposés métaphysiques auxquels nous sommes attachés. C'est au fond une critique assez semblable à celle qu'on peut faire envers les théories à variable cachées, qu'on accuse de vouloir uniquement sauver certaines intuitions en complexifiant la théorie.

Une troisième voie ?

On voit que quelque soit la solution choisie, des problèmes se posent. On n'échappe jamais vraiment à la non-localité, et quelque soit la solution choisie, elle peut sembler ad-hoc : ces ajouts à la théorie ne sont aucunement motivés par des échecs de prédiction.

Schroedingers cat film
Mais nous n'avons pas encore épuisé les solutions possibles. Il existe une autre voie, certes plus radicale, pour résoudre le problème de la mesure sans modifier la théorie, qui consiste à abandonner la troisième proposition plutôt que l'une des deux premières, c'est à dire à abandonner l'idée que les résultats de nos mesures sont objectifs et bien déterminés. Après tout la seule garantie que nous avons que les résultats des mesures sont bien déterminés, c'est l'observation (ce qui a même amené certains, comme Wigner, à postuler que c'est l'esprit qui provoque la réduction de la fonction d'onde). Se pourrait-il, finalement, que ce soit une illusion ?

Hugh-Everett.jpg
Une des principales positions suivant cette voie est la fameuse théorie des mondes multiples, proposée par le physicien Everett, qui postule que des résultats de mesures alternatifs s'actualisent dans des branches ou mondes parallèles, auxquels nous n'avons pas accès. Les résultats des mesures concrets sont donc essentiellement relatifs à un point de vue particulier sur le monde, situé dans une de ces branches. Ils sont subjectifs. La théorie d'Everett prend au sérieux l'idée de superposition d'état portée par la fonction d'onde, et l'applique à tout l'univers, y compris aux observateurs eux-mêmes.

Reprenons notre expérience de pensée pour voir comment ça peut fonctionner. Imaginons que la question A a été posée aux deux protagonistes. Selon l'interprétation des mondes multiples, si une des deux personnes réponds "oui" à la question, il existe en fait un monde parallèle où elle répond "non". La personne est en fait toujours, juste après sa réponse, dans une superposition de deux états, et de même celui qui pose la question, dont chaque clone constate une réponse différente. Son acolyte, à l'autre bout de la pièce, ne sait pas quelle question lui a été posée mais peu importe : il est lui-même dans une superposition de deux états, ainsi que celui qui lui pose la question.

Meeting
Les informations correspondant à ces superpositions peuvent ensuite se propager causalement, pas plus vite que la lumière (par exemple ceux qui récupèrent les réponses vont se réunir dans une autre salle pour débriefer). Et au moment où elles se rencontreront, il y aura simplement un tri : les états qui correspondent à des cas interdits (celles où aucun ne répond "non" à A par exemple) ne se rencontrerons pas, tandis que ceux qui correspondent à des cas possibles se combineront pour créer autant de mondes parallèles, tous cohérents, mais bien étanches. Chacun des protagonistes ne se situant jamais que dans une seule branche, il n'a pas la possibilité de savoir que ses doubles, dans d'autres branches, constatent d'autres résultats de mesures.

Leonard Nimoy William Shatner Star Trek 1968
Oui, ça ressemble beaucoup à de la science fiction. Mais cette solution possède un attrait important, qui est qu'elle consiste simplement à prendre au sérieux le contenu théorique de la mécanique quantique, sans ne rien y ajouter d'autre qu'un principe de correspondance entre l'état de l'univers et nos expériences relatives. A noter que ce dernier principe s'appuie fortement sur la notion de décohérence, qui permet d'expliquer comment les différentes branches de l'univers deviennent "étanches". Et on voit que cette interprétation permet de réconcilier la complétude de la théorie et la localité : nous parvenons à expliquer comment les règles imposées à nos protagonistes peuvent être respectées sans ne jamais invoquer de mystérieux processus qui vont plus vite que la lumière. Mais tout ça a un prix tout de même important, qui est le réalisme à propos des résultats concrets et bien définis de nos mesures...

Une question qui se pose à propos de ce type d'interprétations est de savoir si en abandonnant un tel réalisme, on ne scie pas en quelque sorte la branche sur laquelle on était assise : ce sont les résultats concrets des mesures, les probabilités qu'on leur associe, qui nous permettent d'élaborer nos théories scientifiques ou de vérifier les inégalités de Bell, mais dans cette version des choses, la notion de probabilité fait-elle encore sens ? Pourquoi assigner des probabilités si tous les résultats se réalisent ? Et donc la règle qui permet de calculer ces probabilités à partir de la fonction d'onde n'est-elle pas arbitraire ?

C'est un sujet très débattu. Certains philosophes invoquent une notion de probabilité subjective (la théorie de Deutsch-Wallace) pour répondre à cette question. Il s'agit d'une approche assez radicale, et d'autres avancent que suivant cette vision des choses, étendue à tout l'univers, on ne peut plus vraiment savoir quelles "questions" sont posées aux particules et donc qu'il n'y a plus vraiment lieu d'affirmer que l'univers se sépare en branches bien cloisonnées. Enfin ce type d'interprétation n'est pas indépendant de certaines questions appartenant à d'autres domaines de la philosophie, comme la question de l'identité personnelle au cours du temps et de l'expérience consciente.

Conclusion

Voilà donc résumé les problèmes fondamentaux que pose la mécanique quantique (il y a d'autres aspects que j'ai passé sous silence, comme la question de l'identité des particules--nous y reviendrons peut-être un jour) et les différentes interprétations réalistes possibles.

Que faire de tout ça ? Nous avons ici typiquement un cas de ce qu'on appelle, en philosophie, la sous-détermination des théories par l'expérience : il existe plusieurs façon d'arranger nos concepts qui ne changent pas fondamentalement les prédictions expérimentales. Ce cas est assez troublant, puisqu'on a du mal à voir en quoi ces alternatives pourraient être rendues équivalentes : elles semblent foncièrement contradictoires. Et pourtant rien ne permet vraiment de les départager (sauf peut-être les théories de réduction du paquet d'onde).

Aurora electronic calculator DT210 02
De plus aucune de ces solutions au problème de la mesure ne s'avère entièrement satisfaisante : toutes ont un prix, et dans chaque cas, on se voit obligé de postuler des éléments qui ne sont pas vraiment observables pour sauver nos intuitions réalistes, que ce soit en complétant la théorie, ou en imaginant des mondes parallèles. Ce qui amène certains, en désespoir de cause, à renoncer à expliquer la mécanique quantique et à n'y voir qu'une théorie pratique pour faire des prédictions (ce qu'exprime la fameuse injonction : "shut up and calculate").

Peut-être alors devrait-on revoir un présupposé qui sous-tend toutes ces théories alternatives : l'idée que nos théories décrivent la réalité. Peut-être finalement n'en décrivent-elles qu'un aspect, à savoir sa structure causale, qui serait une structure de potentialités, nécessairement incomplète... Peut-être qu'elles ne sont que des instruments nous permettant de faire des prédictions... Ou peut-être le monde n'a-t-il simplement pas d'état objectif indépendamment d'un point de vue, comme le proposent les interprétations relationnelles (qui s'inspirent des interprétations de type "monde multiple" en ce que les résultats des mesures sont relatifs à des points de vue, mais sans adhérer à l'existence de mondes parallèles : une superposition d'état y est interprétée comme une indétermination d'un point de vue plutôt que comme l'existence de plusieurs branches). Toutes ces thèses doivent se confronter à la question du réalisme scientifique.

En tous les cas on peut dire que la mécanique quantique pose un véritable défi pour la métaphysique. Elle remet en question l'idée de la métaphysique classique que le monde serait en quelque sorte une mosaïque d'objets, de propriétés et de relations déterminées, indépendants de l'observation, instanciés dans l'espace temps, et interagissant de manière locale. Cette remise en question est d'autant plus pressante que le théorème de Bell ne s'appuie que sur les données expérimentales, qu'il est indépendant de nos théories, tout en apportant des contraintes suffisamment fortes sur ces théories pour nous obliger à abandonner certaines de nos conceptions les plus intuitives de ce qu'est la réalité.

Petra-Mosaic-2-2

Aucun commentaire:

Publier un commentaire