explorations - nouveaux objets - croisements des sciences

Les catégories physiques : du classique au quantique

par Sébastien Poinat

Résumé

La mécanique quantique nous oblige à un profond remaniement conceptuel : les catégories habituelles, celles issues de la physique classique, deviennent obsolètes et doivent laisser la place à de nouvelles catégories. Dans cet article, nous proposons de montrer sur deux exemples pourquoi le formalisme quantique nous amène à renoncer aux catégories classiques, et par quelles nouvelles catégories il les remplace. Le formalisme mathématique apparaît en effet être le moteur du changement conceptuel, et finalement notre fil conducteur pour comprendre la mécanique quantique. Les deux exemples étudiés ici, que nous avons choisis parce qu’ils sont au cœur de la révolution quantique, sont les notions d’objet et d’identité numérique.

Abstract

Quantum Mechanics requires profound conceptual changes : the ordinary categories, which were inherited from classical physics, had become obsolete and had to be replaced by new categories. In this paper, we study two examples of quantum category. We try to show on these examples why mathematical formalism disqualifies the old classical categories and by which new categories it replaces the old ones. To our point of view, mathematical formalism is at the heart of the conceptual changes that quantum mechanics needs : it is mathematical formalism that leads us to these changes and that shows us how to understand quantum mechanics. The two examples that we chose in this paper are the notions of object and of numerical identity.

Introduction

La comparaison entre la physique classique et la mécanique quantique est intéressante pour une réflexion sur les catégories parce qu’à partir du milieu des années 1920, c’est-à-dire au moment où la mécanique quantique est élaborée, la nécessité de changements conceptuels importants est apparue de façon claire, aux yeux des physiciens d’abord, puis de tous ceux qui réfléchissaient sur la science : cette nouvelle théorie était trop différente de la mécanique classique ou de l’électromagnétisme du XIXe siècle pour qu’on puisse faire l’économie d’un profond remaniement de la grille conceptuelle utilisée jusqu’alors pour construire les théories physiques.
Comme nous allons essayer de le montrer ici, il n’était pas question de remanier à la marge les outils conceptuels, mais bien de rompre avec les concepts les plus généraux (et donc les plus usuels) qui structuraient la physique classique. C’est pour cette première raison qu’il nous semble légitime, à propos du passage de la physique classique à la mécanique quantique, de parler de changement de catégorie. Les catégories seront pour nous des concepts à la fois fondamentaux, au sens où ils sont les premiers éléments dans l’élaboration conceptuelle des théories, et larges, au sens où, pour construire les théories physiques, il faut aussi subdiviser de tels concepts en différentes sous-catégories ayant un sens physique. Bien sûr, en tant que catégories physiques, les catégories dont nous parlerons ici n’ont pas de raison d’être considérées uniquement comme de purs outils de pensée, sans lien avec une - supposée - réalité physique indépendante du sujet connaissant. Toutefois, il n’est pas besoin pour nous de prendre parti dans ce débat et de déterminer si les catégories expriment l’ordre inhérent au monde physique, ou bien si elles ne représentent que nos façons de penser. Les catégories physiques sont pour nous simplement les outils les plus fondamentaux pour rendre intelligible notre expérience commune du monde et les concepts premiers des théories physiques (classique et quantique).
Nous disions précédemment qu’il était apparu rapidement qu’un profond remaniement conceptuel s’imposait avec la théorie quantique. Toutefois, s’il était manifeste qu’il fallait un changement catégoriel, il n’était pas évident de déterminer lequel il fallait opérer. Aujourd’hui, la réponse à cette question ne fait pas consensus : comme le montre la littérature (trop) abondante sur la mécanique quantique, les réflexions et les propositions vont bon train pour dire quelle est, selon la dénomination usuelle, la bonne « interprétation » de la théorie quantique. Il ne sera pas question pour nous ici de résoudre cette question de façon générale. Ce que nous nous proposons de faire est plus modeste et consiste à examiner deux exemples de catégories utilisées en physique classique et que la mécanique quantique nous a amené à remplacer. Il s’agit des catégories d’objet et d’identité numérique, que nous examinerons successivement.
Pour ces deux catégories, il nous faudra montrer à la fois pourquoi un changement catégoriel était nécessaire, par quelle nouvelle catégorie l’ancienne a été remplacée, et enfin quelles sont les implications de ce changement catégoriel dans notre façon de penser les phénomènes physiques. Ce faisant, nous espérons montrer que les changements conceptuels sont compréhensibles à partir du formalisme quantique, c’est-à-dire essentiellement du langage mathématique et des règles de base de la mécanique quantique standard. Si les débats philosophiques sur la mécanique quantique durent depuis plus de quatre-vingts ans, sans que le nombre de positions possibles (ou d’ « interprétations ») ne diminue, le cœur du formalisme standard est resté inchangé et il est demeuré le point de départ de toute réflexion. Il semble donc raisonnable de considérer qu’il doit être notre guide pour déterminer, à propos de deux catégories particulières, quels changements conceptuels s’imposent à nous lorsqu’on aborde la mécanique quantique.

1. Première catégorie : la propriété

1.1. L’objet et ses propriétés

La première notion que nous souhaitons examiner est celle de propriété. C’est une catégorie très importante pour l’histoire de la pensée en général, qui intervient directement dans toute la tradition philosophique et apparaît aussi dans la physique classique. Elle est utilisée par la philosophie antique grecque en général, mais c’est Aristote qui lui donnera le sens que la tradition philosophique retiendra.
Pour comprendre ce qu’est une propriété, il faut en revenir à l’analyse logique du jugement. Pour Aristote, le jugement est un acte de l’esprit qui, si on l’analyse du point de vue logique, consiste à attribuer un prédicat « $P$ » à un sujet logique « $S$ ». Sa forme générale est ainsi « $S$ est $P$ ». Par exemple, on peut former le jugement « cette feuille est rectangulaire », qui consiste à attribuer au sujet logique « cette feuille » l’attribut « être rectangulaire ». A ce stade, peu importe que le jugement soit vrai ou non : au niveau logique, un jugement est vu par Aristote comme un acte de prédication.
On peut maintenant passer du plan logique au plan ontologique en donnant la signification de la prédication, non plus au niveau de la pensée, mais pour les choses elles-mêmes. Cette signification ontologique s’obtient alors simplement en projetant sur le plan de la réalité la structure logique précédemment décrite. Au sujet logique correspond alors, en général, un objet du monde, tandis qu’au prédicat est associée une propriété. Pour reprendre notre exemple, dire que « cette feuille est rectangulaire » consiste donc, au niveau ontologique, à attribuer à cette feuille, supposée être un objet du monde, la propriété de rectangularité. Du fait que la propriété est classiquement comprise à partir de la structure logique d’un jugement, elle est donc aussi liée, à l’origine, à celle d’objet. Sur le plan ontologique, la propriété est attribuée à l’objet, de même que sur le plan logique le prédicat est attribué au sujet logique.

Qu’est-ce qu’un objet ? Étymologiquement, l’« ob-jet » est ce qui est « jeté devant », ou « placé devant » : il est ce qui se tient devant le sujet. Les propriétés attribuées à l’objet sont ses déterminations. L’objet est donc supposé être quelque chose qui existe indépendamment du sujet, se tient devant lui, et qui est doté d’un ensemble plus ou moins riche de propriétés. Cette structure fondamentale du face-à-face entre le sujet et l’objet peut servir de base pour définir un réalisme de l’objet : on suppose que le monde est constitué d’une multitude d’objets qui constituent la réalité et qui sont en eux-mêmes indépendants de tout sujet connaissant.
Dans la perspective ontologique que l’on vient de définir, celle du réalisme de l’objet, connaître un objet implique de pouvoir dresser la liste des propriétés dont il est supposé être le porteur. Les différentes propriétés sont ainsi les déterminations intrinsèques de la réalité telle qu’elle est supposée être en elle-même. L’acte de mesure doit donc, fondamentalement, se comprendre comme un acte de révélation. En effet, si connaître un objet revient à déterminer ses propriétés, et si celles-ci sont indépendantes du sujet et donc lui préexistent, l’acte de mesure est alors supposé révéler l’existence et la nature des propriétés de l’objet. Par la mesure, on peut espérer pouvoir connaître la masse d’un objet, son volume, sa forme, etc. Toutes ces mesures doivent, dans cette perspective, nous permettre d’établir les différentes propriétés de cet objet.
Le problème central à résoudre est alors simplement de s’assurer que l’acte de mesure permet réellement d’atteindre le but qui lui est assigné, à savoir accéder aux valeurs réelles des propriétés de l’objet. Il faut que la mesure ne donne pas un résultat différent de la valeur réelle de la propriété. La propriété et l’objet existant indépendamment de nous, de notre pensée et de nos actions, la mesure réalise ce qu’on attend d’elle si et seulement si le résultat de la mesure correspond à la réalité.
C’est dans cette perspective que l’on peut comprendre les discussions autour des qualités premières. Pour la plupart des physiciens et des philosophes du XVIIe siècle, la réalité physique est composée de corpuscules en mouvement, et seules les propriétés géométriques et cinématiques sont réelles. Les odeurs, les saveurs, les couleurs ne sont en fait que l’effet sur nous de ces propriétés. Pour fixer ces distinctions, il devint courant d’utiliser les termes de « qualités premières » et de « qualités secondes » : les « qualités premières » sont les propriétés des objets physiques, tandis que les « qualités secondes » sont seulement des combinaisons de qualités premières qui ont le pouvoir de provoquer en nous certaines impressions sensibles. Sur cette base ontologique, le problème épistémologique est alors d’abord, de façon générale, de parvenir à expliquer les différents phénomènes physiques à partir des seules qualités premières - et donc de réduire la diversité phénoménale à la conjonction de quelques qualités premières -, puis de déterminer pour chaque type d’objets ses qualités premières propres, c’est-à-dire les propriétés intrinsèques qui lui appartiennent [1]. Autrement dit, pour la physique classique, les différentes grandeurs physiques que l’on peut mesurer doivent pouvoir être expliquées par les qualités premières (et ainsi réduites à ces dernières), c’est-à-dire par les propriétés des objets qui composent la réalité physique.

1.2. L’observable et le spectre de valeurs

Qu’en est-il en mécanique quantique ? Les grandeurs physiques sont-elles encore des propriétés ? Pour répondre à cette question, il faut d’abord noter que les grandeurs physiques sont désormais des opérateurs hermitiens (appelés « observables »), et les systèmes physiques des vecteurs d’état dans des espaces de Hilbert (ce sont des espaces vectoriels à valeurs complexes).
Le formalisme standard de la mécanique quantique pose quelques règles pour la mesure. D’une part, de façon générale, pour une même mesure réalisée sur un système physique quelconque, il existe en général plusieurs résultats possibles. Ces résultats possibles sont appelés les « valeurs propres » de l’observable mesuré. D’autre part, il n’y a pas de loi qui fixe la valeur qui sera réellement obtenue dans le cadre d’une mesure effective (le résultat est intrinsèquement aléatoire), mais on peut assigner à chacune des valeurs propres une probabilité d’être obtenue. Enfin, après la mesure, le vecteur d’état est égal au vecteur associé à la valeur propre effectivement obtenue, vecteur que l’on appelle « vecteur propre ».
Supposons par exemple que l’on cherche à mesurer une observable associée à deux valeurs possibles, notées « $+$ » et « $-$ ». On associe alors des « vecteurs propres » aux deux valeurs du spectre de cette observable. En général, avant la mesure, le vecteur d’état n’est pas égal à l’un des vecteurs propres, c’est une combinaison linéaire de vecteurs propres. Or, comme nous l’avons dit, le vecteur d’état après la mesure doit être égal au vecteur d’état de la valeur expérimentale obtenue. Par conséquent, l’acte de mesure a projeté le vecteur sur l’un des vecteurs propres de l’observable (comme le montre le schéma ci-dessous) : il a été projeté soit sur le vecteur propre correspondant à la valeur « $-$ », soit sur celui correspondant à la valeur « $+$ ».

Ces changements mathématiques sont considérables pour le problème qui nous occupe. Puisque l’acte de mesure est une projection (aléatoire) du vecteur d’état sur l’un des vecteurs propres de l’observable, on ne peut pas dire qu’avant la mesure il existait déjà une propriété, déterminée tant du point de vue de sa qualité que de sa quantité. Avant la mesure, plusieurs valeurs sont possibles, c’est-à-dire plusieurs déterminations du système physique que l’on examine. Selon le formalisme standard, on ne peut donc pas inférer du résultat finalement obtenu la valeur supposée d’une propriété qui préexisterait à la mesure. Pour que le formalisme standard nous autorise à identifier une propriété, il faudrait que le vecteur d’état final (après la mesure) nous permît de remonter au vecteur d’état initial (avant la mesure). Le fait que la mesure soit une projection aléatoire empêche une telle opération.

1.3. Faut-il sauver la catégorie de propriété ?

On peut toutefois essayer de sauver la notion de propriété. Pour cela, il n’y a pas d’autres moyens que de sortir du cadre défini par le formalisme standard : comme nous l’avons vu, ce dernier supprime à la catégorie de propriété sa pertinence. Afin de sortir de ce cadre, il est possible d’essayer d’introduire des paramètres supplémentaires, (que l’on appelle couramment des « variables cachées »). Historiquement, les paramètres supplémentaires ont été conçus comme devant déterminer le résultat de la mesure et supprimer le caractère aléatoire de l’acte de mesure.
Mais ces paramètres peuvent également être vus comme représentant les propriétés dont les objets physiques seraient dotés et que la mesure aurait pour fonction de révéler. En effet, s’il existe théoriquement certains paramètres qui déterminent le résultat des mesures à venir, alors il est possible de remonter à la valeur de ces paramètres à partir du résultat de la mesure effectuée. A partir de cette opération, rien n’empêcherait alors de poser que ces paramètres décrivent les propriétés réellement possédées par les systèmes physiques mesurés. L’acte de mesure en mécanique quantique ne serait pas fondamentalement différent de ce qu’il était supposé être en mécanique classique : une prise de connaissance par le sujet des déterminations intrinsèques des objets.

Autrement dit, les théories à variables cachées peuvent être vues comme des tentatives pour retrouver la situation classique d’un face-à-face entre un objet doté de propriétés et un sujet connaissant, des tentatives pour maintenir le réalisme de l’objet qui était compatible avec la physique classique.

Cette démarche peut paraître tentante, en particulier pour celui qui souhaite retrouver le schéma ontologique et épistémologique auquel la physique classique (mais également une très grande partie de la philosophie de la connaissance) nous a habitués. Mais depuis leur apparition, les théories à variables cachées ont dû faire face à de nombreuses difficultés qu’elles n’avaient pas anticipées et qui les rendent de moins en moins simples et intuitives. D’une part, les inégalités de Bell [2] (1964) imposent aux théories à variables cachées d’être non-locales, au sens où il faut que les propriétés puissent s’influencer instantanément à distance. Autrement dit, il faudrait admettre qu’il existe une autre forme d’action que l’action par contact (ou action locale). D’autre part, les inégalités de Leggett (2003) [3] montrent que les modèles non-locaux physiquement satisfaisants sont en contradiction avec la mécanique quantique (et avec l’expérience) [4]. Par conséquent, même l’introduction de l’hypothèse de non-localité ne suffit pas à rendre acceptables les théories à variables cachées. Enfin, on peut montrer que, au moins dans certaines situations, la valeur du résultat obtenu lors d’une mesure d’une observable dépend du contexte expérimental dans lequel cette mesure est effectuée. En effet, pour le même appareil de mesure, utilisé pour mesurer la même observable sur un même système physique, les résultats de mesure seront différents selon le contexte expérimental complet (c’est-à-dire les autres appareils utilisés, la nature des mesures faites auparavant, etc.). Or, si les mesures révélaient les propriétés préexistantes des objets, les valeurs obtenues ne dépendraient pas de tout le contexte expérimental. Par conséquent, la contrainte de contextualité interdit de supposer que la mesure révèle des propriétés qui lui préexistent.

Faut-il alors conserver à tout prix la notion de propriété et le réalisme de l’objet ? Comme on le voit, les contraintes s’accumulent pour les théories à variables cachées. A l’origine, elles pouvaient se présenter comme des théories beaucoup plus proches du sens commun que la mécanique quantique standard. Aujourd’hui, ce n’est plus le cas, en raison des éléments que l’on vient d’énumérer. Surtout, on a du mal à percevoir l’intérêt de maintenir cette notion de propriété dès lors qu’on ne peut plus supposer que la mesure nous permet d’en prendre connaissance. N’a-t-on pas alors vidé la notion de propriété, sinon de son sens, du moins de son intérêt ? Une propriété est intéressante épistémologiquement lorsqu’elle permet de traduire ontologiquement la connaissance que nous obtenons grâce aux actes de mesure ; elle est intéressante dès lors qu’elle permet la projection ontologique de contenus épistémiques (c’est-à-dire la transposition, dans l’ordre des choses elles-mêmes, de résultats de mesure). A quoi peut-elle encore servir dès lors qu’on considère qu’elle ne préexiste pas à la mesure et donc qu’elle ne peut être conçue comme une description de ce qui existe indépendamment de nous ? N’est-elle pas alors une notion devenue superflue ? Il nous semble qu’elle est devenue une catégorie purement métaphysique, au sens où on ne peut la maintenir qu’en supposant qu’elle représente un élément de la réalité qui ne se manifesterait jamais directement à nous, un élément relevant d’une sorte d’arrière-monde.

2. Deuxième catégorie : l’identité numérique

2.1 Un critère quantique de décomposition

L’autre exemple de catégorie que nous souhaitons examiner est celle d’identité numérique. Pour cela, nous nous appuierons sur des études menées en collaboration avec Thierry Paul [5]. L’identité numérique est ce qui permet de compter : un trio de chanteurs comprend trois chanteurs, c’est son identité numérique. Un élément est dit « simple » si son identité numérique est égale à 1, « composé » si elle est supérieure à 1.
En physique classique comme pour le sens commun, l’espace joue un rôle particulier. Ainsi, deux objets habituels ne peuvent pas occuper la même région spatiale : ils ne peuvent être que l’un à côté de l’autre (c’est ce que la tradition philosophique appelle l’antitypie, ou l’impénétrabilité). Inversement, deux régions spatiales disjointes ne peuvent être occupées par le même objet solide. Pour la mécanique classique (et dans la vie quotidienne), l’espace physique à trois dimensions est ainsi un bon critère de l’identité numérique, au moins dans les cas habituels. Par exemple, si l’on demande pourquoi une montre mécanique est un système composé, la réponse la plus naturelle est qu’on peut ouvrir la montre, se saisir de chacune des parties et les mettre les unes à côté des autres. Autrement dit, on peut séparer spatialement les différentes parties qui composent la montre.

Pour des raisons sur lesquelles nous reviendrons plus bas, le critère de l’espace physique pose des problèmes en mécanique quantique. Il faut donc essayer d’en trouver un autre. On peut alors proposer de considérer le critère suivant :

Un système physique est un système composé si et seulement si il est possible d’étudier séparément les différentes parties qui le composent.

Ce critère peut être vu comme une façon de généraliser l’exemple précédent de la montre : un système est composé si, d’une part, on peut faire une étude partielle de ce système, c’est-à-dire faire des mesures sur l’un seulement des sous-systèmes, et si, d’autre part, des mesures partielles faites sur l’une des sous-parties n’affectent pas les mesures partielles faites sur une autre sous-partie.

On peut formaliser ce critère de la façon suivante :
Supposons que nous ayons un système $S$ décrit par un vecteur d’état $\text{|}\Psi\text{>}$ appartenant à l’espace de Hilbert $H$. $S$ est un système composé de $n$ sous-systèmes $S_1, S_2 \ldots S_n$ supposés appartenir respectivement à $n$ espaces de Hilbert $H_1, H_2, \dots, H_n$ tels que $H = H_1 \otimes H_2 \otimes \ldots \otimes H_n$ si et seulement si :

  • Condition 1 : si $\sigma_1,\sigma_2,\ldots,\sigma_n$ sont $n$ opérateurs hermitiens qui appartiennent respectivement aux $n$ espaces de Hilbert $H_1, H_2, \ldots, H_n$ et qui correspondent à des mesures qui peuvent être physiquement réalisées, il est physiquement possible, pour $i=1\ldots n$, de réaliser une mesure correspondant à l’opérateur $\Sigma_i = I_1 \otimes I_2 \otimes \ldots \otimes \sigma_i \otimes \ldots \otimes I_n$ (où $I_i$ est l’opérateur identité défini dans $H_i$).
  • Condition 2 : si l’on note $P(\Sigma_i)$ les probabilités de résultat pour une mesure correspondant à l’opérateur $\Sigma_i$, et $P(\Sigma_i / \Sigma_j)$ les probabilités de résultats pour une mesure correspondant à $\Sigma_i$ sachant qu’une mesure $\Sigma_j$ a déjà été réalisée auparavant, alors on doit avoir : $P(\Sigma_i) = P(\Sigma_i / \Sigma_j)$.

La première condition formalise l’idée qu’il doit être physiquement possible de faire des mesures partielles sur le système global. Celui-ci appartenant à l’espace de Hilbert global $H = H_1 \otimes H_2 \otimes \ldots \otimes H_n$, une mesure partielle sur la n-ième sous-partie du système global s’écrira : $\Sigma _i = I_1 \otimes I_2 \otimes \ldots \otimes \sigma_i \otimes \ldots \otimes I_n$. S’il n’était pas possible de réaliser de telles mesures, alors il faudrait toujours étudier le système tout entier, en bloc, et il n’y aurait aucun intérêt pratique à considérer que le système est composé.

La deuxième condition formalise l’idée que les mesures partielles doivent être séparables, au sens où les mesures partielles faites sur une sous-partie $S_i$ ne doivent pas modifier les mesures partielles sur $S_j$. Dans la mesure où, en mécanique quantique, les mesures sont de nature probabiliste, les résultats de mesure seront décrits par des probabilités de résultat. Si une telle condition n’est pas vérifiée, alors les mesures partielles ne sont pas séparables les unes des autres : leurs résultats seraient conditionnés par le fait que d’autres mesures partielles ont été faites. Dans ce cas, les études partielles ne seraient pas vraiment partielles : elles dépendraient fortement du tout et ne seraient pas séparables. C’est pour éviter ce type de cas qu’il faut prévoir la condition 2.

Ce critère est intéressant dans le cas des états intriqués. Pour le comprendre, il nous faut commencer par les états non-intriqués. Supposons ainsi que l’on dispose de deux systèmes différents $S_1$ et $S_2$ qui n’ont jamais interagi. Ils sont alors indépendants l’un de l’autre, et sont décrits à l’aide de deux espaces de Hilbert ($H_1$ et $H_2$) et de deux vecteurs d’état $\text{|}S_1\text{>}$ et $\text{|}S_2\text{>}$. On peut aussi décrire le système global $\Sigma$ composé de $S_1$ et $S_2$. $\Sigma$ est décrit par un espace de Hilbert global et un vecteur d’état tels que :

$$\boxed{H = H_1 \otimes H_2}\hphantom{0123456789}\boxed{\text{|}\Psi\text{>} = \text{|}S_1\text{>}\otimes\text{|}S_2\text{>}}$$

Dans ce cas, il n’y a pas de difficulté à identifier les différents sous-systèmes et à les compter : $\Sigma$ est un système composé et il y a deux sous-systèmes $S_1$ et $S_2$. On peut attribuer aux deux sous-systèmes $S_1$ et $S_2$ un vecteur d’état. On vérifiera aisément que le critère proposé ci-dessus s’applique parfaitement à ce cas.

Attribuer une identité numérique à la situation physique ne pose donc pas de problème.

2.2 Le produit tensoriel et les états factorisés

En revanche, il n’en va de même pour les systèmes intriqués. En effet, si les deux sous-systèmes interagissent, le vecteur d’état va perdre sa forme factorisée. Il va se transformer en une combinaison linéaire de produits tensoriels. Le vecteur d’état s’écrit alors :

$$\boxed{\text{|}\Psi\text{>} = \sum_{i,j}\text{|}u_i\text{>}\otimes\text{|}v_j\text{>}}$$

où les vecteurs $\text{|}u_i\text{>}$ et les vecteurs $\text{|}v_j\text{>}$ vivent respectivement dans $H_1$ et $H_2$, c’est-à-dire dans les espaces de Hilbert respectifs de $S_1$ et $S_2$.
Cette situation a ceci de particulier qu’il n’est alors plus possible d’attribuer un vecteur d’état à chacun des deux sous-systèmes $S_1$ et $S_2$ (s’ils existent encore). En effet, pour décrire l’état de $S_1$, il faudrait pouvoir lui attribuer un vecteur d’état appartenant à $H_1$. Mais quel vecteur $\text{|}u_i\text{>}$ choisir ? Il n’y a pas de raison a priori de privilégier tel ou tel. Il en va de même pour $S_2$ et les vecteurs $\text{|}v_j\text{>}$. En outre, puisque $\sum_{i,j}\text{|}u_i\text{>}\otimes\text{|}v_j\text{>}\neq(\sum_{i}\text{|}u_i\text{>})\otimes(\sum_{j}\text{|}u_j\text{>})$, on ne peut pas non plus attribuer à $S_1$ le vecteur d’état $\sum_{i}\text{|}u_i\text{>}$, ni à $S_2$ le vecteur d’état $\sum_{j}\text{|}u_j\text{>}$. En réalité, on ne peut attribuer de vecteur d’état qu’au système global $\Psi$. Le système global est alors dans un état intriqué.

La difficulté porte alors sur l’identité numérique du système global. Combien y a-t-il de systèmes ? Y a-t-il encore deux sous-systèmes qui composent un système global ? Ou bien n’avons-nous affaire qu’à un seul système simple, sans sous-systèmes ?

2.3 Est-il possible de décomposer les systèmes intriqués ?

Examinons d’abord la condition 1. A l’aide du formalisme standard [6], on peut montrer que, dans le cas le plus intéressant où les deux systèmes initiaux $S_1$ et $S_2$ sont de même nature (par exemple lorsqu’il s’agit de deux photons, ou de deux électrons), alors la condition 1 implique que les sous-parties doivent occuper des régions spatiales disjointes et que l’état spatial global s’écrit comme un produit tensoriel de deux fonctions spatiales. Sinon, il n’est pas physiquement possible de réaliser des opérateurs permettant des mesures partielles du type $\Sigma_i = I_1 \otimes I_2 \otimes \ldots \otimes \sigma_i \otimes \ldots \otimes I_n$. On peut comprendre ce résultat en remarquant que si les deux sous-systèmes n’occupent pas des régions spatiales disjointes, il n’y a pas de raison pour que l’appareil physique utilisé pour mesurer l’un n’agisse pas aussi sur l’autre.
Examinons maintenant la condition 2 [7]. De prime abord, on pourrait penser que la condition 1 est suffisante. Si le système global occupe deux régions spatiales distinctes, et que son état spatial peut être décomposé comme le produit tensoriel de deux fonctions d’onde sur l’espace, on devrait pouvoir déterminer deux sous-systèmes correspondant simplement aux deux régions spatiales disjointes occupées par le système global. Comme nous l’indiquions précédemment, c’était le cas en mécanique classique : si un système occupait deux régions spatiales disjointes, alors il fallait dire qu’il était composé de deux sous-systèmes occupant chacun l’une des deux régions spatiales. Or, on peut montrer [8] que la condition 2 implique que le vecteur d’état global s’écrive comme un produit tensoriel, c’est-à-dire que le système global ne soit pas dans un état factorisé.
Il apparaît donc que tout système intriqué est un système simple et non pas un système composé. Dans notre exemple, il faut donc dire que l’interaction entre les deux systèmes initialement indépendants, en produisant l’intrication, a modifié l’identité numérique du système global : le système global était initialement composé de deux sous-systèmes, il est devenu un système simple.
On remarquera que, dans cette perspective, le langage utilisé couramment est trompeur. On parle ainsi de « paires intriquées » pour désigner des systèmes en état d’intrication. En réalité, d’après le critère de décomposition proposé, il n’y a pas de paire. Ainsi, « deux photons » intriqués ne sont en fait qu’un seul et unique photon.

La notion d’identité numérique en mécanique quantique a donc changé par rapport à la physique classique. En physique classique, l’occupation spatiale permettait de compter les objets. En physique quantique, un unique système peut occuper des régions spatiales disjointes. Ce changement provient du fait que l’occupation spatiale est traitée exactement comme l’état de spin ou l’état de polarisation : chacun est représenté à l’aide d’un espace de Hilbert qui lui est propre. Il n’y a donc pas d’impossibilité à ce que la fonction d’onde spatiale d’un système simple présente deux pics disjoints. Elle peut également être intriquée avec d’autres degrés de liberté (par exemple avec l’état de spin, comme c’est le cas dans les filtres de Stern-Gerlach). L’état spatial d’un système ne joue donc plus de rôle privilégié dans le formalisme. C’est un degré de liberté parmi d’autres.

Conclusion

Si l’on compare les deux changements catégoriels précédemment étudiés, on s’aperçoit qu’ils ont plusieurs points communs importants. D’une part, comme nous l’indiquions dans l’introduction, les modifications conceptuelles induites par la mécanique quantique ne sont pas marginales. La notion de propriété comme celle d’identité numérique sont des concepts centraux de la physique classique et plus largement de notre façon de comprendre le monde. Il s’agit donc bien d’un changement catégoriel.
D’autre part, de telles modifications sont en fait déterminées par le formalisme, et plus particulièrement par l’aspect mathématique du formalisme. La disparition de la catégorie de propriété provient du fait que la mesure est une projection du vecteur d’état, tandis que la modification de la catégorie d’identité numérique s’explique par le fait que l’état spatial d’un système soit traité comme une variable parmi d’autres et ne joue plus de rôle particulier.
C’est une caractéristique de la mécanique quantique qui nous semble importante. Si les théories physiques en général et la mécanique quantique en particulier ne se réduisent pas à l’aspect logico-mathématique de leur formalisme, il apparaît cependant qu’une grande partie des innovations conceptuelles de la mécanique quantique ne peuvent être comprises qu’à partir de leur sens mathématique. En prenant le formalisme de la mécanique quantique pour guide, nous avons ainsi été amené directement à repenser ce qu’est une mesure, à mettre en doute la pertinence de la notion d’objet, et à revoir le rôle que l’on peut faire jouer à l’espace. Finalement cette situation n’est peut-être pas si surprenante : si l’ontologie classique provient de l’analyse logique du jugement menée par Aristote, il n’est pas difficile de comprendre que le formalisme mathématique de la mécanique quantique, si innovant pour la physique, nous impose des remaniements catégoriels aussi profonds.

Bibliographie (comportant uniquement quelques textes classiques) :

Bell J.S., Speakable and unspeakable in quantum mechanics, Cambridge, Cambridge University Press, 1987.

Bohr N., « Can quantum mechanical description of reality be considered complete ? », Physical Review, 48, 1935, p.696-702.

Bohr N., La Théorie atomique et la description des phénomènes, trad. par A. Legros et L. Rosenfeld, Paris, Gauthier-Villars, 1932, rééd à Sceaux, Éditions Jacques Gabay, 1993.

Bohr N., Physique atomique et connaissance humaine, traduction, introduction, et annotation par C. Chevalley, Paris, Gallimard, coll. Folio, 1991.

Einstein A., Oeuvres Complètes, 5 vol., F. Balibar, O. Darrigol et B. Jech éd., Paris, Seuil, 1989.

Schrödinger E., Physique quantique et représentation du monde, trad. par F. De Jouvenel, A Bitbol-Hespériès et M. Bitbol, introduction et annotation par M. Bitbol, Paris, Seuil, 1992.


[1] Voir par exemple ce passage de Galilée : « Je pense donc que ces saveurs, odeurs, couleurs, etc., eu égard au sujet dans lequel elles nous paraissent résider, ne sont que de purs noms et n’ont leur siège que dans le corps sensitif, de sorte qu’une fois le vivant supprimé, toutes ces qualités sont détruites et annihilées ; mais comme nous leur avons donné des noms particuliers et différents de ceux des qualités réelles et premières, nous voudrions croire qu’elles en sont vraiment et réellement distinctes. » (L’Essayeur, traduction et présentation de Christiane Chauviré, Les Belles Lettres, Paris, 1980, p.239, cité par Jean-Marc Lévy-Leblond, « Une matière sans qualités ? Grandeur et limites du réductionnisme physique », dans L. Boi (éd.), Science et Philosophie de la nature, Bern, Peter Lang, 2000.

[2] Bell J.S., Speakable and unspeakable in quantum mechanics, Cambridge, Cambridge University Press, 1987.

[3] Leggett A.J., « Nonlocal Hidden-Variable Theories and Quantum Mechanics : An Incompatibility Theorem », Foundations of Physics, Vol. 33, No 10, October 2003, 1469-1493.

[4] Voir par exemple notre article « Les inégalités de Leggett et la spécificité de la physique quantique », dans le numéro 17 (à paraître) de la revue Noesis.

[5] Sur tout ce qui suit, on pourra consulter l’article suivant : Thierry Paul, Sébastien Poinat, « Quantum Mechanics, Emergence and Reduction », hal-00544398, version 1.

[6] Nous utilisons ici le travail de Thierry Paul. On pourra se reporter notamment à son article « A propos du formalisme mathématique de la Mécanique Quantique », dans Logique & Interaction : Géométrie de la cognition, Actes du colloque et école thématique du CNRS « Logique, Sciences, Philosophie » à Cerisy, Hermann 2009

[7] On pourra se reporter à Thierry Paul, Sébastien Poinat, « Quantum Mechanics, Emergence and Reduction », hal-00544398, version 1.

[8] Nous laissons au lecteur le soin de réaliser la démonstration. Le calcul est un peu long mais relativement simple. Il est exposé dans Thierry Paul, Sébastien Poinat, « Quantum Mechanics, Emergence and Reduction », hal-00544398, version 1.

Logique et Interaction : vers une Géométrie de la Cognition

Cet opus augural rassemble des communications issues des différentes rencontres du groupe LIGC [Logique et Interaction : vers une Géométrie de la Cognition] au sein duquel collaborent des philosophes et des scientifiques d’horizons divers, rassemblés dans une réflexion philosophique commune sur l’impact des métamorphoses récentes de la logique dans le contexte de son dialogue avec l’informatique théorique.
Le groupe LIGC promeut une analyse critique des points de vue « réalistes » prédominants en philosophie de la logique, en philosophie des sciences et dans les approches logiques de la cognition, au profit d’une philosophie interactionniste de la rationalité.