J’ai eu l’occasion, après avoir écouté l’une des conférences données lors de la journée “La Science et l’Impossible” (PIF 14ème Rencontre) organisée en novembre 2014 à la BNF, d’étudier l’article de David Deutsch et Chiara Marletto, intitulé “Constructor Theory of Information”. La compréhension de la lettre et de l’esprit de cet article est difficile pour qui n’est pas à l’aise avec la notion d'information et les diverses interprétations de la physique quantique. Ainsi l’un des points évoqués dans l’article concerne-t-il la discussion autour de la question localité/non localité, question sur laquelle David Deutsch et l’un de ses collègues défendent des positions “non conventionnelles”.
Pour mieux rendre compte de l’article Deutsch/Marletto, il m’est de toute façon nécessaire de disposer d’un plus large arrière-plan théorique. J’ai choisi d’étudier de plus près certains objets quantiques basiques, à partir des systèmes à deux niveaux et plus spécifiquement à partir de la notion de quantum bit. Mes sources principales dans ce billet sont deux ouvrages, savoir :
- Roger Penrose, “A la découverte des lois de l’Univers”, editions Odile Jacob 2007, chapitres 22 (en particulier pages 535-540) et 29 (pages 760 et suivantes)
- Claude Cohen-Tannoudji, Bernard Diu, Franck Laloë, “Mécanique Quantique 1” Hermann Enseignement des Sciences 1977, Chapitre IV (pages 385-400)
Le présent billet est consacré au quantum bit en tant qu’objet isolé. Dans un prochain billet j’aborderai les couplages de plusieurs “qubits”. Que mes lecteurs éventuels ne se méprennent pas : ces billets ne sont pas des “cours”. Tout au plus des notes de cours. Il s’agit pour moi, en rédigeant et parfois en (me) reformulant certains calculs ou raisonnements, d’accéder à une compréhension plus incarnée des notions abordées.
La notion de “quantum bit” (Qubit)
Any quantum ‘two-state’ system such as the spin of an electron or the polarisation of a photon can in principle be used as the physical realisation of a qubit, the basic unit of quantum information. (in David Deutsch and Patrick Hayden, Information Flow in entangled Quantum Systems. Proceedings of the Royal Society of London. Series A, 2000)
Ces “quantum bits”, en abrégé “qubits” sont effectivement d’abord des modèles de nombreux systèmes physiques aux échelles atomiques. Mais ce sont aussi les unités de base pour tous ceux qui travaillent sur l’ordinateur quantique
Représentation des états d’un qubit
Compte tenu des grandeurs physiques d’origine (moments cinétiques, magnétiques, spins, …), les états d’un qubit doivent pouvoir être mis en correspondance avec des directions spatiales (droites orientées) dans l’espace ordinaire à trois dimensions. Par ailleurs la nature quantique de ces états exige qu’ils puissent être vus également comme des vecteurs d’un espace de Hilbert, et que l’on puisse parler ainsi de combinaison linéaire et de produit scalaire de deux états.
Pour satisfaire ces deux exigences, le formalisme quantique représente ces états par des doublets {a,b} de deux nombres complexes, les doublets {1,0} et {0,1} devant coder, en outre, deux directions opposées de notre espace 3D (conventionnellement, celles des valeurs positives et des valeurs négatives d’un axe Oz, dans un système d’axes Ox,Oy,Oz orthonormés).
Montrons que ce codage par des doublets {a,b} satisfait ces exigences. Tout d’abord, les doublets {a,b} peuvent bien être considérés comme des vecteurs d’un espace de Hilbert, dès lors qu’on définit le produit scalaire <{a,b}|{c,d}> comme valant āc + b̄d (la barre indiquant le passage au nombre complexe conjugué). Il s’agit en l’occurrence de l’espace de Hilbert bidimensionnel complexe, noté H². Par ailleurs, les composantes de tout doublet {a,b} peuvent toujours être écrites sous la forme :
a = u cos(θ/2) exp(-i φ/2) b = u sin(θ/2) exp(i φ/2)
avec 0 ≤ θ ≤ π, φ réel et u nombre complexe quelconque, tous trois complètement déterminés lorsque le produit ab n’est pas nul. On s’en convainc en écrivant a, b et u sous la forme a = A exp (iα), b = B exp (iβ), u = U exp (iν) ; de l’égalité des normes et des arguments avec ab non nul il découle en effet :
U = √(A²+B²)
ν = (β+α)/2
θ = 2 Arctg(B/A)
φ = (β-α)
Etats d’un qubit et directions spatiales
Avec {a,b} écrit sous la forme proposée, on vérifie bien que :
- un doublet {a,b} code une direction spatiale unique : il suffit d’interpréter θ comme une co-latitude (angle d’une direction spatiale avec l’axe Oz) et φ (modulo 2π) comme une longitude (angle d’une direction du plan Ox,Oy avec l’axe Ox).
- les doublets {1,0} et {0,1} codent respectivement deux directions opposées : il suffit de remarquer que le doublet {1,0} implique θ = 0 et représente donc la direction 0z vers les valeurs positives ; de même le doublet {0,1} implique θ = π et représente la direction opposée sur le même axe..
- les doublets {a,b} et {-b̄,ā} codent plus généralement deux directions opposées quelconques. Et constituent deux vecteurs orthogonaux avec le produit scalaire adopté, puisque <{a,b}|{-b̄,ā}> = 0.
Il existe cependant une infinité de doublets {a,b} représentant la même direction [θ, φ], chacun associé à un facteur complexe u particulier. Tous ces doublets doivent être considérés comme équivalents ; en définitive, un état d’un qubit est identifié - après choix d'un repère - par un doublet de nombres complexes pouvant s’écrire, à un facteur complexe u = U exp(iv) près, sous la forme canonique (U=1, v=0) :
{cos(θ/2) exp(-i φ/2) , sin(θ/2) exp(i φ/2)}
Etats d’un qubit et points d’une sphère.
On sait la correspondance entre la surface d’une sphère et le faisceau des droites orientées : si O est le centre de la sphère, tout point P de sa surface définit une direction unique OP. Un état possible d’un qubit, c’est à dire rappelons le une direction spatiale, peut donc être vu aussi comme un point à la surface d’une sphère ; cette correspondance permet de donner au qubit une image très concrète. Nous reproduisons ici, en l’adaptant, l’image donnée dans Wikipédia, sous l’article calculateur quantique.
Par ailleurs, un vecteur {a,b} ∈ H² quelconque étant donné et exprimé avec les grandeurs u, θ, φ, le rapport b/a ne dépend que des seuls paramêtres θ et φ, les degrés de liberté liés à u (module U et phase v) ayant disparu. Cette propriété pour les états du qubit d’étre assimilables - cette fois de façon bi-univoque - aux rapports b/a (en admettant également les valeurs “à l’infini” b/0) fait de l’ensemble qu’ils constituent un équivalent de l’espace projectif PH².
La correspondance entre une valeur du rapport b/a et le point de la sphère représentant l’état {a,b} du qubit est simple : on place sur le plan équatorial le point associé au nombre complexe b/a, puis on projette ce dernier point sur la sphère depuis le “pôle sud” (c’est à dire l’état {0,1}). Ce type de projection est appelée projection stéréographique. On remarque que l’angle de la droite de projection avec l’axe 0z est θ/2.
Retour sur la correspondance entre l'espace 3D et l'espace de Hilbert H².
Nous sommes donc en présence de deux manières de voir l’état d’un qubit :
Résumons donc les deux associations, dont l’usage est courant :
- soit, d’une manière abstraite, comme un vecteur de l’espace de Hilbert bidimensionnel complexe H² (toujours, rappelons le, à un facteur complexe près)
- soit, d’une manière plus concrète, comme une direction spatiale dans notre espace 3D, ou encore, ce qui revient au même, un point de la surface d’une sphère.
Analysons les degrés de liberté dont nous disposons pour faire correspondre un vecteur de H² et un point d’une sphère. L’espace H² étant bidimensionnel, choisissons une base orthonormée, formée de deux vecteurs notés conventionellement |↑> et |↓> ; un vecteur quelconque - de coordonnées {a,b} - est une combinaison linéaire unique, savoir a|↑> + b |↓>, de ces deux vecteurs de base.
Pour établir une correspondance entre ces vecteurs et les points d’une sphère, déterminons d’abord le point de cette dernière associée au vecteur de base |↑>. Les points de la sphère étant repérés par un système d’axes Ox,Oy,Oz, le choix effectué dans les figures ci-avant associe |↑> à l’axe Oz vers les valeurs positives, donc à ce qu’on a appelé le “pôle nord” de la sphère. Ce choix effectué, le vecteur |↓> se trouve automatiquement associé au “pôle sud”, sur l’axe Oz vers les valeurs négatives.
Mais cela ne verrouille pas entièrement la correspondance. Il reste encore une liberté “de phase”, savoir le choix du point de la sphère, sur le cercle “équatorial”, associée à la longitude 0 ; ou encore le choix du point de la sphère associé au vecteur cos (π/4) |↑>+ sin(π/4) |↓>, ce qui revient au même. Le choix effectué dans les figures çi avant associe ce vecteur à l’axe Ox vers les valeurs positives.
|↑> associé à Oz et cos (π/4) |↑>+ sin(π/4) |↓> associé à Ox.
Une fois adoptée, la correspondance est complètement déterminée : elle associe sans plus aucune ambiguité un vecteur de l’espace de Hilbert à un point de la sphère, et, réciproquement, un point de la sphère à un vecteur de l’espace de Hilbert (à un facteur complexe près). Dans ces conditions, il est possible de calculer les coordonnées “cartésiennes” x,y,z du point de la sphère en fonction des coordonnées du vecteur représentant un vecteur a|↑> + b |↓> de l’espace de Hilbert : un calcul, utilisant les expressions de x,y,z en fonction de θ et φ, aboutit à :
x= (b̄a +āb) y = i (b̄a - āb) z = āa - b̄b
Rotations
Après avoir “caler” la correspondance entre un vecteur de l’espace H² et une direction spatiale (ou un point d’une sphère) de l’espace 3D, tournons nous vers la correspondance entre les transformations (= opérateurs) qui agissent respectivement dans ces deux espaces.
Commençons par un exemple simple : dans la base |↑>, |↓>, l’opérateur de H² - représenté par la matrice M ayant pour coefficients m₁₁ = exp(-iψ/2), m₁₂ = m₂₁ = 0, m₂₂ = exp(+iψ/2) - transforme un vecteur de départ
cos(θ/2) exp(-iφ/2) |↑> + sin(θ/2) exp(iφ/2) |↓>
en un vecteur d’arrivée
cos(θ/2 )exp (-i(φ+ψ)/2) |↑> + sin(θ/2) exp(i(φ+ψ)/2) |↓>
L’opération - qui fait passer du point de la sphère, associé au vecteur de départ, au point associé au vecteur d’arrivée - est une rotation dans l’espace 3D, rotation de l’angle ψ autour de l’axe Oz. On observe par ailleurs que l’opérateur de H² utilisé dans cet exemple préserve le produit scalaire, et que son déterminant vaut 1.
Ces observations suggèrent d’élargir ce cas et de prendre en compte l’ensemble des opérateurs linéaires de l’espace H², qui répondent aux conditions suivantes : conserver le produit scalaire (et donc la norme) et avoir un déterminant égal à 1. Ces conditions, traduites sur les matrices M représentant ces opérateurs, s’écrivent :
m̄₁₁m₁₁ + m̄₂₁m₂₁ = 1 ; m̄₁₂m₁₂ + m̄₂₂m₂₂ = 1 ; m̄₁₁m₁₂ + m̄₂₁m₂₂ = 0 ; m₁₁m₂₂ - m₁₂m₂₁ = 0
Un calcul montre alors que ces matrices sont nécessairement de la forme :
L’ensemble des opérateurs répondant aux conditions imposées forment un groupe, le groupe dit “SU(2)” dans la littérature. On montre effectivement :
- qu’une fois établie la correspondance entre une base |↑>, |↓> de H² et le repère Ox,Oy,Oz de l’espace 3D, tout opérateur M de SU(2) peut être associé de façon univoque à une rotation R autour du centre O.
- qu’à la composition M₂M₁ de deux opérateurs SU(2) associés respectivement aux rotations R₂ et R₁ correspond la rotation R₂R₁.
A partir des deux nombres complexes m et p (soit quatre nombres réels dont la somme des carrés égale 1, donc trois degrés de liberté), des calculs permettent d’obtenir les trois paramètres déterminant la rotation associée, savoir la direction de l’axe de rotation et l’angle de rotation.
Le principe de ces calculs consiste à décomposer la matrice M en une combinaison linéaire à coefficients réels u₀, u₁, u₂, u₃ de quatre matrices I, -iσ₁, -iσ₂, -iσ₃ ; dans cette décomposition I est la matrice représentant l’opérateur identité. Les trois autres matrices, -iσ₁, -iσ₂, -iσ₃, (cf matrices de Pauli) représentent les opérateurs de H² respectivement associés, dans l’espace 3D, aux rotations d’un angle π autour des axes Ox, Oy, Oz. L’expression des matrices de SU(2) assure que cette décomposition est toujours possible, et que ses coefficients peuvent être mis sous la forme :
u₀ = cos (ψ/2) , u₁ = n₁ sin (ψ/2) , u₂ = n₂ sin (ψ/2) , u₃ = n₃ sin (ψ/2)
avec |n₁|² + |n₂|² + |n₃|² = 1
Cette écriture fournit alors l’angle et l’axe de la rotation cherchée : l’angle de la rotation est justement l’angle ψ. La direction de l’axe de rotation est donnée par le vecteur de composantes n₁, n₂, n₃.
Mesures sur un qubit : la question.
Mesurer un qubit - c’est à dire en quelque sorte mesurer son orientation - c’est soumettre le qubit à interagir avec un instrument de mesure, privilégiant une direction spécifiée par un certain état {a,b}. Cet instrument est construit pour donner deux résultats de mesures possibles, notés ↑ et ↓, et s’interprétant de la façon suivante :
- si le résultat est ↑, l’angle entre la direction associée à l’état d’avant mesure et la direction privilégiée {a,b} était plus probablement inférieur à π/2
- si le résultat est ↓, ce même angle était plus probablement supérieur à π/2.
Quoi qu’il en soit, une fois la mesure effectuée, le qubit se trouve dans l’état {a,b} ou dans l’état opposé {-b̄, ā), selon que le résultat de la mesure a été ↑ ou ↓.
L’instrument utilisé définit donc une observable, constitué ici de deux valeurs possibles - ↑ et ↓ - correspondant respectivement aux états d’après mesure {a,b} et {-b̄, ā}. Le qubit étant avant la mesure dans un état quelconque {c,d}, la question est de savoir, une fois la mesure effectuée, quelle est la probabilité de voir que l’instrument afficher ↑ ou ↓ et, partant de là, quelle est la probabilité de voir le qubit se retrouver dans l’état {a,b} ou dans l’état {-b̄,ā}
Les enseignements de la physique quantique
La physique quantique enseigne, notamment, les principes suivants :
- une observable est représentée par un opérateur agissant dans l’espace vectoriel des états du système, ici l’espace H².
- les résultats possibles codent les valeurs propres de cet opérateur
- les états d’après mesure possibles sont les vecteurs propres de l’opérateur
- l’état d’après mesure est le vecteur propre lié à la valeur propre affichée.
- la probabilité d’obtenir un état x d’après mesure - alors qu’avant mesure l’état est y - est égale au carré de leur produit scalaire, soit |<x|y>|² (les deux états étant normalisés).
Application au qubit : calcul des probabilités
Appliquons ces enseignements à la mesure effectuée sur le qubit. Le point 5 ci dessus nous permet déja de connaître les deux probabilités, sans même chercher à construire la matrice représentant l’opérateur. Pour simplifier les calculs, prenons les deux états opposés {a,b} et {-b̄,ā}, comme nouveaux vecteurs de base - nous avons toujours le droit de le faire - et appliquons le changement de base correspondant. Les notations de ces deux états liés à l’orientation de l’instrument deviennent respectivement {1,0} et {0,1}. Quant à elle, la notation de l’état du qubit avant la mesure, de {c,d} devient, disons, {f,g}. Le calcul des deux produits scalaires - lesquels n’ont pas changé - est alors simple : ils valent f pour le premier (<{1,0}|{f,g}> = f) ; g pour le second ( <{0,1}|{f,g}> = g). En supposant {f,g} normalisé - et écrit sous la forme canonique {cos(θ/2) exp(-i φ/2) , sin(θ/2) exp(i φ/2)} - les probabilités des deux issues possibles de la mesure sont donc :
- pour le résultat ↑, la valeur |cos(θ/2) exp(-i φ/2)|² = cos²(θ/2)
- pour le résultat ↓, la valeur |sin(θ/2) exp(i φ/2)|² = sin²(θ/2)
Dans la représentation “sphérique”du qubit, l’angle θ est la colatitude de l’état d’avant mesure (l’angle avec l’axe Oz rappelons le) : concrètement, c’est l’angle entre la direction de l’état d’avant mesure et la direction privilégiée par l’instrument.
Détermination de l’opérateur
Qu’en est-il de l’opérateur ? Le point 3 - les états d’après mesure - nous permet d’en donner l’expression. En effet, nous en connaissons les vecteurs propres à un facteur complexe près, savoir {a,b} et {-b̄,ā} ; par ailleurs une condition classique impose que les valeurs propres soient réelles, et donc que l’opérateur soit hermitien : la matrice 2x2 qui le représente, après choix d’une base, est égale à la matrice transposée de sa conjuguée. Enfin, nous admettons une symétrie, impliquant que les deux valeurs propres soient de signes opposés, valant par exemple λ et -λ. Le seul degré de liberté restant concerne précisément la valeur de λ.
Soit donc M la matrice recherchée. L’hermiticité requiert M₁₁ = M̄₁₁, M₂₂ = M̄₂₂, M₁₂ = M̄₂₁, M₂₁ = M̄₁₂. Les conditions sur les vecteurs propres, savoir :
conduisent alors, avec {a,b} normalisé, à :
M₁₁ = λ[aā-bb̄], M₂₂ = λ[-aā+bb̄̄], M₁₂ = 2λb̄a, M₂₁ = 2λāb
soit encore, si les états sont exprimés avec θ et φ,
Avec respectivement θ = π/2 et φ = 0, θ = π/2 et φ = π/2, θ = 0, on retrouve les trois matrices de Pauli σx, σy, σz dont il a été question plus haut.
Utilisation des projecteurs
En analogie avec la géométrie ordinaire, un projecteur, dans un espace doté d’un produit scalaire, est un opérateur associé à un vecteur x normalisé, transformant un vecteur quelconque y en un vecteur <x|y> x, colinéaire au vecteur x. Un calcul simple montre que les deux projecteurs respectivement associés aux vecteurs normalisés {a,b} et {-b̄,ā} - c’est à dire projetant sur ces vecteurs - sont
On vérifie que ces opérateurs sont bien hermitiens, que leurs déterminants respectifs sont nuls (une infinité de vecteurs auront la même projection) et, enfin, qu’ils sont égaux à leurs carrés respectifs (la répétition d’une projection déjà effectuée donne le même résultat). Cette dernière propriété rappelle celle exigée pour rendre la notion de mesure consistante, savoir que la répétition immédiate d’une mesure laisse l’état du système inchangé. Aussi est-on tenté de dire qu’après la mesure, en cas de réponse ↑, le qubit, partant de son état d’avant mesure {c,d} a sauté à l’état P↑{c,d}, et qu’en cas de réponse contraire, il a sauté à l’état P↓{c,d}.
Comme auparavant, ces derniers énoncés devraient être nuancés par l’expression, “à un facteur complexe près”. Mais considérer P↑{c,d} - plutôt que son équivalent {a,b} - ou considérer P↓{c,d} - plutôt que {-b̄,ā} - a le mérite d’expliciter les probabilités des résultats de mesure, comme des probabilités d’activation des projecteurs : par la définition même des projecteurs, en effet :
- la probabilité d’obtenir ↑ peut s’écrire <{c,d}|P↑{c,d}>
- la probabilité d’obtenir ↓ peut s’écrire <{c,d}|P↓{c,d}>
L’expression de ces projecteurs appelle plusieurs remarques :
- leur produit est nul ; ils sont orthogonaux : P↑P↓ = 0
- leur somme est l’opérateur Identité : P↑ + P↓ = 1
- ils sont reliés à l’opérateur M par la combinaison linéaire M = λP↑ - λP↓
L’opérateur associé à l’observable est donc une combinaison linéaire de projecteurs orthogonaux, dont les coefficients sont les valeurs propres ; cette propriété, constatée ici, est générale. Elle reste valable, même dans le cas où plusieurs - disons n - valeurs propres sont égales à une valeur commune ; dans un tel cas, cette valeur commune est associée, non plus à un vecteur propre (défini à un facteur complexe près), mais à un espace propre de dimension n. Le projecteur à considérer est alors celui qui réalise la projection orthogonale sur cet espace propre ; c’est ce qu’affirme le postulat de projection de la physique quantique.
Dans le cas particulier bidimensionnel traité ici, la connaissance d’un seul de ces opérateurs (à partir d’une matrice vérifiant P₁₁ + P₂₂ = 1 et P₁₁ P₂₂ - P₁₂ P₂₁ = 0) détermine les deux vecteurs normalisés supports des deux projections, et donc l’opérateur M associé à l’observable, à un facteur réel près.
----
Ces éléments me permettront d’aborder, dans un prochain billet, la description des systèmes comprenant plusieurs qubits (en commençant par deux !) et les statistiques d’états que l’on peut en dresser. Et par là de poursuivre ma lecture des articles de Deutsch, Hayden et Marletto.
Aucun commentaire:
Enregistrer un commentaire