Notes de lecture du livre Quantum field theory for the gifted amateur de Thomas Lancaster et Stephen Blundell. Très souvent une simple traduction.
Une invariance de jauge dénote moins une symétrie du système qu’une redondance dans sa description, différentes configurations du champ aboutissant à des observables identiques. Cette redondance nous laisse une certaine latitude quant au choix de la meilleure formulation, c’est le choix de jauge. Une transformation d’une description à une autre est appelée transformation de jauge et l’invariance sous-jacente est l’invariance de jauge.
L’invariance de jauge n’est pas une symétrie ; point question ici de curseurs internes permettant de passer d’une particule à une autre. C’est plutôt l’affirmation de notre incapacité à trouver une description unique du système. On peut citer comme exemple l’indétermination de l’origine des potentiels électriques (le choix d’associer 0 V à la terre est arbitraire), celle de l’origine des phases en mécanique quantique (on peut passer de $\psi(x)$ à $\psi(x)\mathrm{e}^{\mathrm{i}\alpha}$ sans changer la physique), et en électromagnétisme, la transformation $A \rightarrow A+\nabla \chi$ (où $\chi(\boldsymbol{x})$ est une fonction de la position) est sans effet sur $\boldsymbol{B}=\boldsymbol{\nabla} \times \boldsymbol{A}$. On verra que ces trois indéterminations sont en fait liées entre elles, et à chaque fois, on se trouve dans des situations physiques où seules des variations peuvent faire l’objet d’observations.
Pour avoir des définitions propres, on doit lever toute ambiguïté en fixant des jauges.
De plus, il faut distinguer des choix de jauges identiques en tout point et des choix locaux, susceptibles de variés d’un point à l’autre.
Partons du Lagrangien du champ scalaire complexe :
$$ \mathcal{L}=\left(\partial^\mu \psi\right)^{\dagger}\left(\partial_\mu \psi\right)-m^2 \psi^{\dagger} \psi $$
Comme on l’a vu, la symétrie $U(1)$ se traduit par la non variation du Lagrangien (et par extension des équations du mouvement) lors de la transformation $\psi(x) \rightarrow \psi(x) \mathrm{e}^{\mathrm{i} \alpha}$. Il s’agit là d’une transformation globale puisqu’elle change le champ d’une même valeur en tout point de l’espace-temps. La théorie est donc dite invariante par transformation $U(1)$ globale.
Que se passerait-il si on imposait une invariance locale par rapport à la phase ? Il faudrait que la transformation $\psi(x) \rightarrow \psi(x) \mathrm{e}^{\mathrm{i} \alpha(x)}$ (où $\alpha(x)$ peut maintenant différer d’un point à l’autre) soit sans effet sur les équations du mouvement. Cela semble une demande un peu extrême, mais elles se révèle ultra féconde : l’électromagnétisme en découle !
On n’est pas embêté par le terme de masse : $m^2\psi^\dagger\psi\rightarrow m^2\psi^\dagger \mathrm{e}^{-\mathrm{i} \alpha(x)} \mathrm{e}^{\mathrm{i} \alpha(x)} \psi = m^2\psi^\dagger\psi $. Par contre, le terme contenant les dérivées pose problème puisque la dérivée agit maintenant sur $\alpha(x)$ :
$$ \begin{aligned} \partial_\mu \psi(x) & \rightarrow \partial_\mu \psi(x) \mathrm{e}^{\mathrm{i} \alpha(x)} \\ & =\mathrm{e}^{\mathrm{i} \alpha(x)} \partial_\mu \psi(x)+\psi(x) \mathrm{e}^{\mathrm{i} \alpha(x)} \mathrm{i} \partial_\mu \alpha(x) \\ & =\mathrm{e}^{\mathrm{i} \alpha(x)}\left[\partial_\mu+\mathrm{i} \partial_\mu \alpha(x)\right] \psi(x) \end{aligned} $$
Et de même, on a $\partial^\mu \psi^{\dagger}(x) \rightarrow \mathrm{e}^{-\mathrm{i} \alpha(x)}\left[\partial^\mu-\mathrm{i} \partial^\mu \alpha(x)\right] \psi^{\dagger}(x)$.
Le premier terme du Lagrangien est donc tout chamboulé :
$$ \left(\partial^\mu \psi^{\dagger}\right)\left(\partial_\mu \psi\right)-\mathrm{i}\left(\partial^\mu \alpha\right) \psi^{\dagger}\left(\partial_\mu \psi\right)+\mathrm{i}\left(\partial^\mu \psi^{\dagger}\right)\left(\partial_\mu \alpha\right) \psi+\left(\partial^\mu \alpha\right)\left(\partial_\mu \alpha\right) \psi^{\dagger} \psi $$
Faire dépendre $\alpha$ de la position a logiquement retiré sa symétrie $U(1)$ à la théorie qui n’est donc pas invariante sous une transformation $U(1)$ locale. Mais peut-on restaurer cette symétrie ?
Oui, en ajoutant un nouveau champ $A^\mu(x)$ dont la mission sera d’annuler les variations de la phase d’un point à l’autre. On greffe ce champ à la dérivée pour créer une sorte de “super dérivée” : la dérivée covariante $D_\mu$.
$$ D_\mu=\partial_\mu+\mathrm{i} q A_\mu(x) $$
La dérivée covariante peut réparer la symétrie $U(1)$ si le nouveau champ $A_\mu$ se transforme comme :
$$ A_\mu \rightarrow A_\mu-\frac{1}{q} \partial_\mu \alpha(x) $$
$q$ est le paramètre de couplage, il nous informe sur la force de l’interaction entre $A_\mu$ et les autres champs.
Si $\psi(x) \rightarrow \psi(x) \mathrm{e}^{\mathrm{i} \alpha(x)}$, alors $\partial_\mu \psi \rightarrow\left(\partial_\mu \psi\right) \mathrm{e}^{\mathrm{i} \alpha}+\mathrm{i}\left(\partial_\mu \alpha\right) \psi$ et donc
$$ \begin{aligned} D_\mu \psi=\left(\partial_\mu+\mathrm{i} q A_\mu\right) \psi & \rightarrow\left(\partial_\mu \psi\right) \mathrm{e}^{\mathrm{i} \alpha}+\mathrm{i}\left(\partial_\mu \alpha\right) \psi+\mathrm{i} q A_\mu \psi \mathrm{e}^{\mathrm{i} \alpha}-\mathrm{i}\left(\partial_\mu \alpha\right) \psi \\ & =D_\mu\left(\psi \mathrm{e}^{\mathrm{i} \alpha}\right) \end{aligned} $$
Le Lagrangien entier devient invariant si on remplace les dérivées ordinaires par des dérivées covariantes :
$$ \mathcal{L}=\left(D^\mu \psi\right)^{\dagger}\left(D_\mu \psi\right)-m^2 \psi^{\dagger} \psi $$
Pour imposer une symétrie $U(1)$ locale, la théorie se doit alors d’être invariante par rapport à deux jeux de transformations en parallèle :
$$ \begin{aligned} \psi(x) & \rightarrow \psi(x) \mathrm{e}^{\mathrm{i} \alpha(x)} \\ A_\mu(x) & \rightarrow A_\mu(x)-\frac{1}{q} \partial_\mu \alpha(x) \end{aligned} $$
Une théorie où un champ $A^\mu(x)$ est introduit pour permettre une invariance par rapport à une transformation locale est appelée théorie de jauge. Le champ $A^\mu(x)$ est appelé champ de jauge.
Le champ de jauge, introduit pour satisfaire notre envie soudaine d’invariance locale, peut-il s’avérer suffisamment réel jusqu’à avoir sa propre dynamique ?
Une théorie dont le Lagrangien contient des termes décrivant $A^\mu(x)$ se doit d’être invariante sous des transformations du type $A_\mu(x) \rightarrow A_\mu(x)-\frac{1}{q} \partial_\mu \alpha(x)$. L’électromagnétisme est justement un exemple d’une telle théorie avec son champ vectoriel $A^\mu(x)=(V(x), \boldsymbol{A}(x))$ formant le Lagrangien :
$$ \mathcal{L}=-\frac{1}{4}\left(\partial_\mu A_\nu-\partial_\nu A_\mu\right)\left(\partial^\mu A^\nu-\partial^\nu A^\mu\right)-J_{\mathrm{em}}^\mu A^\mu $$
Les équations du mouvement qu’on en déduit ne sont autres que les deux équations de Maxwell inhomogènes :
$$ \partial^2 A^\nu-\partial^\nu\left(\partial_\mu A^\mu\right)=J_{\mathrm{em}}^\nu $$
Ni le Lagrangien, ni les équations du mouvement ne sont modifiés par la transformation $A_\mu(x) \rightarrow A_\mu(x)-\partial_\mu \chi(x)$ qui se décompose en :
$$ \begin{aligned} V & \rightarrow V-\partial_0 \chi \\ \boldsymbol{A} & \rightarrow \boldsymbol{A}+\boldsymbol{\nabla} \chi \end{aligned} $$
C’est bien ce qu’on nomme en électromagnétisme l’invariance de jauge (si $A_\mu$ décrit correctement le champ électromagnétique dans une certaine situation, alors $A_\mu-\partial_\mu \chi$ aussi). Et on en déduit que l’électromagnétisme est une théorie de jauge puisqu’en choisissant de redéfinir $\chi(x)$ comme $\alpha(x)/q$, on retrouve bien la définition vue plus haut.
Comment choisir $\chi(x)$ ? Un choix classique est la jauge de Lorenz (sans “t”) visant à obtenir :
$$ \partial_\mu A^\mu(x)=0, $$
Pour y arriver, on écrit $A_\mu \rightarrow A_\mu^{\prime}=A_\mu-\partial_\mu \chi$. On veut $\partial^\mu A_\mu^{\prime}=\partial^\mu A_\mu-\partial^\mu \partial_\mu \chi=0$. Il suffit donc de poser $\partial^2 \chi=\partial^\mu A_\mu$.
Grâce à la jauge de Lorenz, on obtient, en l’absence de courant $J_{\mathrm{em}}^\mu$, l’équation d’un champ libre sans masse. En effet l’équation du mouvement $\partial^2 A^\nu-\partial^\nu\left(\partial_\mu A^\mu\right)=J_{\mathrm{em}}^\nu$ devient $\partial^2 A^{\prime \nu}-\partial^\nu\left(\partial_\mu A^{\prime \mu}\right)=\partial^2 A^{\prime \nu}=0$ dont les solutions sont des ondes planes de la forme $A^\mu=\epsilon^\mu(p) \mathrm{e}^{-\mathrm{i} p \cdot x}$ avec $E_{\boldsymbol{p}}=|\boldsymbol{p}|$. La jauge de Lorenz fait donc ressembler l’électromagnétisme à une théorie de champ vectoriel.
On avait déjà rencontré la condition de Lorenz dans le cas du champ massif de spin 1 mais elle n’avait alors rien d’un choix ; on l’obtenait en prenant la divergence de l’équation de Proca… Mais dans tous les cas, la condition réduit le nombre de composantes indépendantes de $A’^\mu$ de quatre à trois.
Cela ne rend toujours pas $A^{\prime \mu}$ unique ici puisqu’on peut continuer à transformer le champ $A_\mu^\prime \rightarrow A_\mu^{\prime \prime}=A_\mu^{\prime}-\partial_\mu \xi$ tant que $\partial^2 \xi = 0$ ($A^{\prime \mu}$ et $A^{\prime \prime \mu}$ respectent tous deux la condition de Lorenz). Pour rendre $A^{\prime \prime \mu}$ unique, on choisit en plus de fixer $\partial_0 \xi=A_0^{\prime}$, ce qui implique $A_0^{\prime \prime}=0$.
Avec ce choix, la condition de Lorenz implique finalement la jauge de Coulomb :
$$ \boldsymbol{\nabla} \cdot \boldsymbol{A}^{\prime \prime}=0 $$
Le nombre de degrés de liberté du champ est encore réduit d’un cran.
La physique impose finalement au champ $A^\mu$ de n’avoir que deux composantes indépendantes !
Les équations du mouvement sous la jauge de Lorenz donnent $\partial^2A^\mu = 0$. Avec la condition $A^0 = 0$, cela implique des ondes planes de la forme $\boldsymbol{A}=\boldsymbol{\epsilon} \mathrm{e}^{-\mathrm{i} p \cdot x}$.
La jauge de Coulomb $\boldsymbol{\nabla} \cdot \boldsymbol{A}=0$ impose alors $\boldsymbol{p} \cdot \boldsymbol{A}=\boldsymbol{p} \cdot \boldsymbol{\epsilon}=0$ qui nous dit que la direction de porpagation de l’onde est perpendiculaire à la polarisation ; l’onde est transverse !
En supposant une propagation selon l’axe $z$ avec une impulsion $q^\mu=(|\boldsymbol{q}|, 0,0,|\boldsymbol{q}|)$, on peut par exemple se donner une polarisation linéaire :
$$ \boldsymbol{\epsilon}_1(q)=\left(\begin{array}{l} 1 \\ 0 \\ 0 \end{array}\right), \quad \boldsymbol{\epsilon}_2(q)=\left(\begin{array}{l} 0 \\ 1 \\ 0 \end{array}\right) $$
ou encore une polarisation circulaire avec :
$$ \epsilon_{\mathrm{R}}^*(q)=-\frac{1}{\sqrt{2}}\left(\begin{array}{l} 1 \\ \mathrm{i} \\ 0 \end{array}\right), \quad \epsilon_{\mathrm{L}}^*(q)=\frac{1}{\sqrt{2}}\left(\begin{array}{c} 1 \\ -\mathrm{i} \\ 0 \end{array}\right) $$
Pour observer les effets du champ électromagnétique, il faut le coupler à un champ de matière. La recette la plus simple pour opérer un tel couplage se nomme couplage minimal. Il s’agit juste de remplacer les dérivées ordinaires par les dérivées covariantes dans le Lagrangien.
Considérons un champ scalaire complexe en présence d’un champ électromagnétique. Si les champs sont indépendants, le Lagrangien total s’écrit comme la somme des Lagrangiens de chacune des théories :
$$ \mathcal{L}=\left(\partial^\mu \psi\right)^{\dagger}\left(\partial_\mu \psi\right)-m^2 \psi^{\dagger} \psi-\frac{1}{4} F_{\mu \nu} F^{\mu \nu} $$
On obtient un couplage entre les champs en passant de $\partial$ à $D$ :
$$ \begin{aligned} \mathcal{L}= & \left(D^\mu \psi\right)^{\dagger}\left(D_\mu \psi\right)-m^2 \psi^{\dagger} \psi-\frac{1}{4} F_{\mu \nu} F^{\mu \nu} \\ = & \left(\partial^\mu \psi^{\dagger}-\mathrm{i} q A^\mu \psi^{\dagger}\right)\left(\partial_\mu \psi+\mathrm{i} q A_\mu \psi\right)-m^2 \psi^{\dagger} \psi-\frac{1}{4} F_{\mu \nu} F^{\mu \nu} \\ = & \partial^\mu \psi^{\dagger} \partial_\mu \psi-m^2 \psi^{\dagger} \psi-\frac{1}{4} F_{\mu \nu} F^{\mu \nu} + {\color{#D41876}\left(-\mathrm{i} q A^\mu \psi^{\dagger}\left(\partial_\mu \psi\right)+\mathrm{i} q\left(\partial^\mu \psi^{\dagger}\right) A_\mu \psi+q^2 \psi^{\dagger} \psi A^\mu A_\mu\right) } \end{aligned} $$
Le couplage entre le champ $A^\mu$ et les champs $\psi$ et $\psi^\dagger$ est contenu dans le dernier terme et l’importance du couplage est fixée par $q$, la charge électromagnétique.
On appelle principe de jauge la notion selon laquelle un champ de jauge introduit pour assurer une symétrie locale va dicter la forme du couplage, c’est-à-dire des interactions, dans la théorie.
Le terme de masse du champ massif de spin 1 vu précédemment lui ôtait toute possibilité d’invariance de jauge alors que la nature non massive du champ de jauge lui confère cette invariance et lui retire une composante.
On obtient in fine :
$$ \hat{A}^\mu(x)=\int \frac{\mathrm{d}^3 p}{(2 \pi)^{\frac{3}{2}}} \frac{1}{\left(2 E_{\boldsymbol{p}}\right)^{\frac{1}{2}}} \sum_{\lambda=1}^2\left(\epsilon_\lambda^\mu(p) \hat{a}_{\boldsymbol{p} \lambda} \mathrm{e}^{-\mathrm{i} p \cdot x}+\epsilon_\lambda^{\mu *}(p) \hat{a}_{\boldsymbol{p} \lambda}^{\dagger} \mathrm{e}^{\mathrm{i} p \cdot x}\right) $$
avec $E_p=|\boldsymbol{p}|$.
Et l’Hamiltonien est donné par :
$$ \hat{H}=\int \mathrm{d}^3 p \sum_{\lambda=1}^2 E_{\boldsymbol{p}} \hat{a}_{\boldsymbol{p} \lambda}^{\dagger} \hat{a}_{\boldsymbol{p} \lambda} $$
Les excitations du champ électromagnétique sont des photons qu’on peut observer dans deux états de polarisation transverse.
Ces particules ont un spin $S=1$ et on en trouve deux types : $\hat{a}_{\boldsymbol{p} 1}^{\dagger}|0\rangle$ et $\hat{a}_{\boldsymbol{p} 2}^{\dagger}|0\rangle$.
Considérons un photon se propageant selon la direction $z$ avec l’impulsion $q^\mu=(|\boldsymbol{q}|, 0,0,|\boldsymbol{q}|)$. Dans une base de polarisation circulaire, on peut écrire $\epsilon_{\lambda=\mathrm{R}}^*(q)=-\frac{1}{\sqrt{2}}(0,1, \mathrm{i}, 0)$ (correspondant à $S_z = 1$) et $\epsilon_{\lambda=\mathrm{L}}^*(q)=\frac{1}{\sqrt{2}}(0,1,-\mathrm{i}, 0)$ (correspondant à $S_z = -1$). Il n’y a pas de photon avec $S^z = 0$ puisque cela correspondrait à une polarisation longitudinale interdite $\epsilon_{\lambda=3}^*(p)=(0,0,0,1)$.
On a rencontré jusque-là des symétries portées par des transformations continues (translations, rotations) représentées par des groupes continus (groupes de Lie). Mais on peut aussi rencontrer des symétries correspondant à des transformations discrètes représentées cette fois-ci par des groupes finis.