Formes hermitiennes
Définition : Définition 5.1
Soit \(F\) un \(\mathbb{C}\)-espace vectoriel. On dit qu'une application \(f:E\rightarrow F\) est semi linéaire (ou anti linéaire}) si et seulement si : pour tout \(x,y\in E\),\(\lambda \in \mathbb{C}\)
i) \(f\left( x+y\right) =f(x)+f(y)\)
ii) \(f\left( \lambda x\right) =\overset{-}{\lambda }f(x)\)
Complément : Remarque 5.1
Une forme semi linéaire est une application semi linéaire d'un \(\mathbb{C}\)-espace vectoriel dans \(\mathbb{C}\). C-à-d. si \(f:E\rightarrow \mathbb{C}\) est semi linéaire, alors \(f\) est dite forme semi linéaire.
Exemple : Exemple 5.1
Soit \(\begin{equation*} \begin{array}{c} f:\mathbb{C}\rightarrow \mathbb{C}\\ z\mapsto \overset{-}{z} \end{array} \end{equation*}\),
on a \(\mathbb{C}\) est un \(\mathbb{C}\)-espace vectoriel et pour tout\( x,y,\lambda \in \mathbb{C}\)
\(\begin{equation*} \begin{array}{c} \bullet ~f(x+y)=\overline{\left( x+y\right) }=\overset{-}{x}+\overset{-}{y}=f(x)+f(y) \\ \bullet ~f\left( \lambda x\right) =\overline{\left( \lambda x\right) }= \overset{-}{\lambda .}\overset{-}{x}=\overset{-}{\lambda }f(x) \end{array}\end{equation*}\),
d'où $f$ est semi linéaire.
Soit \(\begin{equation*} \begin{array}{l} f:\mathbb{C}\left[ X\right] \rightarrow \mathbb{C} \\ \quad P\mapsto \overline{P\left( z_{0}\right) },z_{0}\in \mathbb{C} \end{array} \end{equation*}\)
On a pour tout \(P,Q\in \mathbb{C}\left[ X\right] ,\lambda \in \mathbb{C}\)
\(\begin{equation*} \begin{array}{l} \bullet ~f(P+Q)=\overline{\left( P+Q\right) \left( z_{0}\right) }=\overline{ P\left( z_{0}\right) +Q(z_{0})}=\overline{P\left( z_{0}\right) }+\overline{ Q\left( z_{0}\right) } \\ \qquad \qquad =f(P)+f(Q) \\ \bullet ~f(\lambda P)=\overline{\left( \lambda P\right) \left( z_{0}\right) } =\overline{\lambda }.\overline{P\left( z_{0}\right) }=\overline{\lambda }f(P) \end{array} \end{equation*}\),
d'où \(f\) est semi linéaire.
Montrer que l'application \(f:\mathbb{C}^{3}\rightarrow \mathbb{C},f(x,y,z)=\overset{-}{x}+2\overset{-}{y}-\overset{-}{z} \)est anti linéaire.
Même question pour \(f:M_{n}(\mathbb{C})\rightarrow \mathbb{C},A\mapsto tr\left( \overset{-}{A}\right)\).
Définition : Définition 5.2
On dit qu'une application \(h:E\times E\rightarrow \mathbb{C}\) est une forme sesquilinéaire sur \(E\) si et seulement si :
i ) \(h\) est linéaire par rapport à la première variable
ii ) \(h\) est semi linéaire par rapport à la deuxième variable
C-à-d. : \(\forall x,x^{\prime },y,y^{\prime }\in E,\forall \lambda\in \mathbb{C}\)
\(\begin{eqnarray*} \left\{ \begin{array}{c} h\left( \lambda x+x^{\prime },y\right) =\lambda h(x,y)+h(x^{\prime },y) \\ h\left( x,\lambda y+y^{\prime }\right) =\overset{-}{\lambda }h(x,y)+h\left( x,y^{\prime }\right) \end{array} \right. \end{eqnarray*}\).
Complément : Remarque 5.2
Pour la définition d'une forme sesquilinéaire, on rencontre parfois dans la littérature :
i ) \(h\) est linéaire par rapport à la deuxième variable.
ii ) \(h\) est semi linéaire par rapport à la première variable.
Définition : Définition 5.3 (Formes hermitiennes)
On dit qu’une forme sesquilinéaire \(h\) sur \(E\) est une forme hermitienne sur \(E\) ssi \(h\) a la propriété de " symétrie hermitienne"
c-`a-d. pour tout \(x, y \in E\), \(h(y,x)=\overline{h(x,y)}\).
On déduit de la symétrie hermitienne de \(h\) que pour tout \(x\in E,h(x,x)=\overline{h(x,x)}\), d'où \(h(x,x)\in \mathbb{R}\).
Complément : Remarque 5.3
1. On note par \(H(E)\) l'ensemble des formes hermitienne sur \(E\), si \(h,h^{\prime }\in H(E)\) et \(\alpha ,\beta \in \mathbb{R}\), on voit facilement que l'application
\(\alpha h+\beta h^{\prime }:E\times E\rightarrow \mathbb{C}\)
définie par
\(\left( \alpha h+\beta h^{\prime }\right) \left( x,y\right) =\alpha h(x,y)+\beta h^{\prime }(x,y)\)
est encore une forme hermitienne.
Par conséquent, \(H(E)\) est un \(\mathbb{R}\)-espace vectoriel (mais pas un \(\mathbb{C}\)-espace vectoriel, car si \(\lambda \in \mathbb{C}-\mathbb{R}\), alors \(\lambda h\) ne vérifie pas la propriété de " symétrie hermitienne", \(\overline{\lambda h(x,y)}\neq \lambda h(x,y)\)).
2. Remarquons que, pour vérifier qu'une application \(h:E\times E\rightarrow \mathbb{C}\) est une forme hermitienne, il suffit de voir que \(h\) vérifie la propriété de " symétrie hermitienne" et est linéaire en la première variable, ces deux conditions impliquent en effet et la semi-linéarité en la \(2^{\grave{e}me}\) variable, car :
\(\begin{equation*} h\left( x,\lambda y+y^{\prime }\right) =\overline{h\left( \lambda y+y^{\prime },x\right) }=\overline{\lambda h(y,x)+h(y^{\prime },x)}=\overset{-}{\lambda }\overline{h(y,x)}+\overline{h(y^{\prime },x)}=\overset{-}{ \lambda }h(x,y)+h(x,y^{\prime }). \end{equation*}\)
Complément : Remarque 5.4
La notion de forme hermitienne sur un \(\mathbb{C}\)-espace vectoriel est une variante de la notion de forme bilinéaire sur un \(\mathbb{R}\)-espace vectoriel.
Exemple : Exemple 5.2
1) Soit \(\begin{equation*} \begin{array}{c} h:\mathbb{C}^{2}\rightarrow \mathbb{C} \\ \left( z_{1},z_{2}\right) \mapsto z_{1}\overset{-}{z}_{2} \end{array} \end{equation*}\)
Pour tout \(z_{1},z_{2},z_{1}^{\prime },z_{2}^{\prime },\lambda \in \mathbb{C}\), on a
\(h(\lambda z_{1}+z_{1}^{\prime },z_{2})=\left( \lambda z_{1}+z_{1}^{\prime }\right) \overset{-}{z}_{2}=\lambda z_{1}\overset{-}{z} _{2}+z_{1}^{\prime }\overset{-}{z}_{2}=\lambda h\left( z_{1},z_{2}\right) +h\left( z_{1}^{\prime },z_{2}\right)\)
\(h(z_{1},\lambda z_{2}+z_{2}^{\prime })=z_{1}\overline{\left( \lambda z_{2}+z_{2}^{\prime }\right) }=z_{1}\left( \overset{-}{\lambda } \overset{-}{z_{2}}+\overset{-}{z_{2}^{\prime }}\right) =\overset{-}{\lambda } z_{1}\overset{-}{z_{2}}+z_{1}\overset{-}{z_{2}^{\prime }}=\overset{-}{ \lambda }h\left( z_{1},z_{2}\right) +h\left( z_{1},z_{2}^{\prime }\right)\)
donc \(h\) est une forme sesquilinéaire.
De plus, \(h(z_{2},z_{1})=z_{2}\overset{-}{z_{1}}=\overline{\overset{-}{z_{2}} z_{1}}=\overline{z_{1}\overset{-}{z_{2}}}=\overline{h(z_{1},z_{2})}\), d'où \(h\) est une forme hermitienne.
2) Soit \(\begin{equation*} \begin{array}{c} h:\mathbb{C}^{2}\rightarrow \mathbb{C}\\ \left( z_{1},z_{2}\right) \mapsto iz_{1}\overset{-}{z}_{2} \end{array} \end{equation*}\).
On vérifie de la même façon que \(h\) est une forme sesquilinéaire. Mais pour tout \(z_{1},z_{2}\in \mathbb{C}\), on a
\(\begin{eqnarray*} h(z_{2},z_{1}) &=&iz_{2}\overset{-}{z_{1}}=\overline{-i\overset{-}{z_{2}} z_{1}}=\overline{-iz_{1}\overset{-}{z_{2}}}=-\overline{iz_{1}\overset{-}{z_{2}}} \\ &=&-\overline{h(z_{1},z_{2})}. \\ &\neq &\overline{h(z_{1},z_{2})}. \end{eqnarray*}\).
Donc \(h\) n'est pas une forme hermitienne.
Exemple : Exercice 5.1
1) Les applications suivantes sont-elles des formes sesquilinéaires hermitiennes?
a) \(h_{1}:\mathbb{C}^{3}\times \mathbb{C}^{3}\rightarrow \mathbb{C}\) donnée par :
\(\begin{eqnarray*} h_{1}(x,y) &=&x_{1}\overset{-}{y_{1}}+3x_{2}\overset{-}{y}_{2}+2ix_{3} \overset{-}{y_{3}}+\left( 2+3i\right) x_{1}\overset{-}{y_{2}}+ \\ &&\left( 2-3i\right) x_{2}\overset{-}{y_{1}}+\left( 1-5i\right) x_{2}\overset {-}{y_{3}}+\left( 1+5i\right) x_{3}\overset{-}{y_{2}}. \end{eqnarray*}\).
b) \(h_{2}:M_{n}\left(\mathbb{C}\right) \times M_{n}\left( \mathbb{C}\right)\rightarrow \mathbb{C}\) donnée par
\(h_{2}\left( A,B\right) =tr\left( ^{t}A.\overline{B}\right)\).
2) Soit \(E\) l'espace des fonctions continues de \(\left[ 0,1\right]\) dans \(\mathbb{C}\). Pour \(f\in E\) et \(f=a+ib\) avec \(a,b\) deux fonctions à valeurs réelles, on pose
\(\int\limits_{0}^{1}f(x)dx=\int\limits_{0}^{1}a(x)dx+i\int \limits_{0}^{1}b(x)dx\).
Montrer que \(\begin{eqnarray*} h_{3} &:&E\times E\rightarrow \mathbb{C} \\ h_{3}(f,g) &=&\int\limits_{0}^{1}f(x).\overline{g(x)}dx \end{eqnarray*}\)
est une forme sesquilinéaire hermitienne.
Définition : Définition 5.3 (Formes quadratiques hermitiennes)
Soit \(h\) une forme hermitienne sur un \(\mathbb{C}\)-espace vectoriel \(E\).
On dit que l'application \(Q:E\rightarrow \mathbb{R},\: Q\left( x\right) =h(x,x)\) est une forme quadratique hermitienne sur \(E\).
D’après le lemme qui suit, \(h\) est entièrement déterminée par \(Q\), et l’on dit que \(h\) est la forme polaire de \(Q\). Notons
aussi que pour tout \(\lambda \in \mathbb{C}\), on a
\(Q(\lambda x)=h\left( \lambda x,\lambda x\right) =\lambda h\left( x,\lambda x\right) =\lambda \overset{-}{\lambda }h\left( x,x\right) =\lambda \overset{- }{\lambda }Q(x)=\left\vert \lambda \right\vert ^{2}Q(x)\),
où \(\left\vert \lambda \right\vert\) est le module (ou la norme) de \(\lambda \in \mathbb{C}\).
Fondamental : Lemme 5.1 (Polarisation)
Soient \(E\) un \(\mathbb{C}\)-espace vectoriel, \(h\in H(E)\) et \(Q\) l'application \(E\rightarrow \mathbb{R},x\mapsto h(x,x)\). Alors, pour tout \(x,y\in E\), on a
(1) \(\Re \left( h(x,y)\right) =\frac{1}{2}\left( Q(x+y)-Q(x)-Q(y)\right) =\frac{1}{4}\left( Q(x+y)-Q(x-y)\right)\)
(2) \(\Im \left( h(x,y)\right) =\frac{1}{2}\left( Q(x+iy)-Q(x)-Q(y)\right) =\frac{1}{4}\left( Q(x+iy)-Q(x-iy)\right)\)
(3) \(4h(x,y)=Q(x+y)-Q(x-y)+iQ(x+iy)-iQ(x-iy).\)
Preuve :
On a
\(Q(x+y) =h\left( x+y,x+y\right) =Q(x)+Q(y)+h(x,y)+h(y,x)\)
\(Q(x-y) =h\left( x-y, x-y\right) =Q(x)+Q(y)-h(x,y)-h(y,x)\)
et comme \(h(x,y)+h(y,x)=h(x,y)+\overline{h(x,y)}=2\Re \left( h(x,y)\right)\),
on obtient (1).
Comme \(\Im (z)=\Re (-iz)\) pour tout \(z\in \mathbb{C}\), on obtient
\(\Im (h(x,y))=\Re (-ih(x,y))=\Re \left( h(x,iy)\right)\) et donc (2) s'obtient en remplaçant \(y\) par \(iy\) dans (1)
et en utilisant le fait que \(Q(iy)=\left\vert i\right\vert ^{2}Q(y)=Q(y)\). Enfin, (3) découle de (1) et (2).
Définition : Définition 5.4 (Matrices hermitiennes)
Une matrice \(A\in M_{n}(\mathbb{C})\) est hermitienne si \(^{t}A=\overline{A}\).
On note \(MH_{n}(\mathbb{C})\) l'ensemble de ces matrices, si \(A,B\in MH_{n}(\mathbb{C})\) et \(s,t\in \mathbb{R}\), alors \(sA+tB\in MH_{n}(\mathbb{C})\), donc \(MH_{n}(\mathbb{C})\) est un \(\mathbb{R}\)-espace vectoriel (mais pas un \(\mathbb{C}\)-espace vectoriel).
Observons que si \(A\in MH_{n}(\mathbb{C})\), ses coefficients diagonaux \(a_{ii}\) vérifient \(a_{ii}=\overline{a_{ii}}\) donc \(a_{ii}\in \mathbb{R}\).
Définition : Définition 5.5 (Matrice d’une forme hermitienne)
Soit \(h\) une forme hermitienne sur un \(\mathbb{C}\)-espace vectoriel \(E\) de dimension \(n\) et soit \(B=(e_{1},...,e_{n})\) une base de \(E\).
La matrice \(Mat_{B}(h)\) de \(h\) dans la base \(B\) est la matrice \(A=(a_{ij})_{1\leq i,j\leq n}\in M_{n}( \mathbb{C})\), où \(a_{ij}=h(e_{i},e_{j})\). Comme \(h\left( e_{j},e_{i}\right) =\overline{h\left( e_{i},e_{j}\right) }\) on a \(a_{ji}=\overline{a_{ij}}\), donc \(^{t}A=\overline{A}\), i.e. \(A\in MH_{n}(\mathbb{C})\).
\(h\) est entièrement déterminée par sa matrice \(A\). En effet, d'après la linéarité (resp. semi-linéarité) en la première (resp. deuxième) variable, on a l'égalité :
\(\forall x,y\in E,h(x,y)=h\left( \sum_{i=1}^{n}x_{i}e_{i},\sum_{j=1}^{n}y_{j}e_{j}\right)\)
\(\qquad \qquad \qquad \qquad =\sum_{i,j=1}^{n}x_{i}\overline{ y_{j}}h\left( e_{i},e_{j}\right) =\sum_{i,j=1}^{n}a_{ij}x_{i}\overline{y_{j}} \: (*)\)
Donc, si l'on note \(X,Y\) les vecteurs colonnes des coordonnées des vecteurs \(x,y\) respectivement c-à-d.
\[\begin{eqnarray*} X=\left( \begin{array}{c} x_{1} \\ \vdots \\ x_{n}% \end{array}% \right) \end{eqnarray*}\], \[\begin{eqnarray*} Y=\left( \begin{array}{c} y_{1} \\ \vdots \\ y_{n} \end{array} \right) \end{eqnarray*}\] \(\in \mathbb{C}^n\),
on a la formule matricielle \(h(x,y)=^{t}XA\overline{Y}\).
Réciproquement, pour tout \(A=(a_{ij})_{1\leq i,j\leq n}\in $ $M_{n}(\mathbb{C})\), l'application \(h_{A}:E\times E\rightarrow \mathbb{C}\) définie par
\(h_{A}\left( \sum_{i=1}^{n}x_{i}e_{i},\sum_{j=1}^{n}y_{j}e_{j}\right) =\sum_{i,j=1}^{n}a_{ij}x_{i}\overline{y_{j}}\)
est une forme hermitienne sur \(E\), et \(Mat_{B}(h_{A})=A\).
Donc, se donner une forme hermitienne sur \(E\) est la même chose que se donner une matrice hermitienne : de façon précise, l’application
\(\Psi _{B}:H(E)\rightarrow MH_{n}(\mathbb{C}),\:h \mapsto Mat_{B}(h)\)
est un isomorphisme de \(\mathbb{R}\)-espaces vectoriels.
Fondamental : Théorème 5.1 (Changement de base)
Soient \(h\) une forme hermitienne sur un \(\mathbb{C}\)-espace vectoriel \(E\) de dimension \(n\), \(B=(e_{1},...,e_{n})\) une base de \(E\) telle que \(A=Mat_{B}(h)\). Si \(B^{\prime }\) est une autre base de \(E\) et \(P\) la matrice de passage \(Mat_{B}(B^{\prime })\). Alors
\(A^{\prime }=Mat_{B^{\prime }}\left( h\right) =^{t}PA\overline{P}.\)
Preuve :
Soient \(x,y\in E\), ils correspondent dans la base \(B\) (resp. \(B^{\prime}\)) à des vecteurs colonnes \(X,Y\) (resp. \(X^{\prime },Y^{\prime }\)). D'après la formule de changement de coordonnées, on a \(X=PX^{\prime}\) et \(Y=PY^{\prime}\), d'où \(^{t}X=^{t}X^{\prime }.^{t}P\) et \(\overline{Y}=\overline{P}\overline{Y^{\prime }}\), et donc
\(h(x,y)=^{t}XA\overline{Y}=^{t}X^{\prime }\left( ^{t}PA\overline{P}\right) \overline{Y^{\prime }}\) ce qui entraine \(A^{\prime }=^{t}PA\overline{P}\).
Définition : Définition 5.6 (Expression d’une forme quadratique hermitienne)
En séparant, d'une part, les termes \(x_{i}\overline{y_{i}}\) et, d'autre part, les termes \(x_{i}\overline{y_{j}}\) avec \(i\neq j\), la formule \((*)\) se récrit de la façon suivante (puisque \(a_{ji}=\overline{a_{ij}}\) pour tout \(i\neq j\))
\(h\left( x,y\right) =\sum_{i=1}^{n}a_{ii}x_{i}\overline{yi}+\sum_{1\leq i<j\leq n}\left( a_{ij}x_{i}\overline{y_{j}}+\overline{a_{ij}}x_{j}\overline{ y_{i}}\right)\).
En particulier, prenant \(y=x\) (i.e. \(y_{i}=x_{i}\) pour tout \(i\)), on voit que la forme quadratique hermitienne \(Q\) associée à \(h\) est donnée par la formule suivante (noter que \(x_{i}\overline{x_{i}}=\left\vert x_{i}\right\vert ^{2}\)
\(Q(x)=\sum_{i=1}^{n}a_{ii}\left\vert x_{i}\right\vert ^{2}+\sum_{1\leq i<j\leq n}\left( a_{ij}x_{i}\overline{x_{j}}+\overline{a_{ij}}\overline{x_{i} }x_{j}\right) =\sum_{i=1}^{n}a_{ii}\left\vert x_{i}\right\vert ^{2}+\sum_{1\leq i<j\leq n}\Re \left( a_{ij}x_{i}\overline{x_{j}}\right)\).
On voit donc apparaître les carrés des modules des \(x_{i}\), et les parties réelles des doubles produits \(x_{i}\overline{x_{j}}\). Pour abréger, on parlera de «carrés de modules» et de «doubles produits».
Définition : Définition 5.7 (Rang d’une forme hermitienne)
Soit \(h\) une forme hermitienne sur un \(\mathbb{C}\)-espace vectoriel \(E\) de dimension \(n\) et soit \(B=(e_{1},...,e_{n})\) une base de \(E\).
(1) On définit le rang de \(h\) par \(rang(h)=rang(A)\), où \(A=Mat_{B}(h)\), ceci ne dépend pas du choix de la base \(B\).
(2) On dit que \(h\) est non-dégénérée si \(rang(h)=dimE\), i.e. si sa matrice dans une (et donc dans toute) base de \(E\) est inversible.
Définition : Définition 5.8 (Orthogonalité)
Soit \(h\) une forme hermitienne sur un \(\mathbb{C}\)-espace vectoriel \(E\).
(1) On dit que deux vecteurs \(x, y \in E\) sont orthogonaux (pour \(h\)) si \(h(x, y) = 0\), ceci équivaut à dire que \(h(y,x)=0\) (puisque \(h(y,x)=\overline{h(x,y)}\) et vice-versa). Plus généralement, on dit que deux sous-ensembles \(X,Y\) de \(E\) sont orthogonaux si l'on a \(h(x,y)=0\) pour tout \(x\in X,y\in Y\). On notera \(X\perp Y\) pour signifier que \(X\) et \(Y\) sont orthogonaux.
(2) Pour tout sous-ensemble \(Y\) de \(E\), on définit son orthogonal (relativement a \(h\)), noté \(Y^{\perp}\) par :
\(Y^{\perp }=\left\{ x\in E\mid h(x,y)=0,\forall y\in Y\right\}\),
c'est un sous-espace vectoriel de \(E\) (même si \(Y\) n'en est pas un), de plus, on a les propriétés suivantes :
\(Y\subseteq Z\Rightarrow Z^{\perp }\subseteq Y^{\perp },\quad Y^{\perp }=Vect\left( Y\right) ^{\perp }\)
en particulier, si \(Y=F\) est un sous-espace vectoriel de \(E\) et si \((f_{1},...,f_{p})\) est une famille génératrice de \(F\), alors
\(F^{\perp }=\left\{ f_{1},...,f_{p}\right\} ^{\perp }=\left\{ x\in E\mid h(x,f_{i})=0,\quad \forall i=1,...,p\right\}\).
(3) On pose \(\ker \left( h\right) =\left\{ x\in E\mid h(x,y)=0,\forall y\in E\right\}\)
et on l’appelle le noyau de \(h\). On dit que h est non-dégénérée si \(\ker \left( h\right) =\left\{ 0\right\}.\)
Fondamental : Théorème 5.2 (Orthogonal d’un sous-espace)
Soit \(h\) une forme hermitienne sur un \(\mathbb{C}\)-espace vectoriel \(E\) de dimension \(n\) et soit \(F\) un sous-espace vectoriel de \(E\), de dimension \(r\).
(1) On a \(F\subseteq \left( F^{\perp }\right) ^{\perp }\) et \(\dim F^{\perp }\geq \dim E-\dim F\)
(2) \(\ker \left( h\right) =\left\{ 0\right\} \Leftrightarrow h\) est non-dégénérée
(3) Si \(h\) est non-dégénérée, on a \(\dim F^{\perp }=\dim E-\dim F\) et \(F=\left( F^{\perp }\right) ^{\perp }\)
(4) Si \(F\cap F^{\perp }=\left\{ 0\right\}\), alors \(E=F\oplus F^{\perp }.\)