Cours Formes Quadratiques : Réduction, Matrice et Signature

Les formes quadratiques constituent l’un des objets centraux de l’algèbre linéaire avancée, au programme de la licence et des classes préparatoires scientifiques. Derrière ce nom un peu technique se cache une idée très naturelle : généraliser la notion de « carré d’une norme » à des expressions polynomiales homogènes de degré 2 en plusieurs variables. Comprendre les formes quadratiques, c’est comprendre la géométrie des ellipsoïdes, des hyperboloïdes, des points selle des fonctions de plusieurs variables, et bien plus encore. Ce cours vous guide pas à pas, de la définition jusqu’aux théorèmes de réduction et de classification.

Table des Matières

Qu’est-ce qu’une forme quadratique ? Définition et premiers exemples

Avant de donner la définition formelle, partons d’un exemple concret. Dans \(\mathbb{R}^2\), considérons l’expression :

\[
q(x, y) = 2x^2 + 3xy – y^2
\]

Chaque terme est de degré exactement 2 (soit un carré \(x^2\), soit un produit \(xy\)). C’est l’essence même d’une forme quadratique.

Définition : Forme quadratique

Soit \(E\) un \(\mathbb{R}\)-espace vectoriel. Une application \(q : E \to \mathbb{R}\) est appelée forme quadratique s’il existe une forme bilinéaire symétrique \(\varphi : E \times E \to \mathbb{R}\) telle que :

\[
\forall x \in E, \quad q(x) = \varphi(x, x)
\]

La forme bilinéaire symétrique \(\varphi\) est appelée la forme polaire (ou forme bilinéaire associée) de \(q\).

Un point crucial : l’association entre \(q\) et sa forme polaire \(\varphi\) est bijective – à toute forme quadratique correspond une unique forme bilinéaire symétrique. On retrouve \(\varphi\) à partir de \(q\) grâce aux identités de polarisation :

\[
\varphi(x, y) = \frac{1}{2}\bigl[q(x + y) – q(x) – q(y)\bigr]
\]

Cette formule est remarquable : elle dit que connaître \(q\) suffit à tout reconstituer. Vous n’avez jamais besoin d’une seconde donnée.

Propriété fondamentale d’homogénéité

Une forme quadratique vérifie toujours, pour tout scalaire \(\lambda \in \mathbb{R}\) :

\[
q(\lambda x) = \lambda^2 \, q(x)
\]

Cette homogénéité de degré 2 est caractéristique : doubler un vecteur quadruple la valeur de la forme. C’est très différent d’une forme linéaire (qui elle double simplement).

Représentation matricielle des formes quadratiques

Dès lors que l’espace \(E\) est de dimension finie \(n\) et qu’on se donne une base \(\mathcal{B} = (e_1, \ldots, e_n)\), les formes quadratiques admettent une écriture matricielle très commode.

Construction de la matrice associée

Soit \(q\) une forme quadratique de forme polaire \(\varphi\). On définit la matrice \(A = (a_{ij})_{1 \le i,j \le n}\) par :

\[
a_{ij} = \varphi(e_i, e_j)
\]

Puisque \(\varphi\) est symétrique, on a \(a_{ij} = a_{ji}\) : la matrice \(A\) est donc symétrique. Pour tout vecteur \(x = x_1 e_1 + \cdots + x_n e_n\), en notant \(X = \begin{pmatrix} x_1 \\ \vdots \\ x_n \end{pmatrix}\), on obtient :

\[
q(x) = {}^t\!X \, A \, X = \sum_{i=1}^{n} a_{ii} x_i^2 + 2\sum_{1 \le i < j \le n} a_{ij} x_i x_j \]

Propriété : Unicité de la matrice symétrique

Pour une base \(\mathcal{B}\) fixée, il existe une unique matrice symétrique \(A \in \mathcal{S}_n(\mathbb{R})\) telle que \(q(x) = {}^t\!X A X\) pour tout \(x \in E\). En revanche, si l’on autorise des matrices non symétriques, cette unicité disparaît – d’où l’importance de toujours travailler avec la matrice symétrique.

Exemple concret en dimension 3

Soit la forme quadratique sur \(\mathbb{R}^3\) définie par :

\[
q(x_1, x_2, x_3) = x_1^2 + 4x_1 x_2 + 2x_2^2 + x_3^2
\]

Pour lire la matrice, rappelons que le coefficient diagonal \(a_{ii}\) est le coefficient devant \(x_i^2\), et le coefficient hors-diagonal \(a_{ij} = a_{ji}\) est la moitié du coefficient devant le terme croisé \(x_i x_j\). Ici, le terme \(4 x_1 x_2\) donne \(a_{12} = a_{21} = 2\). On obtient :

\[
A = \begin{pmatrix} 1 & 2 & 0 \\ 2 & 2 & 0 \\ 0 & 0 & 1 \end{pmatrix}
\]

Erreur classique à éviter ! Beaucoup d’étudiants placent directement le coefficient du terme croisé \(2a_{ij}\) dans la matrice, sans le diviser par 2. La matrice d’une forme quadratique est symétrique : le coefficient devant \(x_i x_j\) dans \(q\) se répartit également entre \(a_{ij}\) et \(a_{ji}\). Si \(q\) contient \(6 x_1 x_2\), alors \(a_{12} = a_{21} = 3\), pas 6.

Changement de base et congruence

Si l’on passe de la base \(\mathcal{B}\) à la base \(\mathcal{B}’\) via la matrice de passage inversible \(P\), la matrice de \(q\) dans \(\mathcal{B}’\) devient :

\[
A’ = {}^t\!P \, A \, P
\]

Deux matrices ainsi reliées sont dites congruentes. La congruence est la relation d’équivalence naturelle pour les formes quadratiques – bien distincte de la similitude (qui concerne les endomorphismes).

Positivité, définition positive et signe d’une forme quadratique

L’une des questions les plus importantes en pratique (optimisation, physique, analyse) est de savoir si une forme quadratique est toujours positive, toujours négative, ou bien des deux selon les directions. On classe les formes quadratiques selon leur signe.

Définitions : Signe d’une forme quadratique

Soit \(q\) une forme quadratique sur \(E\). On dit que \(q\) est :

Positive (ou semi-définie positive) si \(\forall x \in E,\; q(x) \ge 0\).
Définie positive si \(\forall x \in E \setminus \{0\},\; q(x) > 0\).
Négative (ou semi-définie négative) si \(\forall x \in E,\; q(x) \le 0\).
Définie négative si \(\forall x \in E \setminus \{0\},\; q(x) < 0\).
Indéfinie si elle prend des valeurs strictement positives et strictement négatives.

Intuitivement, une forme définie positive agit comme le carré d’une norme : elle « mesure » la taille d’un vecteur, toujours positivement. C’est précisément le lien avec les produits scalaires : si \(\langle \cdot, \cdot \rangle\) est un produit scalaire, alors \(q(x) = \|x\|^2 = \langle x, x \rangle\) est une forme quadratique définie positive.

Inégalité de Cauchy-Schwarz pour les formes positives

Lorsque \(q\) est positive de forme polaire \(\varphi\), on dispose de l’inégalité :

\[
\forall (x, y) \in E^2, \quad \varphi(x, y)^2 \le q(x) \cdot q(y)
\]

S’il y a égalité et que \(q\) est définie positive, alors \(x\) et \(y\) sont liés (proportionnels). Cette inégalité généralise l’inégalité de Cauchy-Schwarz classique du produit scalaire.

Réduction de Gauss des formes quadratiques

La réduction de Gauss est l’algorithme fondamental qui permet d’écrire toute forme quadratique comme une combinaison linéaire de carrés de formes linéaires indépendantes. C’est à la fois un outil de calcul pratique et la clé de voûte théorique menant à la classification complète.

Théorème : Réduction de Gauss

Soit \(E\) un \(\mathbb{R}\)-espace vectoriel de dimension finie \(n\), et \(q\) une forme quadratique sur \(E\) de rang \(r\). Il existe \(r\) formes linéaires \(\ell_1, \ldots, \ell_r \in E^*\) linéairement indépendantes et \(r\) réels non nuls \(\alpha_1, \ldots, \alpha_r\) tels que :

\[
\forall x \in E, \quad q(x) = \alpha_1 \ell_1(x)^2 + \alpha_2 \ell_2(x)^2 + \cdots + \alpha_r \ell_r(x)^2
\]

L’algorithme pas à pas (méthode de Gauss)

La méthode procède par récurrence sur le nombre de variables, en distinguant deux cas à chaque étape.

Cas 1 : Il existe un terme carré non nul

Supposons que \(a_{11} \ne 0\). On regroupe tous les termes faisant apparaître \(x_1\) et on complète le carré :

\[
q(x) = a_{11} \left( x_1 + \frac{1}{2a_{11}} \sum_{j \ge 2} 2a_{1j} x_j \right)^2 + q'(x_2, \ldots, x_n)
\]

Le premier carré est définitivement fixé. On applique ensuite le même procédé à \(q’\), qui ne dépend plus que de \(x_2, \ldots, x_n\). On itère jusqu’à épuisement des variables.

Cas 2 : Tous les termes carrés sont nuls

Si \(a_{ii} = 0\) pour tout \(i\) mais qu’il existe un terme croisé \(a_{12} \ne 0\), on effectue le changement de variables auxiliaire :

\[
x_1 = u + v, \quad x_2 = u – v
\]

Cela fait apparaître un terme \(a_{12}(u^2 – v^2)\), ramenant au cas 1. Cette astuce est essentielle et souvent oubliée dans les cours moins complets.

Signature d’une forme quadratique et loi d’inertie de Sylvester

Une fois la réduction de Gauss effectuée, les coefficients \(\alpha_i\) obtenus peuvent être positifs ou négatifs. Une question naturelle se pose : si l’on effectue la réduction différemment (en commençant par une autre variable, ou en faisant d’autres choix), obtient-on le même nombre de coefficients positifs et négatifs ? La réponse est oui, et c’est précisément ce qu’affirme la loi d’inertie de Sylvester – l’un des théorèmes de classification les plus élégants de l’algèbre linéaire.

Loi d’inertie de Sylvester

Soit \(q\) une forme quadratique réelle de rang \(r\) sur un espace de dimension \(n\). Quelle que soit la façon dont on effectue la réduction de Gauss, le nombre \(p\) de coefficients strictement positifs et le nombre \(s\) de coefficients strictement négatifs sont les mêmes. Le couple \((p, s)\) est appelé la signature de \(q\), et l’on a \(p + s = r \le n\).

Autrement dit, la signature est un invariant de la forme quadratique — indépendant du changement de base choisi. C’est l’analogue pour les formes quadratiques de ce qu’est le rang pour les applications linéaires.

Interprétation géométrique de la signature

La signature \((p, s)\) révèle la « géométrie intrinsèque » de la forme :

\(p\) est la dimension maximale d’un sous-espace sur lequel \(q\) est définie positive ;
\(s\) est la dimension maximale d’un sous-espace sur lequel \(q\) est définie négative ;
\(n – r = n – p – s\) est la dimension du noyau de \(q\) (les directions isotropes).

Classification par la signature

Signature \((p, s)\)	Type de la forme	Exemple géométrique associé
\((n, 0)\)	Définie positive	Ellipsoïde
\((0, n)\)	Définie négative	Ellipsoïde (orienté vers le bas)
\((p, s)\), \(p,s > 0\), \(p+s=n\)	Indéfinie non dégénérée	Hyperboloïde
\((p, s)\), \(p+s < n\)	Dégénérée	Cylindre, cône…

En particulier, pour \(n = 3\), une forme de signature \((2,1)\) correspond à un hyperboloïde à une nappe, tandis qu’une signature \((1,2)\) correspond à un hyperboloïde à deux nappes.

Application à l’exercice précédent

Dans la réduction obtenue plus haut, \(q = \ell_1^2 – 6\ell_2^2 + 4\ell_3^2\), les coefficients sont \(+1\), \(-6\), \(+4\). On compte \(p = 2\) coefficients positifs et \(s = 1\) coefficient négatif. La signature de \(q\) est \((2, 1)\), et son rang est \(r = 3\). La forme est donc non dégénérée et indéfinie.

Critère de Sylvester pour les formes définies positives

Lorsque l’on veut tester si une forme quadratique est définie positive sans effectuer la réduction complète de Gauss, le critère de Sylvester (aussi appelé critère des mineurs principaux) est un outil puissant.

Critère de Sylvester

Soit \(A \in \mathcal{S}_n(\mathbb{R})\) la matrice symétrique d’une forme quadratique \(q\). Notons \(\Delta_k\) le mineur principal d’ordre \(k\), c’est-à-dire le déterminant de la sous-matrice extraite des \(k\) premières lignes et colonnes. La forme \(q\) est définie positive si et seulement si :

\[
\Delta_1 > 0, \quad \Delta_2 > 0, \quad \ldots, \quad \Delta_n > 0
\]

Exemple d’application du critère

Soit \(q(x,y,z) = x^2 + 4xz + 2y^2 + z^2\). La matrice associée est :

\[
A = \begin{pmatrix} 1 & 0 & 2 \\ 0 & 2 & 0 \\ 2 & 0 & 1 \end{pmatrix}
\]

Calculons les mineurs principaux :

\(\Delta_1 = 1 > 0\) ✓
\(\Delta_2 = \det\begin{pmatrix} 1 & 0 \\ 0 & 2 \end{pmatrix} = 2 > 0\) ✓
\(\Delta_3 = \det(A) = 1(2 \cdot 1 – 0) – 0 + 2(0 – 4) = 2 – 8 = -6 < 0\) ✗

Puisque \(\Delta_3 < 0\), la forme \(q\) n'est pas définie positive. En effectuant la réduction de Gauss, on vérifierait qu’elle est indéfinie.

Mise en garde ! Le critère de Sylvester ne s’applique qu’à la définition positive. Pour tester si une forme est définie négative, on teste si \(-q\) est définie positive (ce qui revient à vérifier l’alternance de signes \(\Delta_1 < 0\), \(\Delta_2 > 0\), \(\Delta_3 < 0\), etc.). Pour une forme indéfinie, aucun de ces critères ne suffit : il faut recourir à la réduction ou aux valeurs propres.

Interprétation graphique et applications des formes quadratiques

formes quadratiques - Courbes de niveau d'une forme quadratique en deux variables : ellipse pour forme définie positive, hyperbole pour forme indéfinie, parabole dégénérée

Lien avec la différentielle seconde et les extrema

L’une des applications les plus importantes des formes quadratiques en analyse est l’étude des points critiques d’une fonction \(f : \mathbb{R}^n \to \mathbb{R}\) de classe \(\mathcal{C}^2\). La matrice hessienne \(H_f(a)\) d’une telle fonction en un point critique \(a\) est une matrice symétrique — donc la forme quadratique \(q(h) = {}^t\!h \, H_f(a) \, h\) est bien définie. On a alors :

Si \(H_f(a)\) est définie positive (signature \((n,0)\)) : \(a\) est un minimum local.
Si \(H_f(a)\) est définie négative (signature \((0,n)\)) : \(a\) est un maximum local.
Si \(H_f(a)\) est indéfinie : \(a\) est un point-selle (ni minimum ni maximum).

Lien avec les coniques et quadriques

Les surfaces (et courbes) définies par une équation \(q(x) = c\) sont classifiées par la signature de \(q\). Sur \(\mathbb{R}^3\), l’équation \(q(x, y, z) = 1\) définit :

Un ellipsoïde si la signature de \(q\) est \((3, 0)\).
Un hyperboloïde à une nappe si la signature est \((2, 1)\).
Un hyperboloïde à deux nappes si la signature est \((1, 2)\).

Ainsi, la classification des quadriques n’est autre que la classification des formes quadratiques réelles — un exemple frappant de l’unité des mathématiques.

Conclusion : Ce qu’il faut retenir sur les formes quadratiques

Les formes quadratiques sont bien plus que de simples polynômes de degré 2 : elles encodent la géométrie locale des surfaces, la nature des extrema des fonctions de plusieurs variables, et la classification des coniques et quadriques. Les points clés à maîtriser sont au nombre de quatre.

Premièrement, toute forme quadratique est entièrement déterminée par sa forme polaire – une forme bilinéaire symétrique – et représentée par une matrice symétrique dont les coefficients hors-diagonale valent la moitié des coefficients des termes croisés.

Deuxièmement, l’algorithme de réduction de Gauss permet, en deux cas bien distincts (terme carré non nul, ou tous les termes carrés nuls), d’écrire \(q\) comme somme de carrés de formes linéaires indépendantes.

Troisièmement, la loi d’inertie de Sylvester garantit que la signature \((p, s)\) – le nombre de carrés positifs et négatifs dans toute réduction – est un invariant absolu de la forme quadratique, indépendant des choix opérés.

Quatrièmement, le critère de Sylvester des mineurs principaux donne un test efficace pour la définition positive, directement applicable à la matrice hessienne en optimisation.