En algèbre linéaire, le polynôme caractéristique est l’un des outils les plus puissants pour analyser une matrice carrée ou un endomorphisme. Il concentre en un seul objet polynomial des informations essentielles : les valeurs propres, la trace, le déterminant, et bien plus encore. Comprendre le polynôme caractéristique, c’est tenir la clé de la diagonalisation, des équations différentielles et de nombreux problèmes de physique et d’informatique.
Ce cours complet, rédigé pour les étudiants de lycée avancé et de L1/L2, vous guidera de la définition rigoureuse jusqu’aux exercices corrigés pas à pas, en passant par les propriétés fondamentales et les erreurs classiques à éviter.
Définition du polynôme caractéristique
Motivation : pourquoi ce polynôme ?
Chercher les valeurs propres d’une matrice \( A \), c’est chercher les scalaires \( \lambda \) tels qu’il existe un vecteur non nul \( v \) avec \( Av = \lambda v \). Cette condition se réécrit \( (A – \lambda I_n)v = 0 \), ce qui signifie que la matrice \( A – \lambda I_n \) n’est pas inversible, c’est-à-dire que son déterminant est nul. On est donc naturellement conduit à étudier la fonction \( \lambda \mapsto \det(A – \lambda I_n) \). Cette expression est un polynôme en \( \lambda \) : c’est précisément le polynôme caractéristique.
Définition : Polynôme caractéristique d’une matrice
Soit \( A \) une matrice carrée d’ordre \( n \) à coefficients dans un corps \( \mathbb{K} \) (\( \mathbb{R} \) ou \( \mathbb{C} \)). On appelle polynôme caractéristique de \( A \) le polynôme en \( X \) :
\chi_A(X) = \det(X I_n – A)
\]
C’est un polynôme de degré \( n \), unitaire (coefficient dominant égal à \( 1 \)), à coefficients dans \( \mathbb{K} \).
Attention — Convention sur le signe : Certains ouvrages définissent le polynôme caractéristique comme \( \det(A – XI_n) \). Les deux conventions sont utilisées. Elles donnent des polynômes qui diffèrent d’un facteur \( (-1)^n \), donc leurs racines (les valeurs propres) sont identiques. Dans ce cours, nous choisissons \( \det(XI_n – A) \) pour obtenir un polynôme unitaire.
Définition pour un endomorphisme
Soit \( f \) un endomorphisme d’un espace vectoriel \( E \) de dimension finie \( n \). On fixe une base \( \mathcal{B} \) de \( E \) et on note \( A = \text{Mat}(f, \mathcal{B}) \). Le polynôme caractéristique de \( f \) est défini par :
\chi_f(X) = \det(X \, \mathrm{Id}_E – f)
\]
Ce polynôme ne dépend pas de la base choisie : si \( A \) et \( B \) sont deux matrices représentant \( f \) dans deux bases différentes, elles sont semblables et ont donc le même polynôme caractéristique (voir la propriété d’invariance ci-dessous).
Comment calculer le polynôme caractéristique
Matrice 2×2 : formule directe
Pour une matrice \( A = \begin{pmatrix} a & b \\ c & d \end{pmatrix} \), on calcule :
\chi_A(X) = \det\begin{pmatrix} X – a & -b \\ -c & X – d \end{pmatrix}
= (X-a)(X-d) – bc
= X^2 – (a+d)X + (ad – bc)
\]
On reconnaît la trace \( \text{tr}(A) = a + d \) et le déterminant \( \det(A) = ad – bc \), ce qui donne la formule remarquable :
Formule : Polynôme caractéristique d’une matrice 2×2
\chi_A(X) = X^2 – \mathrm{tr}(A) \cdot X + \det(A)
\]
Matrice 3×3 : développement par cofacteurs
Pour une matrice \( 3 \times 3 \), on forme la matrice \( XI_3 – A \) puis on développe son déterminant, généralement selon la première ligne ou la première colonne. La forme générale est :
\chi_A(X) = X^3 – \mathrm{tr}(A)\, X^2 + \left(\text{somme des mineurs principaux } 2{\times}2\right) X – \det(A)
\]
La somme des mineurs principaux \( 2\times 2 \) correspond à \( \frac{1}{2}\left[(\mathrm{tr}\,A)^2 – \mathrm{tr}(A^2)\right] \), ou encore à la trace de la comatrice de \( A \).
Cas des matrices triangulaires et diagonales
Si \( A \) est triangulaire (supérieure ou inférieure), la matrice \( XI_n – A \) est aussi triangulaire, et son déterminant est le produit des termes diagonaux :
\chi_A(X) = (X – a_{11})(X – a_{22}) \cdots (X – a_{nn})
\]
Les valeurs propres sont donc directement les coefficients diagonaux. Ce résultat, d’apparence simple, est fondamental : il justifie pourquoi la triangularisation est si utile.
Propriétés fondamentales du polynôme caractéristique
Propriété 1 : Lien avec les valeurs propres (spectre)
\( \lambda \) est une valeur propre de \( A \) si et seulement si \( \lambda \) est une racine de \( \chi_A \), c’est-à-dire si \( \chi_A(\lambda) = 0 \). L’ensemble des valeurs propres de \( A \) est appelé le spectre de \( A \), noté \( \text{Sp}(A \)).
Propriété 2 : Degré et coefficient dominant
\( \chi_A \) est un polynôme unitaire de degré \( n \). Son terme constant vaut \( \chi_A(0) = \det(-A) = (-1)^n \det(A) \).
Si \( \lambda_1, \ldots, \lambda_n \) sont les valeurs propres de \( A \) dans \( \mathbb{C} \) (comptées avec multiplicité), alors :
\chi_A(X) = (X – \lambda_1)(X – \lambda_2) \cdots (X – \lambda_n)
\]
En développant, on retrouve en particulier :
\lambda_1 + \lambda_2 + \cdots + \lambda_n = \mathrm{tr}(A), \qquad \lambda_1 \cdot \lambda_2 \cdots \lambda_n = \det(A)
\]
Propriété 3 : Invariance par similitude
Deux matrices semblables ont le même polynôme caractéristique. Si \( B = P^{-1}AP \) pour une matrice inversible \( P \), alors \( \chi_B = \chi_A \). Cela justifie la définition du polynôme caractéristique d’un endomorphisme, indépendamment de la base choisie.
La réciproque est fausse : même polynôme caractéristique ne signifie pas similitude. Un contre-exemple classique : \( I_2 \) et la matrice compagnon de \( (X-1)^2 \) ont le même polynôme caractéristique \( (X-1)^2 \), mais ne sont pas semblables.
Propriété 4 : Invariance par transposition
\( A \) et sa transposée \( A^\top \) ont le même polynôme caractéristique, car \( \det(XI_n – A^\top) = \det\bigl((XI_n – A)^\top\bigr) = \det(XI_n – A) \).
Le théorème de Cayley-Hamilton
Le théorème de Cayley-Hamilton est l’une des applications les plus spectaculaires du polynôme caractéristique. Son énoncé paraît surprenant au premier abord : une matrice est « racine » de son propre polynôme.
Théorème de Cayley-Hamilton
Soit \( A \) une matrice carrée d’ordre \( n \) et \( \chi_A \) son polynôme caractéristique. Alors :
\chi_A(A) = 0_n
\]
où \( 0_n \) désigne la matrice nulle d’ordre \( n \). Autrement dit, le polynôme caractéristique est un polynôme annulateur de \( A \).
Application : calcul de l’inverse et des puissances
Si \( A \) est une matrice \( 2\times 2 \) de polynôme caractéristique \( \chi_A(X) = X^2 – \text{tr}(A)\, X + \det(A) \), Cayley-Hamilton donne :
A^2 – \mathrm{tr}(A)\, A + \det(A)\, I_2 = 0_2
\]
Si \( \det(A) \neq 0 \), on peut exprimer l’inverse :
A^{-1} = \frac{1}{\det(A)}\bigl(\mathrm{tr}(A)\, I_2 – A\bigr)
\]
Plus généralement, ce théorème permet de réduire le calcul de toute puissance \( A^k \) à une combinaison linéaire de \( I, A, A^2, \ldots, A^{n-1} \), ce qui est extrêmement utile pour les suites et les équations différentielles.
Lien avec le polynôme minimal
Le polynôme minimal \( \mu_A \) de \( A \) est le polynôme unitaire de plus petit degré qui annule \( A \). Le théorème de Cayley-Hamilton assure que \( \mu_A \) divise \( \chi_A \). Ils ont toujours les mêmes racines (les mêmes valeurs propres), mais les multiplicités peuvent différer.
Polynôme caractéristique et diagonalisation
La diagonalisation d’une matrice repose entièrement sur le polynôme caractéristique. Voici le schéma général :
- On calcule \( \chi_A(X) \).
- On factorise \( \chi_A \) sur \( \mathbb{K} \).
- Pour chaque valeur propre \( \lambda_i \), on calcule l’espace propre \( E_{\lambda_i} = \ker(A – \lambda_i I_n) \).
- \( A \) est diagonalisable si et seulement si la somme des dimensions des espaces propres est égale à \( n \), c’est-à-dire si chaque valeur propre a une multiplicité géométrique égale à sa multiplicité algébrique (multiplicité comme racine de \( \chi_A \)).
Condition de diagonalisabilité via \( \chi_A \)
Une matrice \( A \) d’ordre \( n \) est diagonalisable sur \( \mathbb{K} \) si et seulement si \( \chi_A \) est scindé sur \( \mathbb{K} \) (toutes les racines dans \( \mathbb{K} \)) et que toutes ses racines sont simples, ou plus généralement que chaque valeur propre \( \lambda_i \) vérifie :
\dim\bigl(\ker(A – \lambda_i I_n)\bigr) = m_i
\]
où \( m_i \) est la multiplicité de \( \lambda_i \) comme racine de \( \chi_A \).
Applications du polynôme caractéristique
Équations différentielles linéaires
Pour un système différentiel \( \mathbf{x}'(t) = A\,\mathbf{x}(t) \), les solutions sont déterminées par les valeurs propres de \( A \), c’est-à-dire par les racines du polynôme caractéristique. Si \( \lambda \) est une valeur propre de multiplicité 1, le système admet une solution de la forme \( e^{\lambda t} \mathbf{v} \) où \( \mathbf{v} \) est un vecteur propre associé.
Suites récurrentes linéaires
Une suite \( (u_n) \) définie par une récurrence linéaire d’ordre \( p \) peut s’analyser en encodant la récurrence sous forme matricielle. Le polynôme caractéristique de la matrice compagnon associée est exactement le polynôme caractéristique de la récurrence : ses racines déterminent la forme générale des termes de la suite.
Stabilité des systèmes dynamiques
En automatique et en physique, la stabilité d’un système linéaire est directement liée au signe (ou à la partie réelle dans \( \mathbb{C} \)) des valeurs propres de la matrice du système. Analyser le polynôme caractéristique suffit à conclure sur la stabilité sans calculer explicitement les solutions.
Analyse en composantes principales (ACP)
En statistiques et en apprentissage automatique, l’ACP repose sur le calcul des valeurs propres de la matrice de covariance — donc sur son polynôme caractéristique — pour identifier les directions de plus grande variance dans les données.
Interprétation intuitive
Imaginez que vous cherchez à « décomposer » l’action d’une transformation linéaire \( f \) en mouvements élémentaires (étirements, compressions) selon certaines directions privilégiées. Ces directions privilégiées sont les vecteurs propres, et les facteurs d’étirement correspondants sont les valeurs propres.
Le polynôme caractéristique est la « carte d’identité » de cette transformation : il recense toutes les valeurs propres possibles et leur multiplicité. Calculer \( \chi_A(X) \) revient à demander : « pour quelles valeurs de \( X \) la transformation \( f – X \cdot \text{Id} \) cesse-t-elle d’être inversible ? » — c’est précisément là que des directions propres apparaissent.
De même, le fait que \( A \) annule son propre polynôme (Cayley-Hamilton) signifie qu’après \( n \) itérations, la matrice ne peut « inventer » aucun nouveau comportement : tout est déjà encodé dans ses valeurs propres et son polynôme caractéristique.
Coefficients du polynôme caractéristique : formules générales
Pour une matrice \( A \) d’ordre \( n \), le polynôme caractéristique s’écrit :
\chi_A(X) = X^n – e_1(A)\, X^{n-1} + e_2(A)\, X^{n-2} – \cdots + (-1)^n e_n(A)
\]
où les coefficients \( e_k(A) \) sont les sommes des mineurs principaux d’ordre \( k \) de \( A \). En particulier :
| Coefficient | Expression | Signification |
|---|---|---|
| \( e_1(A) \) | \( \mathrm{tr}(A) \) | Somme des valeurs propres |
| \( e_k(A) \) | Somme des mineurs principaux d’ordre \( k \) | Fonctions symétriques élémentaires des v.p. |
| \( e_n(A) \) | \( \det(A) \) | Produit des valeurs propres |
Ces relations sont des conséquences directes des formules de Viète appliquées aux racines \( \lambda_1, \ldots, \lambda_n \) du polynôme caractéristique.
Conclusion
Le polynôme caractéristique est bien plus qu’un simple objet de calcul : c’est une empreinte algébrique complète d’une matrice ou d’un endomorphisme. En réunissant en un seul polynôme les valeurs propres, la trace et le déterminant, il offre une porte d’entrée universelle vers la structure profonde des transformations linéaires.
Savoir calculer \( \chi_A(X) = \det(XI_n – A) \), en interpréter les racines comme valeurs propres, exploiter le théorème de Cayley-Hamilton et relier le polynôme caractéristique à la diagonalisabilité : voilà les compétences essentielles que ce cours vous a permis de construire. Ces outils se retrouveront dans presque tous les domaines des mathématiques appliquées, de la physique théorique à l’informatique.
Pour approfondir, consultez les articles connexes sur les valeurs propres et vecteurs propres, la diagonalisation et le théorème de Cayley-Hamilton. Pour une référence académique, voir l’article Polynôme caractéristique — Wikipédia.