Dérivées partielles : définition et calcul

Imaginez que vous gravissez une montagne. La pente que vous ressentez dépend de la direction dans laquelle vous marchez. Si vous avancez vers le nord, la montée sera peut-être douce ; si vous partez vers l’est, elle sera abrupte. C’est exactement l’idée qui se cache derrière les dérivées partielles : mesurer le taux de variation d’une fonction de plusieurs variables lorsque l’on fait varier une seule variable à la fois, toutes les autres étant maintenues constantes.

Les dérivées partielles constituent l’outil fondamental de l’analyse multivariable. Elles interviennent en physique (thermodynamique, mécanique des fluides), en économie (fonctions d’utilité), en optimisation, et dans toute la théorie des équations aux dérivées partielles (EDP). Ce cours vous guide pas à pas, de la définition rigoureuse jusqu’aux exercices corrigés, en passant par l’interprétation géométrique, le théorème de Schwarz et les fonctions de classe \( \mathcal{C}^1 \).

Table des Matières

Définition des dérivées partielles

Soit \( f : U \subset \mathbb{R}^n \to \mathbb{R} \) une fonction de \( n \) variables définie sur un ouvert \( U \), et soit \( a = (a_1, \dots, a_n) \in U \). On dit que \( f \) admet une dérivée partielle par rapport à la \( i \)-ème variable au point \( a \) si la limite suivante existe et est finie :

\[ \frac{\partial f}{\partial x_i}(a) = \lim_{h \to 0} \frac{f(a_1, \dots, a_{i-1},\, a_i + h,\, a_{i+1}, \dots, a_n) – f(a_1, \dots, a_n)}{h} \]

Cette limite, lorsqu’elle existe, est appelée la dérivée partielle de \( f \) en \( a \) par rapport à \( x_i \). On la note aussi \( \partial_i f(a) \), ou encore \( f_{x_i}(a) \) selon les conventions.

En pratique, calculer \(\frac{\partial f}{\partial x_i}\) revient à dériver \( f \) par rapport à \( x_i \) comme si toutes les autres variables étaient des constantes. C’est une réduction élégante : on ramène un problème à plusieurs variables à un problème de dérivation ordinaire.

Notations usuelles

Pour une fonction \( f(x, y) \) de deux variables, on rencontre couramment les notations suivantes pour la dérivée partielle par rapport à \( x \) :

\[ \frac{\partial f}{\partial x}(x,y) \;=\; \partial_x f(x,y) \;=\; \partial_1 f(x,y) \;=\; f_x(x,y) \]

Le symbole \( \partial \) (appelé « d rond ») est réservé aux dérivées partielles pour les distinguer visuellement des dérivées ordinaires \( \frac{d}{dx} \). Cette distinction est importante : on n’écrit jamais \( \frac{df}{dx} \) pour une dérivée partielle.

Exemple fondamental

Soit \( f(x, y) = x^3 y + \sin(xy^2) \). Calculons ses deux dérivées partielles.

Dérivée partielle par rapport à \( x \) (on traite \( y \) comme une constante) :

\[ \frac{\partial f}{\partial x}(x,y) = 3x^2 y + y^2 \cos(xy^2) \]

Dérivée partielle par rapport à \( y \) (on traite \( x \) comme une constante) :

\[ \frac{\partial f}{\partial y}(x,y) = x^3 + 2xy \cos(xy^2) \]

Interprétation géométrique des dérivées partielles

Pour une fonction \( f(x,y) \) de deux variables, le graphe de \( f \) est une surface dans l’espace \( \mathbb{R}^3 \). Fixons un point \( (a, b) \) dans le plan \( Oxy \).

La dérivée partielle \( \frac{\partial f}{\partial x}(a, b) \) est la pente de la tangente à la courbe obtenue en intersectant la surface \( z = f(x,y) \) avec le plan vertical \( y = b \), au point \( \bigl(a,\, b,\, f(a,b)\bigr) \). On se déplace dans la direction des \( x \) et on mesure la pente à cet instant.
De même, \( \frac{\partial f}{\partial y}(a, b) \) est la pente de la tangente à la courbe d’intersection de la surface avec le plan vertical \( x = a \). On se déplace cette fois dans la direction des \( y \).

Géométriquement, calculer une dérivée partielle revient à couper la surface par un plan vertical parallèle à l’un des axes de coordonnées, puis à mesurer la pente de la courbe obtenue. Chaque dérivée partielle capture ainsi une tranche différente de l’information sur la surface.

Dérivées partielles d’ordre supérieur

Puisque \( \frac{\partial f}{\partial x} \) et \( \frac{\partial f}{\partial y} \) sont elles-mêmes des fonctions de \( (x,y) \), on peut les dériver à nouveau. On obtient ainsi les dérivées partielles d’ordre 2 (ou dérivées secondes). Pour une fonction \( f(x,y) \), il y en a quatre :

\[ \frac{\partial^2 f}{\partial x^2} = f_{xx}, \quad \frac{\partial^2 f}{\partial y^2} = f_{yy}, \quad \frac{\partial^2 f}{\partial y \partial x} = f_{xy}, \quad \frac{\partial^2 f}{\partial x \partial y} = f_{yx} \]

Les deux dernières, \( \frac{\partial^2 f}{\partial y \partial x} \) et \( \frac{\partial^2 f}{\partial x \partial y} \), sont appelées dérivées partielles mixtes. La notation \( \frac{\partial^2 f}{\partial y \partial x} \) signifie : dériver d’abord par rapport à \( x \), puis le résultat par rapport à \( y \). L’ordre de lecture se fait de droite à gauche.

On définit par récurrence les dérivées partielles d’ordre \( k \) : ce sont les dérivées partielles des dérivées partielles d’ordre \( k-1 \).

Théorème de Schwarz (symétrie des dérivées mixtes)

Théorème de Schwarz (aussi appelé théorème de Clairaut)

Soit \( f : U \subset \mathbb{R}^n \to \mathbb{R} \) une fonction de classe \( \mathcal{C}^2 \) sur l’ouvert \( U \). Alors, pour tous indices \( i \neq j \) et pour tout point \( a \in U \) :

\[ \frac{\partial^2 f}{\partial x_i \, \partial x_j}(a) \;=\; \frac{\partial^2 f}{\partial x_j \, \partial x_i}(a) \]

Plus généralement, si \( f \) est de classe \( \mathcal{C}^k \), on peut calculer ses dérivées partielles jusqu’à l’ordre \( k \) dans n’importe quel ordre : le résultat ne dépend pas de l’ordre de dérivation.

Hypothèses du théorème

L’hypothèse classe \( \mathcal{C}^2 \) signifie que toutes les dérivées partielles d’ordre 2 de \( f \) existent et sont continues sur \( U \). Cette condition ne peut pas être allégée à la légère.

⚠ Attention : Contre-exemple de Peano
Sans l’hypothèse de continuité, le théorème devient faux. La fonction
\[ f(x,y) = \begin{cases} \dfrac{xy(x^2 – y^2)}{x^2 + y^2} & \text{si } (x,y) \neq (0,0) \\[8pt] 0 & \text{si } (x,y) = (0,0) \end{cases} \]
admet bien des dérivées partielles secondes en \( (0,0) \), mais on a :
\[ \frac{\partial^2 f}{\partial x \, \partial y}(0,0) = 1 \qquad \text{et} \qquad \frac{\partial^2 f}{\partial y \, \partial x}(0,0) = -1 \]
Les dérivées mixtes ne sont donc pas égales. L’hypothèse de classe \( \mathcal{C}^2 \) est donc indispensable.

Preuve du théorème de Schwarz (cas \( n = 2 \), ordre 1)

Donnons une idée de la démonstration dans le cas de deux variables \( x \) et \( y \). Soit \( a = (x_0, y_0) \in U \) et \( \delta_0 > 0 \) tel que le carré \( [x_0, x_0 + h] \times [y_0, y_0 + k] \subset U \) pour \( h, k \in [0, \delta_0] \). On pose la quantité auxiliaire :

\[ \Delta(h,k) = f(x_0+h, y_0+k) – f(x_0, y_0+k) – f(x_0+h, y_0) + f(x_0, y_0) \]

On peut écrire \( \Delta(h,k) = g(y_0 + k) – g(y_0) \) où \( g(y) = f(x_0 + h, y) – f(x_0, y) \). Par le théorème des accroissements finis appliqué à \( g \), il existe \( \theta_1 \in ]0,1[ \) tel que :

\[ \Delta(h,k) = k \cdot g'(y_0 + \theta_1 k) = k \left[ \frac{\partial f}{\partial y}(x_0 + h, y_0 + \theta_1 k) – \frac{\partial f}{\partial y}(x_0, y_0 + \theta_1 k) \right] \]

On applique à nouveau le théorème des accroissements finis par rapport à \( x \), faisant intervenir la dérivée mixte \( \frac{\partial^2 f}{\partial x \partial y} \). Un raisonnement symétrique en échangeant les rôles de \( x \) et \( y \) fait apparaître \( \frac{\partial^2 f}{\partial y \partial x} \). La continuité des dérivées secondes permet de passer à la limite lorsque \( h \to 0 \) et \( k \to 0 \), et d’en conclure l’égalité des deux dérivées mixtes en \( (x_0, y_0) \).

Fonctions de classe \( \mathcal{C}^1 \) et différentiabilité

Définition : Classe \( \mathcal{C}^1 \)

On dit que \( f : U \to \mathbb{R} \) est de classe \( \mathcal{C}^1 \) sur \( U \) (ou \( \mathcal{C}^1(U) \)) si toutes ses dérivées partielles d’ordre 1 existent et sont continues sur \( U \).

De même, \( f \) est de classe \( \mathcal{C}^k \) si toutes ses dérivées partielles jusqu’à l’ordre \( k \) existent et sont continues. On dit que \( f \) est de classe \( \mathcal{C}^\infty \) (ou lisse) si elle est de classe \( \mathcal{C}^k \) pour tout entier \( k \geq 1 \).

Lien entre dérivées partielles et différentiabilité

Propriété fondamentale

Si \( f \) est de classe \( \mathcal{C}^1 \) au voisinage d’un point \( a \in U \), alors \( f \) est différentiable en \( a \).

La réciproque est fausse en général : la différentiabilité n’implique pas la continuité des dérivées partielles. Mais la condition \( \mathcal{C}^1 \) garantit la différentiabilité.

⚠ Piège classique : existence des dérivées partielles ≠ continuité
L’existence des dérivées partielles en un point n’implique pas la continuité de la fonction en ce point, et encore moins sa différentiabilité. Il existe des fonctions dont les dérivées partielles existent en \( (0,0) \) mais qui ne sont pas continues en ce point. La régularité des dérivées partielles (i.e. leur continuité) est l’ingrédient clé.

La différentielle totale

Lorsque \( f \) est différentiable en \( a \), sa différentielle (ou différentielle totale) est l’application linéaire \( df_a : \mathbb{R}^n \to \mathbb{R} \) définie par :

\[ df_a(h_1, \dots, h_n) = \sum_{i=1}^{n} \frac{\partial f}{\partial x_i}(a) \cdot h_i \]

En notation différentielle, on écrit souvent :

\[ df = \frac{\partial f}{\partial x_1} \, dx_1 + \frac{\partial f}{\partial x_2} \, dx_2 + \cdots + \frac{\partial f}{\partial x_n} \, dx_n \]

La différentielle totale quantifie la meilleure approximation affine de \( f \) au voisinage de \( a \). C’est la généralisation en dimension \( n \) de la notion de tangente.

Le gradient d’une fonction de plusieurs variables

Lorsque \( f : U \subset \mathbb{R}^n \to \mathbb{R} \) admet des dérivées partielles en tout point \( a \in U \), on appelle gradient de \( f \) en \( a \) le vecteur :

\[ \nabla f(a) = \overrightarrow{\text{grad}}\, f(a) = \begin{pmatrix} \dfrac{\partial f}{\partial x_1}(a) \\[6pt] \vdots \\[6pt] \dfrac{\partial f}{\partial x_n}(a) \end{pmatrix} \]

Le symbole \( \nabla \) se prononce « nabla ».

Le gradient porte une information géométrique précieuse : lorsqu’il est non nul, il indique la direction de plus grande pente de \( f \) au point \( a \), c’est-à-dire la direction dans laquelle la fonction croît le plus vite. Par ailleurs, le gradient est toujours orthogonal aux lignes de niveau de \( f \) (les courbes \( f(x,y) = c \) dans le cas de deux variables).

C’est cette propriété qui est exploitée dans les algorithmes de descente de gradient, omniprésents en optimisation et en apprentissage automatique : pour minimiser une fonction, on se déplace dans la direction opposée au gradient.

Opérations sur les dérivées partielles

Si \( f \) et \( g \) admettent des dérivées partielles par rapport à \( x_i \) en \( a \), et si \( \lambda, \mu \in \mathbb{R} \), alors les règles habituelles s’appliquent composante par composante. Pour la dérivation par rapport à \( x_i \) :

Opération	Dérivée partielle \( \partial_i \)
Combinaison linéaire : \( \lambda f + \mu g \)	\( \lambda \, \partial_i f(a) + \mu \, \partial_i g(a) \)
Produit : \( f \cdot g \)	\( \partial_i f(a) \cdot g(a) + f(a) \cdot \partial_i g(a) \)
Quotient : \( f / g \) (\( g(a) \neq 0 \))	\( \dfrac{\partial_i f(a) \cdot g(a) – f(a) \cdot \partial_i g(a)}{g(a)^2} \)
Composition : \( \varphi \circ f \)	\( \partial_i f(a) \cdot \varphi'(f(a)) \)

Ces formules sont exactement les mêmes que pour les dérivées ordinaires, ce qui rend le calcul des dérivées partielles très naturel dès que l’on sait dériver des fonctions d’une variable.

Applications : vers les équations aux dérivées partielles

Les dérivées partielles sont l’ingrédient de base des équations aux dérivées partielles (EDP), qui décrivent une grande partie des phénomènes naturels. Quelques exemples emblématiques :

Équation de la chaleur : \( \frac{\partial u}{\partial t} = k \, \frac{\partial^2 u}{\partial x^2} \). Elle modélise la diffusion de la chaleur dans un milieu conducteur.
Équation des ondes : \( \frac{\partial^2 u}{\partial t^2} = c^2 \, \frac{\partial^2 u}{\partial x^2} \). Elle décrit la propagation des ondes sonores ou lumineuses.
Équation de Laplace : \( \frac{\partial^2 u}{\partial x^2} + \frac{\partial^2 u}{\partial y^2} = 0 \), fondamentale en électrostatique et en mécanique des fluides.

En thermodynamique, le théorème de Schwarz permet d’établir les relations de Maxwell, qui relient les dérivées partielles des fonctions d’état (énergie interne, enthalpie, etc.). La maîtrise des dérivées partielles est donc indispensable bien au-delà des mathématiques pures.