Nombre dérivé, fonction dérivée

Plan du chapitre "Dérivabilité"

Dérivabilité en un point, nombre dérivé

Dans tout ce chapitre, on considère des fonctions qui sont définies sur un intervalle {I} de {\mathbb{R}} non réduit à un point, et qui sont à valeurs dans {\mathbb{R}}.

On se place au voisinage d’un point {A(a,f(a))} de la courbe représentative {(\Gamma)} de {f}.

Soit {M(x,f(x))} un point mobile sur {(\Gamma)}, avec {x\ne a}.

La droite {\Delta_{x}} passant par {A} et {M} a pour coefficient directeur de {\Delta_{x}} est {\delta_{x}=\dfrac{f(x)-f(a)}{x-a}}.

Quand {x} tend vers {a} (donc sur la figure ci-dessous quand {M} se rapproche de {A} sur {(\Gamma)}) on examine si {\Delta_{x}} (qui pivote autour de {A}) possède une position limite {\Delta} (c’est-à-dire si {\delta_{x}} possède une valeur limite).

Si tel est le cas, on dit que la droite {\Delta} est la tangente en {A} à la représentation graphique {(\Gamma)}.

Définition (nombre dérivé en un point)
Soit {f:I\to\mathbb{R}} une fonction numérique réelle. Soit {a} un élément de {I}.
On dit que {f} est dérivable en {a} si {\displaystyle\lim_{x\to a}\dfrac{f(x)-f(a)}{x-a}} existe dans {\mathbb{R}}.
Cette limite est appelée nombre dérivé de {f} en {a} et est notée {f'(a)}, ou {D(f)(a)}, ou {\dfrac{\text{d}f}{\text{d}x}(a)}.

Interprétation géométrique

Dire que {f} est dérivable en {a}, c’est dire que la courbe représentative {(\Gamma)} de {f} présente au point {A(a,f(a))} une tangente {\Delta} non verticale : son coefficient directeur est {f'(a)}.

L’équation de la droite {\Delta} est donc {y=f(a)+(x-a)f'(a)}.

Proposition (une autre définition de la dérivabilité)
Soit {f:I\to\mathbb{R}} une fonction numérique réelle. Soit {a} un élément de {I}. Dire que {f} est dérivable en {a}, c’est dire qu’il existe {\ell\in\mathbb{R}} et une fonction {\varepsilon : I\to\mathbb{R}} vérifiant {\displaystyle\lim_{x\to a}\varepsilon(x)=0} et {\varepsilon(a)=0}, avec :{\forall\, x\in I,\;f(x)=f(a)+(x-a)\ell+(x-a)\varepsilon(x)}
Au sens de la définition précédente, le réel {\ell} est le nombre dérivé {f'(a)}.

Représentons la courbe {(\Gamma)} de {f} au voisinage de {A(a,f(a))}, et la tangente {\Delta} (non verticale) en {A}.

Plaçons également deux points {M_{0}} et {M_{1}} sur {(\Gamma)} d’abscisses respectives {x_{0}} et {x_{1}}.

On sait que l’équation de la tangente en {A} à {(\Gamma)} est : {y=f(a)+(x-a)f'(a)}.

Dans l’illustration ci-dessous, on a les coordonnées : {\begin{cases}H_{0}(x_{0},f(a))\\N_{0}(x_{0},f(a)+(x_{0}-a)f'(a))\\M_{0}(x_{0},f(x_{0})\end{cases}\;\text{et}\;\begin{cases}H_{1}(x_{1},f(a))\\N_{1}(x_{1},f(a)+(x_{1}-a)f'(a))\\M_{1}(x_{1},f(x_{1})\end{cases}}
Si on parle en termes de mesures algébriques sur un axe vertical (dirigé vers le haut), alors :
{\begin{array}{c}\begin{cases}\overline{H_{0}N_{0}}=(x_{0}-a)f'(a)\cr \overline{H_{1}N_{1}}=(x_{1}-a)f'(a)\end{cases}\quad\begin{cases}\overline{H_{0}M_{0}}=f(x_{0})-f(a)\cr \overline{H_{1}M_{1}}=f(x_{1})-f(a)\end{cases}\\\\\begin{cases}\overline{N_{0}M_{0}}=f(x_{0})-f(a)-(x_{0}-a)f'(a)\cr \overline{N_{1}M_{1}}=f(x_{1})-f(a)-(x_{1}-a)f'(a)\end{cases}\end{array}}

Avec les notations de la proposition précédente, on a donc {\begin{cases}\overline{N_{0}M_{0}}=(x_{0}-a)\varepsilon(x_{0})\cr \overline{N_{1}M_{1}}=(x_{1}-a)\varepsilon(x_{1})\end{cases}}

Ce que dit la dérivabilité de {f} en {a}, c’est qu’au voisinage immédiat de {A} une mesure algébrique comme {\overline{N_{0}M_{0}}} est négligeable devant {\overline{H_{0}N_{0}}} (ça ne saute pas aux yeux sur l’illustration car on s’est placé finalement très loin de {a}).

En termes imagés, la dérivabilité de {f} en {a} nous dit que la différence {f(x)-f(a)} (donc l’accroissement de {f} entre {a} et {x}) est approché par {f'(a)(x-a)} (donc proportionnellement à l’accroissement {x-a} de la variable), avec un terme d’erreur qui est lui-même négligeable devant {x-a}.

En termes plus géométriques (mais pas tellement plus précis) la tangente {\Delta} à {(\Gamma)} en {A(a,f(a))} est une “bonne approximation” de la courbe au voisinage de {A}.

Proposition
Soit {f:I\to\mathbb{R}} une fonction numérique, et soit {a} un point de {I}.
Si {f} est dérivable {a}, alors {f} est continue en {a}.

La réciproque est fausse : penser à {x\mapsto\left|x\right|} en {0}.

Notion de développement limité d’ordre {1}

Soit {f:I\to\mathbb{R}} une fonction numérique, et soit {a} un point de {I}.

Si {f} est dérivable {a} alors : {f(x)=f(a)+f'(a)(x-a)+(x-a)\varepsilon(x)\text{\ avec\ }\displaystyle\lim_{x\to a}\varepsilon(x)=0}

Réciproquement, on suppose que {a} est une extrémité de l’intervalle de définition de {f}.

On suppose également qu’on peut écrire :{f(x)=\lambda_{0} +\lambda_{1}(x-a)+(x-a)\varepsilon(x)\text{\ avec\ }\displaystyle\lim_{x\to a}\varepsilon(x)=0}

On trouve {\displaystyle\lim_{x\to a}f(x)=\lambda_{0}}, donc {f} est prolongeable par continuité en {a} en posant {f(a)=\lambda_{0}}.

On trouve ensuite {\dfrac{f(x)-f(a)}{x-a}=\lambda_{1}+\varepsilon(x)}, donc {\displaystyle\lim_{x\to a}\dfrac{f(x)-f(a)}{x-a}=\lambda_{1}}.

Cela prouve que {f} est dérivable en {a}, avec {f'(a)=\lambda_{1}}.

On peut donc énoncer le résultat suivant, qui sera amélioré ultérieurement :

Proposition
Soit {f} une fonction numérique, définie sur {I\setminus\{a\}}.
On suppose que {f} possède un «développement limité d’ordre {1} en {a}».
Autrement dit, on suppose qu’on peut écrire : {f(x)=\lambda_{0} +\lambda_{1}(x-a)+(x-a)\varepsilon(x)\text{\ avec\ }\displaystyle\lim_{x\to a}\varepsilon(x)=0}
Alors {f} est prolongeable de façon dérivable en {a}, en posant {f(a)=\lambda_{0}} et {f'(a)=\lambda_{1}}.

Variante de notation

Le développement limité {f(x)=\lambda_{0} +\lambda_{1}(x-a)+(x-a)\varepsilon(x)} s’écrit : {f(x)=\lambda_{0} +\lambda_{1}(x-a)+\text{o}(x-a)}
Dans cette écriture, {\text{o}(x-a)} est une notation générique désignant toute fonction négligeable devant {x-a} quand {x} tend vers {a}, c’est-à-dire qui s’écrit {(x-a)\varepsilon(x)}, avec {\displaystyle\lim_{x\to a}\varepsilon(x)=0}.

Le changement de variable {x=a+h} permet de se ramener à une étude quand {h} tend vers {0}.

On écrira donc {f(a+h)=\lambda_{0} +\lambda_{1}h+\text{o}(h)} pour le développement limité d’ordre {1} de {f} en {a}.

Dérivabilité à gauche, à droite

On complète les définitions précédentes avec la notion de nombre dérivé à gauche ou à droite.

Définition (nombre dérivé à gauche)
Soit {f:I\to\mathbb{R}} une fonction numérique, et soit {a\in I} (distinct de l’extrémité gauche de {I}).
On dit que {f} est dérivable à gauche en {a} si {\displaystyle\lim_{x\to a^{-}}\dfrac{f(x)-f(a)}{x-a}} existe dans {\mathbb{R}}.
Cette limite est appelée nombre dérivé à gauche de {f} en {a}, et est notée {f'_g(a)}.
Définition (nombre dérivé à droite)
Soit {f:I\to\mathbb{R}} une fonction numérique, et soit {a\in I} (distinct de l’extrémité droite de {I})
On dit que {f} est dérivable à droite en {a} si {\displaystyle\lim_{x\to a^{+}}\dfrac{f(x)-f(a)}{x-a}} existe dans {\mathbb{R}}.
Cette limite est appelée nombre dérivé à droite de {f} en {a}, et est notée {f'_d(a)}.

Interprétation géométrique

Dire que {f} est dérivable à droite (resp. à gauche) en {a}, c’est dire que la courbe {(\Gamma)} de {f} admet au point {A(a,f(a))} une demi-tangente à droite (resp. à gauche) non verticale.

Le coefficient directeur de cette demi-tangente est {f'_d(a)} (resp. {f'_g(a)}).

Sur ce premier exemple, {f} est dérivable à gauche et à droite en {a}, avec {f'_g(a)=-1} (demi-tangente oblique, parallèle à {y=-x}) et {f'_d(a)=0} (demi-tangente horizontale.)

Sur ce second exemples, on a {f'_g(a)=0} (demi-tangente horizontale), mais {f} n’est pas dérivable à droite en {a} (il y a bien une demi-tangente mais elle est verticale).

Remarques:

  • Soit {a} un point de {I} qui n’est pas une extrémité de {I}. Alors {f} est dérivable en {a} si seulement si elle y est dérivable à gauche et à droite, avec {f'_g(a)=f'_d(a)}. On a alors {f'(a)=f'_g(a)=f'_d(a)}.
  • Si {f} est dérivable à gauche (resp. à droite) en {a}, elle y est continue à gauche (resp. à droite).

Dérivabilité sur un intervalle

Définition (fonctions dérivables, ou de classe C1, sur I)
On dit que {f} est dérivable sur l’intervalle {I} si {f} est dérivable en tout point de {I}.
La fonction {f':I\to \mathbb{R}} qui à tout {a}associe {f'(a)} est appelée fonction dérivée de {f}.
Cette fonction est également notée {\text{D}(f)} ou {\dfrac{\text{d}f}{\text{d}x}}.
Si de plus {f'} est continue sur {I}, on dit que {f} est de classe {\mathcal{C}^1} sur {I}
On note {{\mathcal D}(I,\mathbb{R})} (resp. {{\mathcal C}^1(I,\mathbb{R})}) l’ensemble des fonctions dérivables (resp. de classe {\mathcal{C}^1}) de {I} dans {\mathbb{R}}.

Remarque : on se souviendra que la dérivabilité (même étendue à un intervalle) reste une notion locale : la dérivabilité de {f} sur {I}, ça n’est que la dérivabilité de {f} en chacun des points de {I}.

Opérations sur les fonctions dérivables

Proposition (linéarité de la dérivation en un point)
Soient {f} et {g} deux fonctions dérivables au point {a}, et {\alpha,\beta} deux scalaires.
Alors la fonction {h=\alpha f+\beta g} est dérivable en {a} et {h'(a)=\alpha f'(a)+\beta g'(a)}.
Proposition (produit de fonctions dérivables en un point)
Soient {f} et {g} deux fonctions dérivables en un point {a}.
Alors la fonction {h=fg} est dérivable en {a}, et {h'(a)=f'(a)g(a)+f(a)g'(a)}.
Proposition (dérivée de l'inverse)
Si {g} est dérivable en {a}, avec {g(a)\ne0}, alors {h=\dfrac 1g} est dérivable en {a}, et {h'(a)=-\dfrac{g'(a)}{g^2(a)}}.
Supposons en outre que {f} soit dérivable en {a}.
Alors le quotient {\dfrac fg} est dérivable au point {a}, et : {\Bigl(\dfrac fg\Bigr)'(a)=\dfrac{f'(a)g(a)-f(a)g'(a)}{g^2(a)}}.
Proposition (composition et dérivation)
Soit {f:I\to\mathbb{R}}, dérivable en {a}. Soit {g:J\to\mathbb{R}}, dérivable en {b=f(a)}.
Alors {g\circ f} est dérivable en {a} et : {(g\circ f)'(a)=f'(a)(g'\circ f)(a)}.

Remarque : dans la proposition précédente, il faut supposer que {g\circ f} est définie au voisinage de {a} (par exemple, si {f(I)\subset J}, alors {g\circ f} est définie sur {I}).

Proposition (dérivation et bijection réciproque)
Soit {f:I\to\mathbb{R}} une fonction dérivable, strictement monotone.
La fonction {f} est donc bijective de {I} sur un intervalle {J}. Soit {a} dans {I} tel que {f'(a)\ne0}.
Alors {g=f^{-1}} est dérivable en {b=f(a)} et {g'(b)=\dfrac 1{f'(a)}=\dfrac1{f'\circ f^{-1}(b)}}.

Généralisation aux fonctions dérivables sur un intervalle

Les propriétés précédentes se généralisent à la dérivabilité sur un intervalle. On peut même d’ailleurs énoncer les mêmes résultats en remplaçant “dérivable” par « de classe {\mathcal{C}^{1}} »).

  • Soient {f,g} deux fonctions dérivables sur l’intervalle {I}. Soient {\alpha,\beta} deux scalaires.
    Alors {h=\alpha f+\beta g} et le produit {fg} sont dérivables sur {I} et {\begin{cases}h'=\alpha f'+\beta g'\cr (fg)'=f'g+fg'\end{cases}}

    Si {g} ne s’annule pas sur {I}, alors {\Bigl(\dfrac1g\Bigr)'=-\dfrac{g'}{g^2}}, et {\Bigl(\dfrac fg\Bigr)'=\dfrac{f'g-fg'}{g^2}}.

  • Soit {f:I\to\mathbb{R}} et {g:J\to\mathbb{R}} deux fonctions dérivables, avec {f(I)\subset J}.
    Alors {g\circ f} est dérivable sur {I} et {(g\circ f)'=f'\cdot(g'\circ f)}
  • Soit {f:I\to\mathbb{R}} une fonction dérivable, strictement monotone.
    La fonction {f} réalise donc une bijection de {I} sur un intervalle {J}.
    Si {f'} ne s’annule pas sur {I}, alors {g=f^{-1}} est dérivable sur {J} et {g'=\dfrac1{f'\circ f^{-1}}}.

Cas usuels de dérivation composée

La dérivée de la fonction puissance {x\mapsto x^{\alpha}} est {x\mapsto \alpha\,x^{\alpha-1}} (c’est vrai sur {\mathbb{R}^{+*}} pour tous les {\alpha}; c’est prolongeable en {0} si {\alpha>1}; c’est prolongeable sur {\mathbb{R}^{-*}} pour les exposants entiers).

Par composition, on en déduit en particulier les résultats suivants (on suppose que {f} est dérivable et qu’on a réglé les problèmes de définition) :
{\begin{array}{rl}(f^{\alpha})'=\alpha\,f'\,f^{\alpha-1}&\bigl(\sqrt{f}\bigr)'=\dfrac{f'}{2\,\sqrt{f}}\\\\\bigl(\ln\left|f\right|\bigr)'=\dfrac{f'}{f}&\bigl(\text{e}^{f}\bigr)'=f'\,\text{e}^{f}\end{array}}

Si {f,g} sont dérivables alors : {\begin{array}{rl}\bigl(f^{g}\bigr)'&=\bigl(e^{g\ln(f)}\bigr)'=\bigl(g\ln(f)\bigr)'\,f^{g}\\\\&=\Bigl(g'\ln(f)+\dfrac{gf'}{f}\Bigr)f^{g}=g'\ln(f)f^{g}+gf'f^{g-1}\end{array}}

Rappel sur la dérivation des fonctions trigonométriques inverses

La dérivée de {x\to\sin x} sur {\Big[-\dfrac\pi2,\dfrac\pi2\Big]} est {x\to\cos x}, nulle en {\pm\dfrac\pi2}. On en déduit : {\forall\, x\in\,]-1,1[,\;\arcsin'x=\dfrac1{\sin'(\arcsin x)}=\dfrac1{\cos(\arcsin x)}=\dfrac 1{\sqrt{1-x^2}}}
La dérivée de {x\to\cos x} sur {[0,\pi]} est {x\to-\sin x}, nulle en {x=0} et {x=\pi}. On en déduit : {\forall\, x\in\,]-1,1[,\;\arccos'x=\dfrac1{\cos'(\arccos x)}=\dfrac{-1}{\sin(\arccos x)}=\dfrac {-1}{\sqrt{1-x^2}}}
On rappelle que les courbes représentatives des fonctions {x\mapsto \arcsin x} et {x\mapsto \arccos x} présentent une demi-tangente verticale aux points d’abscisse {-1} et {1}, ce qui résulte du théorème de la limite de la dérivée.

La dérivée de {x\to\tan x} sur {\Big]-\dfrac\pi2,\dfrac\pi2\Big[} est {x\to1+\tan^2x}, toujours non nulle. On en déduit : {\forall\, x\in\mathbb{R},\;\arctan'x=\dfrac1{\tan'(\arctan x)}=\dfrac{1}{1+\tan^2(\arctan x)}=\dfrac {1}{1+x^2}}

Approximation d’un zéro par la méthode de Newton

Soit {f} une fonction de classe {\mathcal{C}^{1}} sur un intervalle {I}.

On suppose que {f'} ne s’annule pas, mais que {f} s’annule en un point {\alpha} de {I}.

La méthode d’approximation de {\alpha} par la “méthode de Newton”, consiste en les étapes suivantes :

  • Initialisation : on part d’une valeur {x_{0}} (plutôt proche de {\alpha}).
  • Si {x_{n}} est connu dans {I}, on mène la tangente {\Delta_{n}} au point d’abscisse {x_{n}} de la courbe de {f}.

    D’équation {y=f(x_{n})+(x-x_{n})f'(x_{n})}, elle recoupe {Ox} au point d’abscisse {x_{n}-\dfrac{f(x_{n})}{f'(x_{n})}}.

    Si cette abscisse est dans {I}, on la nomme {x_{n+1}} et on continue à partir de {x_{n+1}}.

  • Dans la pratique, on se donne {\varepsilon>0}, et on s’arrête dès que {\left|{x_{n+1}-x_{n}}\right|\le\varepsilon}.

On note {h} un “petit réel positif” (par défaut {h=10^{-3}}) qui approche {f'(x)} par {\dfrac{f(x+h)-f(x)}{h}}.

Voici une fonction Python newton(f,{x_{0}},eps,h), avec {\varepsilon=10^{-8}} par défaut.

def newton(f,x0,eps=1e-8,h=1e-3):
(xn, xn1) = (x0, x0+2*eps)
while abs(xn1-xn) > eps:
xn = xn1
d = (f(xn+h)-f(xn))/h
xn1 = xn – f(xn)/d
return xn

Voici un exemple d’utilisation.
On obtient ici une valeur approchée des trois racines de {f(x)=x^{3}-2x^{2}-x+1}.

>>> def f(x): return x*x*x-2*x*x-x+1
>>> newton(f,-0.8)
-0.801937729356303
>>> newton(f,0.5)
0.5549581324591675
>>> newton(f,2)
2.2469796051199724

Page suivante : Rolle et accroissements finis