Interpolation, dérivation et integration numérique

Interpolation

Supposons que l'on dispose d'un certain nombre de points, notés x_i, auxquels on associe des valeurs y_i, qui peuvent être par exemple des résultats de mesures. On souhaite déterminer une fonction qui permette de calculer la réponse y à un entrée x non comprise dans les x_i de départ.

1) Lorsque les points x_i sont "peu nombreux", on peut chercher à construire une fonction passant exactement par les y_i. Dans cette optique, l'idée la plus simple est de chercher un polynôme p de degré n qui vérifie, pour des couples de réels (x_i, p_i) donnés,

p(x_i) = p_i.

La solution la plus évidente est d'écrire

p(x) = a₀ + ... + a_ixⁱ,

puis d'identifier les coefficients a_i en écrivant les conditions p(x_i) = p_i pour chaque x_i. On est amené à former la matrice, dite de Vandermonde, associée aux points x_i. Il faut ensuite l'inverser pour déterminer p(x) ...

Une solution plus intéressante consiste à former la base des polynômes de Lagrange, définis par

q_k(x) = (x-x₀)...(x-x_k-1)(x-x_k+1)...(x-x_n) / [(x_k-x₀)....(x_k-x_k-1)(x_k-x_k+1)...(x_k-x_n)]

On a q_k(x_j) = 1 si k = j et 0 sinon, et le polynôme p(x) = p₀q₀(x) + ... + p_nq_n(x) satisfait alors les conditions voulues.

Les problèmes d'interpolation de Lagrange font intervenir les valeurs de polynômes en certains points, mais ne tiennent pas compte des dérivées. Si les valeurs des dérivées sont données, on parle d'interpolation d'Hermite. Si l'on donne par exemple les valeurs d'une fonction et de sa dérivée en deux points x₀ et x₁, on peut construire un polynôme de degré 3 à partir d'une base de quatre polynômes vérifiant des conditions dont l'écriture est inspirée de celles de Lagrange.

L'interpolation d'une fonction pose des problèmes liés à l'amplitude des oscillations engendrées par un polynôme de degré élevé. On peut limiter cet inconvénient en réalisant des interpolations par intervalles. Avec Lagrange, on aura une discontinuité de la dérivée première à chaque borne d'intervalles, et de la dérivée seconde avec Hermite.

2) Lorsque les x_i sont "nombreux", le degré des polynômes d'interpolation augmente et avec lui le risque de fortes oscillations ne correspondant pas forcément à la fonction que l'on souhaite approximer. On peut alors choisir de construire des approximations par morceaux de faible degré, les différents "morceaux" étant indépendants les uns des autres ou bien liés par des conditions de continuité de pente voire de courbure (c'est le principe des splines), ou encore des approximations globales ne passant pas exactement par les y_i mais minimisant l'erreur entre les y_i et les f(x_i) (c'est le principe des méthodes de moindre carré).

- Les splines cubiques sont des polynômes de degré 3 permettant d'obtenir une continuité en pente et en courbure et qui constituent un bon compromis entre complexité et précision. Sur chaque intervalle, la spline est déterminée par les quatre coefficients du polynôme, ce qui porte à 4n le nombre d'inconnues pour les n-1 intervalles. L'égalité des valeurs de splines "voisines" sur les n-1 points intérieurs conduit à écrire 2(n-1) conditions. L'égalité des pentes et des courbures en ces n-1 points conduit à écrire 2(n-1) conditions supplémentaires. Les valeurs imposées en x₁ et x_n amènent 2 autres équations. Il manque donc deux équations pour pouvoir déterminer tous les coefficients, équations qui sont obtenues en spécifiant les valeurs des dérivées secondes en x₁ et x_n.

- Approximation linéaire par les moindres carrés : si une droite y = ax + b doit minimiser la somme quadratique S des erreurs (y_i-a-bx_i), on peut déterminer a et b en écrivant que dS/da et dS/db sont nuls, ce qui conduit à résoudre un système de la forme
a.n + b.Σ_i=1,n x_i = Σ_i=1,n y_i
a.Σ_i=1,n x_i + b. Σ_i=1,n x_i²= Σ_i=1,n x_iy_i

Dérivation numérique

On peut partir de l'opérateur de différence première progressive pour calculer la dérivée d'une fonction f en un point x₀

f '(x₀) = lim_h->0 [(f(x₀+h)-f(x₀)) / h]

mais également de ses homologues rétrograde et centrée :
f '(x₀) = lim_h->0 [(f(x₀)-f(x₀-h)) / h]
et
f '(x₀) = lim_h->0 [(f(x₀+h)-f(x₀-h)) / 2h]

On utilise numériquement une valeur de h "suffisamment" petite pour que l'approximation soit assimilable à un passage à la limite.
Il faut ajouter une précision, cependant, sur la ... précision d'un calcul numérique de dérivée. Si n est la précision relative du calculateur, l'erreur absolue |x-x_app| obtenue sur l'évaluation x_app du nombre x est de l'ordre de nx. Donc l'erreur absolue commise sur l'évaluation de la dérivée en x₀ est de l'ordre de 2n |f(x₀)| / h. On voit donc que, si la précision relative du calculateur n'est pas suffisante, un h trop petit aura des conséquences sur la précision de l'approximation effectuée. C'est l'erreur d'arrondi.
Si les differences finies progressive et rétrograde sont la source d'une erreur de troncature d'ordre 1 en h, la différence finie centrée est la source d'une erreur d'ordre 2 en h.

On peut obtenir des approximations plus précises de la dérivée en un point, par exemple à l'aide de l'extrapolation de Richardson. Il est facile de montrer, par un développement limité à l'ordre 5, que l'on a une approximation de la différence finie centrée avec

f'(x₀) + f'''(x₀).h² / 24 + O(h⁴)

En réécrivant ce développement avec h/2 au lieu de h, on arrive par combinaison linéaire des deux développements à :

f'(x₀) = [8f(x₀+h/4)-8f(x₀-h/4)+f(x₀-h/2)-f(x₀+h/2)] / 3h

Le principe de l'extrapolation de Richardson est d'ailleurs valable dans bon nombre de cas. Supposons que l'on dispose d'une approximation numérique q_app(h) d'une certaine quantité q_exa inconnue. L'approximation est fonction du paramètre numérique h. Supposons que l'approximation soit d'ordre n. On a donc

q_exa = q_app(h) + c_nhⁿ + c_n+1hⁿ⁺¹ + ...

Les constantes c_n dépendent de la méthode numérique utilisée. Remplaçons h par h/2 dans l'équation précédente. On a alors

q_exa = q_app(h/2) + c_n(h/2)ⁿ + c_n+1(h/2)ⁿ⁺¹ + ...

En multipliant cette équation par 2ⁿ et en lui soustrayant la première, on peut faire disparaître le terme d'ordre n :

(2ⁿ-1)q_exa = 2ⁿq_app(h/2) - q_app(h) - c_n+1hⁿ⁺¹/2 - ...

soit

q_exa = [2ⁿq_app(h/2) - q_app(h)] / (2ⁿ-1) + O(hⁿ⁺¹)

L'extrapolation de Richardson permet donc de gagner au moins un ordre de convergence, voire davantage si c_n+1 = 0 dès le départ.

Intégration numérique

Les méthodes d'intégration numérique s'appuient sur une approximation de la fonction à intégrer par des fonctions plus simples, le plus souvent des polynômes. C'est en faisant varier le degré de ces polynômes que l'on obtient la plupart des méthodes présentées ci-dessous.

Méthodes de Newton-Cotes : trapèzes, rectangles, Simpson ...

Les méthodes de Newton-Cotes rassemblent les techniques d'intégration qui consistent à approximer une fonction par un polynôme, puis à intégrer ledit polynôme sur l'intervalle voulu. La plus simple est la méthode des trapèzes, où l'on choisit un polynôme du premier degré prenant les mêmes valeurs que la fonction aux bornes de l'intervalle. Cela revient à faire une somme pondérée de valeurs de la fonction en des points à déterminer, puisque l'on approche ∫_a->b f(x) par

[(f(a) + f(b))(b-a) / 2]

Il est évidemment intéressant de découper l'intervalle principal, et de répéter la méthode des trapèzes dans chaque sous-intervalle. Si l'on note h = (b-a)/n la longueur de chacun, on peut montrer que l'erreur globale est donnée par (b-a)/12 f''(u) h², pour u dans [a,b]. La méthode des trapèzes est donc d'ordre 2.

Le degré de précision d'une méthode d'intégration étant donné par la valeur maximale de n pour laquelle ladite méthode intègre exactement un polynôme de degré inférieur ou égal à n, il est évident que la méthode des trapèzes est de degré 1.

La méthode du rectangle est dans l'idée aussi simple que celle des trapèzes, puisqu'elle approche ∫_a->b f(x) par

(b-a).f((a+b)/2)

On utilise ici la valeur de la fonction en le point milieu de chaque (sous-)intervalle, et l'on suppose que la fonction prend une valeur constante sur cet intervalle. On peut la ranger dans les méthodes de Newton-Cotes en considérant que cela consiste à approximer la fonction par un polynôme de degré 0 ...

Si l'on approxime la fonction par un polynôme de degré 2, on tombe sur les méthodes de Simpson. Il faut évidemment trois points dans chaque intervalle : les deux extrémités et le point milieu.. On a alors

∫_a->b f(x) ~ (b-a) (f(a) + 4f((a+b)/2) + f(b)) / 3

On l'appelle formule de Simpson 1/3, du fait du coefficient qui apparaît dans la pondération. C'est en fait une moyenne des méthodes des trapèzes et des rectangles, qui associe aux trois points les poids respectifs 1/3, 4/3 et 1/3.

On peut montrer que la méthode de Simpson 1/3 composée (c'est-à-dire appliquée après décomposition en sous-intervalles) est d'ordre 4 en h, et de degré 3.

En utilisant un polynôme de degré 3, on tombe sur la méthode de Simpson 3/8 :

∫_a->b f(x) ~ 3/8 (f(a) + 3f((2a+b)/3) + 3f((a+2b)/3) + f(b)) (b-a)

Cette variante n'est pourtant pas plus performante (en termes d'erreur et de degré) que sa cousine 1/3, qu'on lui préfère donc généralement puisque moins coûteuse.

La formule de Boole part d'un polynôme du quatirème degré, et on a l'approximation suivante :

∫_a->b f(x) ~ 2/45 (7f(a) + 32f((3a+b)/4) + 12f((a+b)/2) + 32f((3a+b)/4) + 7f(b)) (b-a)

Cette approximation est d'ordre 6 et de degré 5.

Méthode de Romberg

La méthode de Romberg est basée sur une utilisation de la méthode des trapèzes combinée à l'extrapolation de Richardson. En effet, le terme d'erreur de la méthode des trapèzes ne contient que des puissances paires de h. On gagnera donc deux ordres de convergence au lieu d'un seul à chaque extrapolation. Notons T_1,i le résultat obtenu avec 2^i-1 intervalles. Pour passer de T_1,i à T_1,i+1, on doit doubler le nombre d'intervalles, donc diviser h par 2. On définit alors, grâce à l'extrapolation de Richardson :

T_2,i = (2²T_1,i+1 - T_1,i) / (2²-1)

puis, de la même manière

T_3,i = (2⁴T_2,i+1 - T_2,i) / (2⁴-1)

T_4,i = (2⁶T_3,i+1 - T_3,i) / (2⁶-1)

etc ...

On peut alors définir un triangle de la forme

T_1,1 T_1,2 T_1,3 T_1,4...

T_2,1 T_2,2 T_2,3...

T_3,1 T_3,2...

T_4,1...

Chaque ligne est plus précise de deux ordres de convergence que la précédente. Et sur chaque ligne la précision augmente lorsque l'on se dirige vers la droite puisque la taille des sous-intervalles est divisée par 2 à chaque pas.

Quadratures de Gauss

L'idée de l'intégration de Gauss-Legendre est de placer les points x_i de manière optimale (et non régulière comme dans les méthodes de Newton-Cotes) et de déterminer les poids w_i associés de manière à ce que la quadrature soit exacte pour des polynômes de degré aussi grand que possible.

Ainsi, en raisonnant sur l'intervalle [-1,1] (que l'on peut évidemment ramener à n'importe quel intervalle [a.b] par changementde variable), on va déterminer les termes inconnus x_i et w_i de l'approximation ∫_-1=>1 f(x) ~ w₁f(x₁) + w₂f(x₂) en appliquant cette quadrature aux fonctions f(x) = 1, f(x) = x, f(x) = x² et f(x) = x³. On obtient un système non-linéaire mais résoluble analytiquement, qui donne les deux points +/- sqrt(1/3) et les poids associés 1 et 1. La formule de Gauss à deux points est de degré 3. Plus généralement, on peut montrer que la formule de Gauss-Legendre à n points est exacte pour des polynômes de degré 2n-1, et que les points d'intégration sont les racines des polynômes de Legendre définis par L₀(x) = 1, L₁(x) = x et la formule de récurrence :

(n+1)L_n+1(x) = (2n+1)xL_n(x) - nL_n-1(x)