En théorie des probabilités, le lemme de Scheffé est un critère de convergence en loi concernant les suites de variables aléatoires à densité.

Énoncé et démonstration

Remarques.

  • De manière un peu surprenante, lorsque des fonctions sont positives et ont la même intégrale, on est donc affranchi des hypothèses habituelles de majoration uniforme de l'erreur apparaissant dans le théorème de convergence dominée.
  • En général, on applique le lemme de Scheffé dans le cas où   E = R d   {\displaystyle \ E=\mathbb {R} ^{d}\ } et où la mesure μ est la mesure de Lebesgue : les variables aléatoires apparaissant dans le lemme sont alors des variables "à densité".
  • Un autre cadre d'application du lemme de Scheffé concerne des densités par rapport à la mesure de comptage μ sur E = Z d   {\displaystyle E=\mathbb {Z} ^{d}\ }  : les variables aléatoires apparaissant dans le lemme sont alors des variables "discrètes" et la densité f n   {\displaystyle f_{n}\ } de Xn est définie, pour k Z d ,   {\displaystyle k\in \mathbb {Z} ^{d},\ } par
f n ( k )   =   P ( X n = k ) . {\displaystyle f_{n}(k)\ =\ \mathbb {P} \left(X_{n}=k\right).}
Dans ce cadre, il découle du lemme de Scheffé que Xn converge en loi vers X si (et seulement si) :
k Z d , lim n P ( X n = k )   =   P ( X = k ) . {\displaystyle \forall k\in \mathbb {Z} ^{d},\qquad \lim _{n}\mathbb {P} \left(X_{n}=k\right)\ =\ \mathbb {P} \left(X=k\right).}
  • Sous les hypothèses du lemme de Scheffé, on obtient en fait une convergence plus forte que la convergence en loi :
A E , | P ( X n A ) P ( X A ) |     f n f 1 . {\displaystyle \forall A\in {\mathcal {E}},\quad \left|\mathbb {P} \left(X_{n}\in A\right)-\mathbb {P} \left(X\in A\right)\right|\ \leq \ \Vert f_{n}-f\Vert _{1}.}
La convergence des probabilités est donc uniforme sur E .   {\displaystyle {\mathcal {E}}.\ } Pourtant, la convergence en loi, d'ordinaire, ne s'accompagne pas forcément d'une convergence simple (ni, a fortiori, d'une convergence uniforme) sur E   {\displaystyle {\mathcal {E}}\ }  : par exemple, si Y est gaussien standard, si X n = Y / n , A = { 0 } ,   {\displaystyle X_{n}=Y/n,\quad A=\{0\},\ } alors
lim n P ( X n A ) = 0 1 = P ( 0 A ) , {\displaystyle \lim _{n}\mathbb {P} \left(X_{n}\in A\right)=0\neq 1=\mathbb {P} \left(0\in A\right),}
alors que, pour autant, Xn converge en loi vers 0.

Applications

Convergence de la loi de Student vers la loi normale

Un exemple d'application est la convergence de la loi de Student vers la loi normale. Pour k ≥ 1, la loi de Student à k degrés de liberté a pour densité

f k ( t ) = 1 k π Γ ( k 1 2 ) Γ ( k 2 ) 1 ( 1 t 2 k ) k 1 2 , {\displaystyle f_{k}(t)={\frac {1}{\sqrt {k\pi }}}{\frac {\Gamma \left({\frac {k 1}{2}}\right)}{\Gamma \left({\frac {k}{2}}\right)}}{\frac {1}{\left(1 {\frac {t^{2}}{k}}\right)^{\frac {k 1}{2}}}},}

où Γ désigne la fonction Gamma d'Euler. Pour tout t R , {\displaystyle t\in \mathbb {R} ,} on a :

lim k ( 1 t k ) k = e t , {\displaystyle \lim _{k}\left(1 {\frac {t}{k}}\right)^{k}=\mathrm {e} ^{t},}

et donc

lim k 1 ( 1 t 2 k ) k 1 2 = lim k 1 ( 1 t 2 k ) k 2 × lim k ( 1 t 2 k ) 1 2 = ( lim k ( 1 t 2 k ) k ) 1 2 = e t 2 / 2 . {\displaystyle {\begin{aligned}\lim _{k}{\frac {1}{\left(1 {\tfrac {t^{2}}{k}}\right)^{\tfrac {k 1}{2}}}}&=\lim _{k}{\frac {1}{\left(1 {\tfrac {t^{2}}{k}}\right)^{\tfrac {k}{2}}}}\times \lim _{k}\left(1 {\tfrac {t^{2}}{k}}\right)^{-{\tfrac {1}{2}}}\\&=\left(\lim _{k}\left(1 {\tfrac {t^{2}}{k}}\right)^{k}\right)^{-{\tfrac {1}{2}}}=\mathrm {e} ^{-t^{2}/2}.\end{aligned}}}

On a aussi

lim t Γ ( t α ) Γ ( t ) t α = 1 , {\displaystyle \lim _{t\uparrow \infty }{\frac {\Gamma (t \alpha )}{\Gamma (t)t^{\alpha }}}=1,}

d'où, en posant t=k/2

lim k 1 k π   Γ ( k 1 2 ) Γ ( k 2 ) = 1 2 π   lim t Γ ( t 1 2 ) Γ ( t ) t   =   1 2 π . {\displaystyle \lim _{k}{\frac {1}{\sqrt {k\pi }}}\ {\frac {\Gamma ({\frac {k 1}{2}})}{\Gamma ({\frac {k}{2}})}}={\frac {1}{\sqrt {2\pi }}}\ \lim _{t\uparrow \infty }{\frac {\Gamma (t {\frac {1}{2}})}{\Gamma (t){\sqrt {t}}}}\ =\ {\frac {1}{\sqrt {2\pi }}}.}

Donc

lim k f k ( t ) = 1 2 π   e t 2 / 2 . {\displaystyle \lim _{k}f_{k}(t)={\frac {1}{\sqrt {2\pi }}}\ e^{-t^{2}/2}.}

CQFD

Convergence de la loi binomiale vers la loi de Poisson

Pour n ≥ 1 et 0 ≤ pn ≤ 1, la loi binomiale de paramètres n et pn a pour densité, par rapport à la mesure de comptage sur   Z ,   {\displaystyle \mathbb {Z} ,\ } la fonction (fn) définie sur Z   {\displaystyle \mathbb {Z} \ } par

f n ( k )   =   ( n k ) p n k ( 1 p n ) n k   1 0 k n . {\displaystyle f_{n}(k)\ =\ {n \choose k}p_{n}^{k}(1-p_{n})^{n-k}\ 1_{0\leq k\leq n}.}

La suite (fn) converge simplement vers la fonction f définie par :

f ( k )   = e λ   λ k k !   1 k 0 , {\displaystyle f(k)\ =\mathrm {e} ^{-\lambda }\ {\frac {\lambda ^{k}}{k!}}\ 1_{k\geq 0},}

dès que

lim n n p n   =   λ ,   λ > 0. {\displaystyle \lim _{n}n\,p_{n}\ =\ \lambda ,\quad \ \lambda >0.}

Ainsi, en conséquence du lemme de Scheffé, dès que lim n n p n   =   λ > 0 ,   {\displaystyle \lim _{n}n\,p_{n}\ =\ \lambda >0,\ } , la loi binomiale de paramètres n et pn converge vers la loi de Poisson de paramètre λ.

Variante discrète

Sous certaines conditions, on peut adapter le lemme de Scheffé pour démontrer la convergence de lois discrètes vers des lois à densité. Pour un vecteur x R d {\displaystyle x\in \mathbb {R} ^{d}} , notons x   {\displaystyle \left\lfloor x\right\rfloor \ } le vecteur de coordonnées x i   {\displaystyle \left\lfloor x_{i}\right\rfloor \ } , 1 i d {\displaystyle 1\leq i\leq d} . Alors

Une fois cette dernière démonstration faite, le lemme de Scheffé discret dispense de trouver une majoration du terme d'erreur

| a n d   P ( X n = a n x ) f ( x ) | , {\displaystyle \left|a_{n}^{d}\ \mathbb {P} \left(X_{n}=\left\lfloor a_{n}x\right\rfloor \right)-f(x)\right|,}

uniforme pour x A , {\displaystyle x\in A,} ce qui serait une manière plus lourde de montrer que

lim n   P ( X n / a n A )   =   lim n   k ( a n A ) Z d   P ( X n = k )   =   A   f ( x ) d x . {\displaystyle \lim _{n}\ \mathbb {P} \left(X_{n}/a_{n}\in A\right)\ =\ \lim _{n}\ \sum _{k\in (a_{n}\,A)\cap \mathbb {Z} ^{d}}\ \mathbb {P} \left(X_{n}=k\right)\ =\ \int _{A}\ f(x)dx.}

Habituellement, un contrôle uniforme de la rapidité de convergence des termes de la somme est nécessaire pour assurer la convergence du terme de gauche de l'égalité (le terme de gauche est une somme finie dont le nombre de termes tend vers l'infini) vers l'intégrale limite. Dans ce cas précis, grâce au lemme de Scheffé, la convergence des termes de la somme, renormalisés, suffit pour assurer la convergence du terme de gauche de l'égalité.

Distance entre deux points au hasard d'un arbre de Cayley aléatoire

La loi de la distance Dn entre deux points au hasard d'un arbre de Cayley aléatoire, est donnée, pour 0     k     n 1 ,   {\displaystyle 0\ \leq \ k\ \leq \ n-1,\ } par

P ( D n = k )   =   ( k 1 ) × ( n ) k 1 n k 2 . {\displaystyle \mathbb {P} \left(D_{n}=k\right)\ =\ {\frac {(k 1)\times (n)_{\downarrow k 1}}{n^{k 2}}}.}

En vertu de la bijection de Joyal, c'est aussi la loi du nombre de points cycliques d'une application de [ [ 1 , n ] ] {\displaystyle [\![1,n]\!]} dans [ [ 1 , n ] ] .   {\displaystyle [\![1,n]\!].\ } Cette loi discrète apparaît aussi dans des problèmes d'allocations (boules et urnes), dont le fameux problème des anniversaires. Lorsqu'on alloue séquentiellement des boules dans un ensemble de n urnes, avec équiprobabilité, ce qui revient à considérer un univers probabiliste Ω   =   [ [ 1 , n ] ] N ,   {\displaystyle \Omega \ =\ [\![1,n]\!]^{\mathbb {N} },\ } le rang T n ( ω )   {\displaystyle T_{n}(\omega )\ } de la première boule à être allouée dans une urne non vide suit la même loi que 2 Dn : pour 2     k     n 1 ,   {\displaystyle 2\ \leq \ k\ \leq \ n 1,\ }

P ( T n = k )   =   P ( D n = k 2 ) . {\displaystyle \mathbb {P} \left(T_{n}=k\right)\ =\ \mathbb {P} \left(D_{n}=k-2\right).}

On peut montrer, à l'aide du lemme de Scheffé, que

En conséquence :

  • la distance "typique" entre deux points d'un arbre de taille n est de l'ordre de n   {\displaystyle {\sqrt {n}}\ } ;
  • T n / n {\displaystyle T_{n}/{\sqrt {n}}} converge en loi vers la loi de Rayleigh. Dans le cadre du problème des anniversaires, où l'on choisit n=365, T n ( ω )   {\displaystyle T_{n}(\omega )\ } s'interprète comme la taille du groupe pour laquelle il devient probable qu'au moins deux membres du groupe ait la même date d'anniversaire (il faut imaginer un groupe dont l'effectif augmente progressivement) : la probabilité que dans un groupe de α n   {\displaystyle \alpha {\sqrt {n}}\ } personnes, toutes les dates d'anniversaire soit différentes, peut être estimée comme suit :
P ( T n > α n ) = P ( T n / n   > α ) α x   exp ( x 2 / 2 ) d x   =   e α 2 / 2 , {\displaystyle \mathbb {P} \left(T_{n}>\alpha {\sqrt {n}}\right)=\mathbb {P} \left(T_{n}/{\sqrt {n}}\ >\alpha \right)\simeq \int _{\alpha }^{ \infty }x\ \exp \left(-x^{2}/2\right)dx\ =\ e^{-\alpha ^{2}/2},}
et vaut donc 1/2 pour un groupe d'approximativement 365 × 2 ln ( 2 )   {\displaystyle {\sqrt {365\times 2\ln(2)}}\ } (soit 22,5) personnes, ou bien 1/10 pour un groupe d'approximativement 365 × 2 ln ( 10 )   {\displaystyle {\sqrt {365\times 2\ln(10)}}\ } (soit 41) personnes. Le calcul exact du premier entier tel que cette probabilité soit plus petite que 1/2 (respectivement 1/10) donne les mêmes résultats : 23 (respectivement 41).

Un contre-exemple : la marche aléatoire simple symétrique

Notons Sn la position de la marche aléatoire simple symétrique au temps n. Abraham De Moivre a montré que S n / n {\displaystyle S_{n}/{\sqrt {n}}} converge en loi vers e x 2 / 2 / 2 π   d x .   {\displaystyle e^{-x^{2}/2}/{\sqrt {2\pi }}\ dx.\ } Ce faisant, Abraham De Moivre a mis à son compte 3 « premières » :

  • première apparition de la loi normale,
  • première version du théorème central limite,
  • découverte et première utilisation de la formule de Stirling.

Malheureusement, on ne peut pas appliquer directement le lemme de Scheffé discret pour prouver le résultat de De Moivre. En effet :

lim sup n n   P ( S n = n   x ) = 2 e x 2 / 2 / 2 π , {\displaystyle \limsup _{n}{\sqrt {n}}\ \mathbb {P} \left(S_{n}=\left\lfloor {\sqrt {n}}\ x\right\rfloor \right)=2e^{-x^{2}/2}/{\sqrt {2\pi }},}

et

lim inf n n   P ( S n = n   x ) = 0. {\displaystyle \liminf _{n}{\sqrt {n}}\ \mathbb {P} \left(S_{n}=\left\lfloor {\sqrt {n}}\ x\right\rfloor \right)=0.}

Comme Sn est de même parité que n la suite P ( S n = n x )   {\displaystyle \mathbb {P} \left(S_{n}=\left\lfloor {\sqrt {n}}x\right\rfloor \right)\ } prend la valeur zero pour une infinité d'indices, ceux pour lesquels n   x {\displaystyle \left\lfloor {\sqrt {n}}\ x\right\rfloor } et n n'ont pas la même parité : dès que x 0 , {\displaystyle x\neq 0,} on peut vérifier à la main que 2 n   x {\displaystyle \left\lfloor {\sqrt {2n}}\ x\right\rfloor } est impair pour une infinité d'indices (et pair pour une infinité d'indices également), un constat analogue pouvant être fait pour   2 n 1   x . {\displaystyle \ \left\lfloor {\sqrt {2n 1}}\ x\right\rfloor .} En revanche, lorsque n   x {\displaystyle \left\lfloor {\sqrt {n}}\ x\right\rfloor } et n ont même parité, on a :

P ( S n = n x )   =   ( n ( n n x ) / 2 )   2 n . {\displaystyle \mathbb {P} \left(S_{n}=\left\lfloor {\sqrt {n}}x\right\rfloor \right)\ =\ {n \choose \left(n \left\lfloor {\sqrt {n}}x\right\rfloor \right)/2}\ 2^{-n}.}

La formule de Stirling conduit alors à la limite annoncée, 2 e x 2 / 2 / 2 π .   {\displaystyle 2\,e^{-x^{2}/2}/{\sqrt {2\pi }}.\ } On peut cependant adapter la démonstration du lemme de Scheffé discret à ce cas particulier : il suffit de poser

Y n = S n 1 n  impair 2 U n . {\displaystyle Y_{n}={\frac {S_{n}-1_{n{\text{ impair}}} 2U}{\sqrt {n}}}.}

Alors Yn a pour densité

n 2   P ( S n = 1 n  impair 2 n x 2 )     e x 2 / 2 / 2 π , {\displaystyle {\frac {\sqrt {n}}{2}}\ \mathbb {P} \left(S_{n}=1_{n{\text{ impair}}} 2\left\lfloor {\frac {{\sqrt {n}}x}{2}}\right\rfloor \right)\ \simeq \ \,e^{-x^{2}/2}/{\sqrt {2\pi }},}

toujours via la formule de Stirling. Ainsi Yn converge en loi vers la loi normale, en vertu du lemme de Scheffé. Mais, comme plus haut,

Y n S n n   =   O ( 1 n ) . {\displaystyle \left\Vert Y_{n}-{\frac {S_{n}}{\sqrt {n}}}\right\Vert \ =\ {\mathcal {O}}\left({\frac {1}{\sqrt {n}}}\right).}

Le théorème de de Moivre résulte alors de la convergence en loi de Yn et du théorème de Slutsky.

Notes et références

À voir

Bibliographie

  • (en) Rick Durrett, Probability : Theory and Examples, Thomson Brooks/Cole (Belmont, CA), coll. « Duxbury advanced series », , 3e éd., 497 p. (ISBN 0-534-42441-4), Section II.2.a., page 81.

Pages liées

  • Loi de probabilité
  • Densité de probabilité
  • Convergence de variables aléatoires


  • Portail des probabilités et de la statistique

Lemme de Scheffé Définition et Explications

New Publication by Professor Lemme and Colleagues « Electrical

Schlemmen an der Saarschleife Restaurant Hotel zur Saarschleife

Lemme Matcha Superfood Energy Gummies with Organic Matcha

Steffi Lemke WELT