[SON] [AUDIO_VIDE] Bonjour. Cette séance 4, du cours 3, est particulièrement fondamentale puisqu'elle va nous permettre de définir l'espérance d'une variable aléatoire à valeurs réelles. Nous verrons, en fait, que construire cette espérance, revient, en fait, à construire l'intégrale de Lebesgue, même si nous n'allons pas donner les détails des preuves des théorèmes, et là , je vous renvoie à un cours d'intégration sur l'intégration Lebesgue, cours d'intégration théorie de la mesure, ici, je vais juste vous donner les idées de la construction de l'espérance dans ce cadre général, et vous donner quelques éléments de preuve et je vous dirai, là où il y a de grosses parties de théorème, qui sont admises. Alors, quel est le problème? Nous avons vu ce que c'était que l'espérance pour une variable aléatoire à valeurs dénombrables, et nous avons que dans ce cas-là , c'était important de définir sur l'espace abstrait oméga l'espérance d'une variable aléatoire X, et par définition, donc, dans le cas dénombrable, l'espérance de X, c'est la somme de la probabilité, donc la somme sur tous les singletons possibles de grand Oméga, si Oméga est fini ou dénombrable, on peut faire cette somme, donc somme des probabilités de réalisation du singleton oméga, fois la valeur de X en ce point oméga. Et nous avions vu dans le cadre des 'iii' toujours que par transfert sur l'espace des valeurs de X, nous avons montré que cette espérance, ici, définie en tant qu'objet abstrait, et aussi égale à la somme sur l'ensemble de toutes les valeurs de X, qui là , aussi, bien sûr, est un ensemble dénombrable, donc une somme finie ou dénombrable ici, somme des valeurs de grand X, petit x, fois la probabilité d'avoir X égale x. Donc, si grand Oméga est fini ou dénombrable, tout ceci est parfaitement défini. Donc, maintenant, on suppose que notre variable aléatoire est à valeurs réelles, mais elle peut prendre un nombre infini non dénombrable de valeurs, elle est définie de Oméga à valeurs réelles et on ne peut pas généraliser cette notion, parce qu'on ne sait pas définir dans le cas général la somme sur une infinité non dénombrable d'éléments. Alors, comment allons-nous faire? Alors, en fait, vous voyez, cet espace abstrait Oméga, on ne le connaît pas très bien, il n'a pas de structure topologique, donc on ne va pas pouvoir faire grand chose sur l'espace Oméga. En revanche, l'espace d'arrivée, lui est bien connu, et ça était l'idée géniale de Lebesgue, de se dire que pour construire l'espérance, dont on va voir qu'en fait, c'est une intégrale, qu'on veut définir une notion d'intégrale qu'on veut définir sur l'espace abstrait Oméga. Eh bien, pour construire l'espérance où cette intégrale sur Oméga, on va non pas découper, comme on le fait pour définir l'intégrale de Riemann, l'espace de départ grand Oméga, mais on va en quelque sorte découper l'espace d'arrivée. Alors, pour ce faire, on va d'abord faire une remarque absolument triviale, c'est que même si Oméga n'est pas finie ou dénombrable, si en revanche on considère une variable aléatoire définie sur Oméga, qui n'a qu'un nombre fini de valeurs, donc ici, une variable aléatoire Y, qui prend les valeurs a1, a2, ap. Eh bien, on va pouvoir découper grand Oméga en fonction des valeurs que prend la valeur Y, c'est-à -dire qu'on va pouvoir écrire que grand Oméga, c'est la réunion des événements aléatoires Y égale ai et si je fais varier i de 1 à p, je vais couvrir ainsi tout grand Oméga. Donc, nous allons appliquer alors, cette remarque que nous avions faite ici, en utilisant plus que la caractérisation par la loi de X de la notion d'espérance, nous allons donc utiliser cette remarque pour définir pour une fonction Y définie sur Oméga quelconque mais nombre fini de valeurs, l'espérance de Y comme la somme de i égale 1, à p, de ai, probabilité d'avoir Y égale ai. Donc, ça, bien sûr, c'est un nombre qui est toujours parfaitement défini et on a pas d'état d'âme là -dessus. Alors, maintenant, comment peut-on dans le cas général, donc, définir une généralisation à une somme non dénombrable de cette quantité-là , ce qui revient, en fait, à définir l'intégrale de Lebesgue, intégrale de X de Oméga par rapport à la probabilité P de Oméga, donc, c'est vraiment une mesure abstraite sur Oméga. Donc, l'idée, c'est d'approcher la variable aléatoire X qui nous intéresse, par une suite de variables aléatoires étagées, c'est-à -dire de variables aléatoires qui prennent seulement un nombre fini de valeurs, défini bien sûr, sur le même espace Oméga. Alors, comment on fait ça? En fait, ce qu'on va pouvoir approcher assez facilement, c'est une variable aléatoire positive. Donc, je suppose que X est une variable aléatoire positive, c'est-à -dire que pour tout oméga de grand Oméga, X de oméga est positif. Et je définis ainsi la suite Xn de variables aléatoires étagées qui tend en croissant vers X. Donc, pour tout oméga dans grand Oméga, je vais poser Xn de oméga qui vaut k fois 2 puissance (- n) donc k sur 2 puissance n, si X de oméga est compris entre k sur 2 puissance n, et (k + 1) sur 2 puissance n. Et ce pour toutes valeurs de k compris entre 0 et n fois 2 puissance n, moins 1. Alors, vous voyez que si k vaut n 2 puissance n, moins 1, cette borne ici vaudra n fois 2 puissance n fois 2 puissance moins n, c'est-à -dire n. Donc, ce découpage dyadique, vous l'utilisez pour X compris entre 0 et n. Et puis, si X de oméga est plus grand que n, eh bien, on va poser Xn de oméga égale n. Donc, vous voyez que vous avez construit ainsi une variable aléatoire Xn qui prend un nombre fini de valeurs, soit n, soit les k sur 2 puissance n pour les n 2 puissance n termes que j'ai décrit ici, cette variable aléatoire est à valeurs dans l'intervalle fermé 0, n. Alors, ce qu'on peut remarquer et je vous le laisse vérifier tout seul, c'est que quand oméga fixé, Xn de oméga est toujours plus petit que X(n + 1) de oméga. Ça, c'est une propriété donc, de cette définition avec les nombres dyadiques de la forme k sur 2 puissance n. Si vous regardez X(n + 1), vous allez faire intervenir des intervalles d'amplitude 1 sur 2 puissance n plus 1, qui sont un découpage des intervalles d'amplitude 1 sur 2 puissance n, ça correspond à couper en 2 les intervalles d'amplitude 1 sur 2 puissance n. Bien. Donc, X(n + 1) est plus grand que Xn, et donc, comme ce sont des variables aléatoires à valeurs finies, nous avons vu quand on a étudié l'espérance pour des variables aléatoires à valeurs finies ou dénombrables, que dans ce cas-là , l'espérance, c'est un opérateur monotone, et donc l'espérance de Xn sera plus petite que l'espérance de X(n + 1). Bien. Cette suite-là , c'est une suite de nombres, qui est croissante, donc elle admet toujours une limite qui peut être finie ou infinie. Mais dans tous les cas, on va poser E de X est égale à la limite des espérances de Xn, l'espérance de X égale limite des espérances de Xn, c'est une limite de nombres, une limite croissante de nombres positifs. Donc, ici, par cette définition, l'espérance de X pour une variable positive peut valoir plus l'infini. Alors, bien évidemment dans cette définition ici, l'espérance de X dépend fortement de la suite Xn qui nous avons pris, qui converge en croissant vers X. La grosse partie du théorème que nous n'allons pas montrer ici, est qu'en fait, cette limite, ici, ne dépend pas de la suite de variables aléatoires étagées croissant vers X, que l'on a introduite pour définir l'espérance. Je vous en donne un exemple, mais quelque soit l'exemple que vous prenez, la limite des espérances sera toujours la même. Ça, c'est un gros résultat de maths, qu'on ne va pas voir ici. Ce qu'il faut en revanche comprendre, c'est la construction de cette espérance. Alors, si on fait référence à l'intégrale de Riemann, donc on va se placer dans le cas simple, où ici Oméga est aussi R ou un sous-intervalle de R, et vous avez une fonction définie de R dans R, si on veut définir l'intégrale de f, donc là , vous voyez la fonction qui est ici, qui est la valeur qui est définie sur 0, 4, et à valeurs dans 0, 1. Si on veut définir l'intégrale, donc définit par f, donc l'intégrale de f, c'est la surface qui est définie ici sous la courbe f et coincée ici par l'axe des x et la verticale x égale 4. Eh bien, nous pouvons découper l'intervalle de départ, en petits sous-intervalles de même taille, et fabriquer une suite de fonctions en escaliers, dont vous voyez la valeur à gauche de l'intervalle et égale exactement à la fonction. Bon, ça, je ne vais pas revenir là -dessus, mais ce qu'on sait, c'est que si la longueur de ces intervalles-là tend vers 0, La surface définie par les rectangles qui se trouvent sous ma fonction en escalier va tendre vers la surface sous la fonction f. Hein, donc ça, c'est ce qu'on appelle la convergence des sommes de Riemann vers l'intégrale de f et c'est une manière de définir l'intégrale de Riemann. Donc, vous voyez ici, on a découpé l'intervalle de départ en petits sous-intervalles. Ce que nous savons nous dans notre problème, c'est que l'intervalle de départ, c'est l'ensemble grand oméga qui est abstrait et donc, on ne sait pas comment le découper, on ne sait pas, on ne sait pas mettre une topologie sur oméga pour dire qu'il y a des petites parties qui tendent vers 0 d'une manière ou d'une autre comme on disait qu'ici la longueur de, la largeur de l'intervalle tendait vers 0. Donc, ce qu'on connait bien en revanche, c'est l'espace d'arrivée. Et en fait considérer des fonctions étagées plutôt que des fonctions en escalier va consister en fait à découper l'espace d'arrivée plutôt que l'espace de départ. Comme on le voit maintenant, vous voyez qu'ici, je découpe mon espace d'arrivée en petits sous-intervalles de même taille et je vais regarder la valeur de f donc on va le voir un peu dans les hauteurs, on le voit mieux. Vous voyez, je prends ce petit intervalle-là et je vais lui associer donc une variable aléatoire qui aura cette valeur ici définie ici. Donc, même si ici on vous a fait des verticales, essayez de les oublier et tracez plutôt des horizontales qui correspondent à des valeurs prises par une variable aléatoire donc qui est constante sur ces lignes de niveau ici, vous voyez, c'est comme si vous aviez un empilement comme une espèce de pièce montée avec un empilement de rectangle allongé maintenant hein de rectangle qui sont, dont la base ici est un sous-intervalle de l'espace d'arrivée. Donc, ces découpages-là , c'est un découpage qui est de type intégrale de Lebesgue où on regarde un découpage, on regarde l'ensemble des x tels que f de x est constant et vaut une certaine valeur. Bien. Donc, dans ce cas-là , on va pouvoir aussi si on fait tendre ces intervalles-là vers 0, approcher l'intégrale qui est définie par la surface sous f par cette surface définie sous les rectangles correspondant à mes fonctions étagées. Bien, si on a compris ça, on comprend ce que c'est que cette définition abstraite de l'intégrale de Lebesgue. Alors maintenant, il faut revenir à définir l'espérance pour une variable aléatoire quelconque et là on va utiliser une identité fonctionnelle qui est très souvent utilisée en théorie de la mesure qui est de remarquer que on peut toujours écrire une fonction ou une variable aléatoire de signe quelconque donc come la différence de deux variables aléatoires positives que je vais noter X+ et X- avec X+ qui est égal au sup de X et 0. C'est-à -dire que X+ de oméga va être égal à X de oméga si X de oméga est positif et X+ de oméga va être égal à 0 si X de oméga est négatif. De même, X- va être égal au sup de moins X de oméga et 0. C'est-à -dire que X- va être égal à moins X de oméga si X de oméga est négatif et va être égal à 0 si X de oméga est positif. Exercice, je vous laisse montrer que X est effectivement égal à X+ moins X- et que valeur absolue de X est égale à X+ plus X-. Donc, c'est vraiment important de comprendre ça et je vous laisse le faire à titre d'exercice. C'est immédiat hein. Alors, vous voyez que maintenant, nous, on connaît l'espérance des variables aléatoires positives donc on a envie de garder les propriétés de linéarité de l'opérateur espérance que nous avons mis en évidence pour les variables aléatoires à valeurs finies ou dénombrables et on a donc envie de dire que l'espérance de X est égale à l'espérance de X+ moins l'expérience de X-. Mais attention, pour une variable positive, nous nous sommes permis d'avoir que son espérance peut être égale à plus l'infini. Donc, ici, il y a un risque, c'est d'avoir une forme indéterminée plus l'infini moins l'infini. Donc, nous allons imposer une contrainte pour pouvoir définir l'espérance et la contrainte c'est que on veut absolument que l'espérance de X+ et l'espérance de X- soient toutes les deux finies. Ce qui se traduit de manière bi-équivoque par le fait que l'espérance de valeur absolue de X soit finie. Hein, parce que si elle est finie, eh bien, l'espérance des quantités positives X+ et X- sera finie. Donc, nous dirons, définition fondamentale, que X est intégrable si l'espérance de sa valeur absolue est finie, je vous rappelle que l'espérance de valeur absolue de X est connue puisque c'est l'espérance d'une variable aléatoire positive, nous l'avons déjà définie. Et dans ce cas-là , l'espérance de X sera égale à l'espérance de X+ moins l'espérance de X-. Donc, c'est cette quantité-là que nous allons aussi noter intégrale de X de oméga P de d oméga et qui s'appelle l'intégrale de Lebesgue de la fonction de l'aléa ou de la variable aléatoire grand X pour la mesure de probabilité abstraite grand P. Hein donc résumons. Pour construire cette chose-là , première chose, on a défini de manière très simple pour les variables qui prennent un nombre fini de valeurs et ce par analogie avec ce qu'on avait fait dans le cas de oméga fini ou dénombrable. Deuxièmement, on en déduit la définition d'espérance de X pour une variable aléatoire positive par passage à la limite pour une suite de fonctions en étages et croissante. Troisièmement, dans le cas où l'espérance de la valeur absolue de X est finie, on peut définir alors l'espérance de X pour une variable aléatoire de signe quelconque en écrivant que c'est l'espérance de sa partie positive moins l'espérance de sa partie négative. Donc, vous voyez que principalement, l'espérance ici est définie comme passage à la limite des espérances de variables aléatoires d'un nombre fini de valeurs ou en utilisant la linéarité. Donc toutes les propriétés que nous avions vues pour des variables aléatoires à valeurs finies ou dénombrables se généralisent. Donc, nous allons généraliser ce qu'on avait appelé l'espace L1, l'espace vectoriel des variables aléatoires intégrables. Donc à toutes les variables aléatoires qui ont une espérance finie et toutes les propriétés donc que nous avons eues précédemment restent vraies par passage à la limite donc essentiellement la linéarité, l'espérance de a grand X plus b grand Y est égal à a E de X plus b E de Y. Je vous rappelle que l'espérance d'une constante vaut cette constante elle-même. En particulier, l'espérance de 1 vaut 1. Et la positivité, hein, c'est, l'opérateur espérance est monotone au sens où si X est positif, l'espérance de X est positif. Alors, de même, nous allons pouvoir généraliser la notion de variable aléatoire de carré intégrable et définir L2, l'ensemble de ces variables. Donc on dira qu'une variable aléatoire est de carré intégrable si l'espérance de X2 est finie. Cela va dans ce cas nous entraîner automatiquement que l'espérance de valeur absolue de X est finie et nous l'avions déjà remarqué dans le cas fini ou dénombrable, cela est dû au fait qu'on peut montrer que valeur absolue de X est plus petit que 1 plus X2. Dans ce cas-là , si l'espérance de X2 est finie, hein, donc on dit que X met un moment d'ordre 2, nous pouvons comme précédemment définir la variance de X comme l'espérance de X moins E de X au carré et définir l'écart-type comme étant la racine de la variance. Donc, nous avons déjà démontré mais on l'a démontré de manière abstraite, donc c'est vrai ici pour toute variable aléatoire que la variance de X est aussi l'espérance de X2 moins l'espérance de X au carré. L'espérance du carré moins le carré de l'espérance et nous avons montré que la variance de a X plus b était égale à a au carré fois la variance de X. Quand l'écart-type est strictement positif, c'est-à -dire si X n'est pas une variable aléatoire constante, nous pouvons construire à partir de l'espérance de X et de son écart-type, une variable aléatoire d'espérance nulle et d'écart-type égal à 1 qui est X moins E de X sur sigma de X. Hein, donc, si on soustrait l'espérance à une variable aléatoire X, on obtient une variable centrée et si maintenant on divise par l'écart-type, on obtient une variable qu'on appelle réduite, c'est-à -dire de variance 1. Donc, là je vais assez vite parce qu'on généralise immédiatement ce qu'on avait vu dans le cas fini ou dénombrable. Alors, nous allons finir cette séance par un résultat fondamental sur lequel je vais revenir dans la prochaine séance, à savoir que tout ça serait très intéressant du point de vue abstrait mais du point de vue maths appliquées, ça serait un peu limité si on ne pouvait pas avoir une manière simple de calculer ces espérances. Donc, je vous rappelle que nous avons vu un moyen de transporter la structure abstraite grâce à la variable aléatoire X en regardant plutôt sa loi au lieu de regarder la probabilité abstraite P qu'on avait définie sur oméga. Et le génie de toute cette théorie, c'est que nous allons pouvoir calculer espérance de X, et même l'espérance de toute fonction de X, grâce à la loi de grand X. Donc, le théorème que nous voyons maintenant, est que si vous avez une variable aléatoire définie de oméga à valeur réelle, et g une fonction, donc définie de R muni de sa tribu borélienne, à valeurs R, dans R muni de sa tribu borélienne, donc, qu'on appelle mesurable au sens où on l'a déjà vu. En particulier, ce sera vrai pour une fonction continue, une fonction avec un peu de régularité, que l'on va supposer positive ou bornée, par exemple, de telle sorte que g (X) soit intégrable. Bon, on peut prendre une fonction g quelconque telle que g (X) est intégrable, pour cela positive ou bornée. Alors, on sait que l'espérance de g (X), g (X) définit une variable aléatoire, donc on vient de le définir, on a dit que c'était l'intégrale abstraite de g (X (oméga)) par rapport à cette mesure abstraite, P (d oméga). Mais, ce qu'on va montrer maintenant, c'est qu'en fait c'est égal à l'intégrale de g (petit x), intégrée par la loi de grand X en (d petit x). Alors, nous avons déjà vu des exemples, en particulier, les exemples de toutes les lois à densité. Ici, nous avons une probabilité sur R, et on va pouvoir faire des calculs en utilisant donc cette propriété de transfert de l'intégrale abstraite sur, à une intégrale sur R. Donc ici, c'est une intégrale de Lebesgue sur R. Alors, je finis donc cette séance en vous donnant une idée de la preuve de ce théorème. Donc, je vous rappelle, on veut montrer que E [g (grand X)] = l'intégrale de g (petit x), donc intégrale sur R, de g (petit x), intégrée par rapport à la mesure de probabilité P X (d petit x), où c'est la probabilité loi de grand X ici, une probabilité sur R. Bien. Une remarque, cette deuxième intégrale est aussi une intégrale de Lebesgue, qu'on a construit de la même façon, mais sur R. Alors, comment prouver cela? Première remarque, c'est immédiat si je prends pour g, l'indicatrice de B. Le B est un borélien de R. Alors, cela veut dire quoi? Cela, cela veut dire que g (petit x) = 1 si petit x est dans B. Et g (x) = 0 si x n'appartient pas à B. Alors, dans ce cas-là , je vais mettre (*). Donc, (*) est immédiat par définition de la loi de X, puisque E [1 B (grand X)], c'est la probabilité d'avoir X dans B, et on sait par définition que c'est la loi de grand X pris au borélien grand B. Donc, par linéarité, cela va aussi être vrai pour toute fonction étagée petit g, donc, qui est donc égale à la somme de i = 1 à p de petit b i indicatrice de grand B i, où grand B i est un borélien de R. Dans ce cas-là , on aura que E [g (x)] = (somme de i = 1 à p des b i probabilité d'avoir x dans B i, et cela on sait que c'est P X (B i)). Donc, vous voyez que dans ce cas-là , on peut encore définir l'espérance de g (x) par la loi de grand X, et ensuite eh bien, on va refaire des arguments de théorie de la mesure, comme ceux qui nous ont permis de construire l'espérance, et je ne rentrerai pas plus ici dans le détail. Si g est positif, on approche g par une suite croissante de fonctions étagées. Et donc, on sait que l'espérance de g (X) va être construite comme limite des espérances des fonctions étagées prises en grand X, et là on a vu que c'étaient des espérances qui étaient définies par la loi de grand X. Et, pour finir, pour une fonction g de signe quelconque, on écrira g = (g +)- (g -) avec comme on l'a vu précédemment, (g +) = sup (g, 0) et (g -) = sup (- g, 0). Voilà . Bon, c'est une preuve rapide, mais ce qu'il faut savoir, c'est qu'il y a des arguments là encore d'intégration assez sophistiqués, pour montrer ce résultat sur lequel nous allons revenir en détails dans la séance suivante.