Convergência de variáveis aleatórias

Exemplos de convergência quase certa
Exemplo 1
	Considere um animal de alguma espécie de vida curta. Nós registramos a quantidade de comida que este animal consome por dia. Esta sequência de números será imprevisível, mas podemos estar quase certos de que este número um dia será zero e permanecerá zero para sempre a partir de então.
Exemplo 2
	Considere um homem que joga sete moedas toda manhã. Cada tarde, ele doa um moeda à caridade para cada cara que aparece. A partir da primeira vez em que todas as moedas derem coroa, ele parará de doar permanentemente. Considere <img src="https://wikimedia.org/api/rest_v1/media/math/render/svg/bfab0b794cf9db232fc86ccc05c49dcce957887b" class="mwe-math-fallback-image-inline mw-invert skin-invert" aria-hidden="true" style="vertical-align: -0.671ex; width:10.74ex; height:2.509ex;" alt="{\displaystyle X_{1},X_{2},...}"> as quantidades diárias que a caridade recebe dele. Podemos ficar quase certos de que um dia esta quantidade será zero e permanecerá zero para sempre a partir de então. Entretanto, se considerarmos qualquer número finito de dias, há uma probabilidade não nula de que ele não pare de doar à caridade.

Examples of convergence in probability
Altura de uma pessoa
	Este exemplo não deve ser tomado literalmente. Considere o seguinte experimento. Primeiramente, selecione uma pessoa na rua. Considere X sua altura, que é ex ante uma variável aleatória. Então, peça a outras pessoas que estimem sua altura a olho. Considere Xn a média das primeiras n respostas. Então, se não houver erro sistemático, a sequência Xn convergirá em probabilidade à variável aleatória X pela lei dos grandes números.
Arqueiro
	Suponha que uma pessoa pegue um arco e comece a atirar flechas em um alvo. Considere Xn sua pontuação na n-ésima flecha. Inicialmente, ele não fará nenhum ponto muitas vezes, mas conforme o tempo passa e sua habilidade aumenta, ele ficara cada mais próximo de acertar a mosca e marcar 10 pontos. Depois de anos de prática, a probabilidade de que ele atinja pontuação diferente de 10 ficará cada vez menor e convergirá a 0. Assim, a sequência Xn converge em probabilidade a <img src="https://wikimedia.org/api/rest_v1/media/math/render/svg/99a6d2240c1126af7587258197f4d165373888d2" class="mwe-math-fallback-image-inline mw-invert skin-invert" aria-hidden="true" style="vertical-align: -0.338ex; width:7.403ex; height:2.176ex;" alt="{\displaystyle X=10}"> Entretanto, note que Xn não converge quase certamente. Não importa quão profissional o arqueiro se torne, haverá sempre uma pequena probabilidade de cometer um erro. Assim, a sequência <img src="https://wikimedia.org/api/rest_v1/media/math/render/svg/2aec0efdaea3af46ae72c0fc9d2d9c115ee63e1c" class="mwe-math-fallback-image-inline mw-invert skin-invert" aria-hidden="true" style="vertical-align: -0.838ex; width:5.468ex; height:2.843ex;" alt="{\displaystyle \{X_{n}\}}"> nunca ficará estacionária. Haverá sempre pontuações não perfeitas, ainda que se tornem cada vez menos frequentes.

Exemplos de convergência em distribuição
Fábrica de dados
	Suponha que uma nova fábrica de dados acaba de ser construída. Alguns dos primeiros dados saem um pouco viesados, devido a imperfeições no processo de produção. Os valores observados ao jogar qualquer um deles seguirão um distribuição marcadamente diferente da desejada distribuição uniforme. Conforme a fábrica é melhorada, os dados se tornam cada vez menos viesados e os valores observados ao jogar um dado recentemente produzido seguirão cada vez mais proximamente a distribuição uniforme.
Cara ou coroa
	Considere Xn a fração de caras depois de jogar uma moeda não viesada n vezes. Então, X1 tem distribuição de Bernoulli com valor esperado μ = 0.5 e variância σ2 = 0.25. As variáveis aleatórias subsequentes X2, X3, ... serão todas distribuídas binomialmente. Conforme n fica maior, a distribuição começará a ficar cada vez mais parecida com a distribuição normal. Se mudarmos e reescalonarmos Xn apropriadamente, então <img src="https://wikimedia.org/api/rest_v1/media/math/render/svg/f34bd260cbef24ad94bd4163f632e2b95089548c" class="mwe-math-fallback-image-inline mw-invert skin-invert" aria-hidden="true" style="vertical-align: -0.838ex; width:11.989ex; height:3.343ex;" alt="{\displaystyle \scriptstyle Z_{n}={\frac {\sqrt {n}}{\sigma }}(X_{n}-\mu )}"> estará convergindo em distribuição à normal padrão, o resultado que se segue do conhecido teorema central do limite.
Exemplo gráfico
	Suponha que {Xi} seja uma sequência de variáveis aleatórias independentes e identicamente distribuídas com distribuição uniforme U(−1, 1). Considere <img src="https://wikimedia.org/api/rest_v1/media/math/render/svg/fad52cdaa59345685313689c1e8782e979ee3ab0" class="mwe-math-fallback-image-inline mw-invert skin-invert" aria-hidden="true" style="vertical-align: -1.838ex; width:12.939ex; height:3.843ex;" alt="{\displaystyle \scriptstyle Z_{n}={\scriptscriptstyle {\frac {1}{\sqrt {n}}}}\sum _{i=1}^{n}X_{i}}"> suas somas (normalizadas). Então, de acordo com o teorema central do limite, a distribuição de Zn se aproxima da distribuição normal N(0, ⁠1/3⁠). Esta convergência está mostrada na imagem: conforme n aumenta, a forma da função distribuição de probabilidade fica cada vez mais próxima da curva gaussiana. <img src="//upload.wikimedia.org/wikipedia/commons/e/e3/Convergence_in_distribution_%28sum_of_uniform_rvs%29.gif" decoding="async" width="200" height="148" class="mw-file-element" data-file-width="200" data-file-height="148">

Em teoria das probabilidades, existem várias noções diferentes de convergência de variáveis aleatórias. A convergência de sequências de variáveis aleatórias a alguma variável aleatória limite é um importante conceito em teoria das probabilidades e tem aplicações na estatística e nos processos estocásticos. Os mesmos conceitos são conhecidos em matemática geral como convergência estocástica e formalizam a ideia de que é possível esperar que uma sequência de eventos essencialmente aleatórios ou imprevisíveis às vezes mantenha um comportamento essencialmente imutável quando itens suficientemente distantes na sequência são estudados. As possíveis noções diferentes de convergência se relacionam a como tal comportamento pode ser caracterizado: dois comportamentos prontamente entendidos são que a sequência eventualmente assume um valor constante e que os valores na sequência continuam mudando, mas podem ser descritos por uma distribuição de probabilidade imutável.

Plano de fundo

A expressão "convergência estocástica" formaliza a ideia de que é possível esperar que uma sequência de eventos essencialmente aleatórios ou imprevisíveis siga eventualmente um padrão.^[1] Este padrão pode ser, por exemplo,

Convergência no sentido clássico de um valor fixado, talvez ele mesmo vindo de um evento aleatório;
Uma semelhança crescente dos eventos ao que uma função puramente determinística produziria;
Uma preferência crescente em direção a um certo valor observado;
Uma "aversão" crescente a se afastar demais de um certo valor observado;
A distribuição de probabilidade que descreve o próximo valor observado pode ficar cada vez mais semelhante a uma certa distribuição.

Alguns padrões teóricos, menos óbvios, podem ser:

A série formada pelo cálculo do valor esperado da distância entre o valor observado e um valor particular pode convergir a zero;
A variância da variável aleatória que descreve o seguinte evento fica cada vez menor.

Estes outros tipos de padrões que podem surgir estão refletidos em diferentes tipos de convergência estocástica que têm sido estudados.

Enquanto a discussão acima diz respeito à convergência de uma única série a um valor limitante, a noção de convergência de duas séries uma em direção a outra também é importante. No entanto, é fácil lidar com isto estudando a sequência definida como a diferença ou como a razão das duas séries.

Por exemplo, se a média de $n$ variáveis aleatórias independentes $Y_{i}$ , $i=1,...,n$ , todas tendo média e variância iguais e finitas, é dada por

X_{n}={\frac {1}{n}}\sum _{i=1}^{n}Y_{i}\,,

então conforme $n$ tende ao infinito, $X_{n}$ converge em probabilidade à média comum $\mu$ das variáveis aleatórias $Y_{i}$ . Este resultado é conhecido como lei fraca dos grandes números. Outras formas de convergência são importantes em outros teoremas úteis, incluindo o teorema central do limite.^[2]

Ao longo do que se segue, assume-se que $(X_{n})$ é uma sequência de variáveis aleatórias, $X$ é uma variável aleatória e todas elas estão definidas no mesmo espaço de probabilidade $(\Omega ,{\mathcal {F}},P)$ .

Convergência em distribuição

Com este modo de convergência, nós esperamos ver o próximo valor observado em uma sequência de experimentos aleatórios cada vez mais bem modelado por uma dada distribuição de probabilidade.

A convergência em distribuição é a forma mais fraca de convergência, já que é implicada por todos os outros tipos de convergência mencionados nesta página.^[3] Entretanto, a convergência em distribuição é usada com muita regularidade na prática. Mais frequentemente, ela surge da aplicação do teorema central do limite.

Definição

Uma sequência $X 1, X 2, ...$ de variáveis aleatórias de valores reais converge em distribuição, converge fracamente ou converge em lei a uma variável aleatória $X$ se^[4]

\lim _{n\to \infty }F_{n}(x)=F(x),

para todo número $x \in R$ no qual $F$ é contínua. Aqui, $F n$ e $F$ são as funções distribuição acumulada das variáveis aleatórias $X n$ e $X$ respectivamente.

A exigência de que apenas os pontos de continuidade de $F$ sejam considerados é essencial. Por exemplo, se $X n$ for distribuída uniformemente nos intervalos, $(0, ⁠ 1 / n ⁠)$ , então, esta sequência converge em distribuição a uma variável aleatória degenerada $X = 0$ . De fato, $F n (x) = 0$ para todo $n$ quando $x \leq 0$ e $F n (x) = 1$ para todo $x \geq ⁠ 1 / n ⁠$ quando $n > 0$ . Entretanto, para esta variável aleatória limitante, $F (0) = 1$ , ainda que $F n (0) = 0$ para todo $n$ . Assim, a convergência das funções distribuição acumulada falha no ponto $x=0$ , em que $F$ é descontínua.

A convergência em distribuição pode ser denotada como

{\begin{aligned}&X_{n}\ {\xrightarrow {d}}\ X,\ \ X_{n}\ {\xrightarrow {\mathcal {D}}}\ X,\ \ X_{n}\ {\xrightarrow {\mathcal {L}}}\ X,\ \ X_{n}\ {\xrightarrow {d}}\ {\mathcal {L}}_{X},\\&X_{n}\rightsquigarrow X,\ \ X_{n}\Rightarrow X,\ \ {\mathcal {L}}(X_{n})\to {\mathcal {L}}(X),\\\end{aligned}}

em que $\scriptstyle {\mathcal {L}}_{X}$ é a lei (distribuição de probabilidade) de $X$ . Por exemplo, se $X$ tiver distribuição normal padrão, podemos escrever $X_{n}\,{\xrightarrow {d}}\,{\mathcal {N}}(0,\,1)$ .

Para vetores aleatórios ${X 1, X 2, ...} \subset R k$ , a convergência em distribuição é definida de forma semelhante. Dizemos que esta sequência converge em distribuição a um vetor $k$ aleatório $X$ se

\lim _{n\to \infty }\operatorname {Pr} (X_{n}\in A)=\operatorname {Pr} (X\in A)

para todo $A \subset R k$ que for um conjunto continuidade de $X$ .

A definição de convergência em distribuição pode ser estendida de vetores aleatórios a elementos aleatórios mais gerais em espaços métricos arbitrários, até mesmo a "variáveis aleatórias" não mensuráveis — uma situação que ocorre, por exemplo, no estudo de processos empíricos. Isto é a convergência fraca de leis sem que leis sejam definidas — exceto assintoticamente.^[5]

Neste caso, o termo convergência fraca é preferível e dizemos que uma sequência de elementos aleatórios $\{X_{n}\}$ converge fracamente a $X$ (denotado como $X n \Rightarrow X$ ) se

\operatorname {E} ^{*}h(X_{n})\to \operatorname {E} \,h(X)

para todas as funções contínuas limitadas $h$ .^[6] Aqui, $\operatorname {E} ^{*}$ denota o valor esperado externo, que é o valor esperado da menor função mensurável $g$ que domina $h (X n)$ .

Propriedades

Já que $F (a) = Pr(X \leq a)$ , a convergência em distribuição significa que a probabilidade de que $X n$ esteja em um dado intervalo é aproximadamente igual à probabilidade de que o valor de $X$ esteja neste intervalo, sendo $n$ suficientemente grande.
Em geral, a convergência em distribuição não implica que a sequência de funções densidade de probabilidade correspondentes também convergirá. Como um exemplo, podem-se considerar variáveis aleatórias com densidades f_n(x) = (1 − cos(2πnx))1_(0,1). Estas variáveis aleatórias convergem em distribuição a uma uniforme $U(0,1)$ , enquanto suas densidades não convergem de qualquer forma.^[7]
- Entretanto, o lema de Scheffé implica que a convergência das funções densidade de probabilidade implica convergência em distribuição.^[8]
O lema de Portmanteau oferece várias definições equivalentes de convergência em distribuição. Ainda que estas definições sejam menos intuitivas, elas são usadas para provar uma série de teoremas estatísticos. O teorema afirma que {X_n} converge em distribuição a X se e somente só qualquer uma das afirmações seguintes for verdadeira:
- $Eƒ(X n) \to Eƒ(X)$ para todas as funções limitadas, contínuas $f$ (em que $E$ denota o valor esperado);
- $Eƒ(X n) \to Eƒ(X)$ para todas as funções limitadas e de Lipschitz ƒ;
- $limsup{ Eƒ(X n) } \leq Eƒ(X)$ para toda função semicontínua superior $f$ limitada a partir de cima;
- $liminf{ Eƒ(X n) } \geq Eƒ(X)$ para toda função semicontínua inferior $f$ limitada a partir de baixo;
- $limsup{Pr(X n \in C)} \leq Pr(X \in C)$ para todos os conjuntos fechados $C$ ;
- $liminf{Pr(X n \in U)} \geq Pr(X \in U)$ para todos os conjuntos abertos $U$ ;
- $lim{Pr(X n \in A)} = Pr(X \in A)$ para todos os conjuntos continuidade $A$ da variável aleatória $X$ .
O teorema de Mann-Wald afirma que, para uma função contínua $g$ , se a sequência {X_n} convergir em distribuição a $X$ , então {g(X_n)} converge em distribuição a g(X).
- Entretanto, a convergência em distribuição de ${X n}$ a $X$ e de ${Y n}$ a $Y$ não implica, em geral, a convergência em distribuição de ${X n + Y n}$ a $X + Y$ ou de ${X n Y n}$ a $XY$ .
O teorema da continuidade de Lévy afirma que a sequência ${X n}$ converge em distribuição a $X$ se e somente se a sequência das funções características correspondentes ${φ n}$ convergir pontualmente à função característica $φ$ de $X$ .
A convergência em distribuição é metrizável pela métrica de Lévy-Prokhorov.^[3]
Uma ligação natural à convergência em distribuição é o teorema da representação de Skorokhod.

Convergência em probabilidade

A ideia básica por trás deste tipo de convergência é que a probabilidade de um valor observado "incomum" se torna cada vez menor conforme a sequência progride.^[9]

O conceito de convergência em probabilidade é usado muito frequentemente em estatística. Por exemplo, um estimador é considerado consistente se convergir em probabilidade à quantidade sendo estimada. A convergência em probabilidade é também o tipo de convergência estabelecido pela lei fraca dos grandes números.^[10]

Definição

Uma sequência $\{X_{n}\}$ de variáveis aleatórias converge em probabilidade em direção à variável aleatória $X$ se para todo $\varepsilon >0$ ^[4]

\lim _{n\to \infty }\Pr {\big (}|X_{n}-X|\geq \varepsilon {\big )}=0.

Formalmente, considere qualquer $\varepsilon >0$ e qualquer $\delta >0$ . Considere $P_{n}$ a probabilidade de que $X_{n}$ esteja fora de um intervalo de confiança de raio $\varepsilon$ e em torno de $X$ . Então, para que $X_{n}$ convirja em probabilidade a $X$ , deve existir um número $N$ (que dependerá de $\varepsilon$ e $\delta$ ) tal que, para todo $n\geq N$ , $P_{n}<\delta$ .

A convergência em probabilidade $\{X_{n}\}$ é denotada colocando-se a letra $p$ sobre uma seta indicando convergência ou o operador de limite de probabilidade $\mathrm {plim}$ :

X_{n}\ {\xrightarrow {p}}\ X,\ \ X_{n}\ {\xrightarrow {P}}\ X,\ \ {\underset {n\to \infty }{\operatorname {plim} }}\,X_{n}=X.

Para elementos aleatórios $\{X_{n}\}$ em um espaço métrico separável $(S, d)$ , a convergência em probabilidade é definida de forma semelhante por^[11]

\forall \varepsilon >0,\Pr {\big (}d(X_{n},X)\geq \varepsilon {\big )}\to 0.

Propriedades

A convergência em probabilidade implica convergência em distribuição.^[9]
Na direção oposta, a convergência em distribuição implica a convergência em probabilidade quando a variável aleatória limitante $X$ for uma constante.
A convergência em probabilidade não implica convergência quase certa.
O teorema de Mann-Wald afirma que, para toda função contínua $g(\cdot )$ , se $X_{n}{\xrightarrow {p}}X$ , então também $g(X_{n}){\xrightarrow {p}}g(X)$ .
A convergência em probabilidade define uma topologia no espaço de variáveis aleatórias sobre um espaço de probabilidade fixado. Esta topologia é metrizável pela métrica de Ky Fan:^[11]

d(X,Y)=\inf \!{\big \{}\varepsilon >0:\ \Pr {\big (}|X-Y|>\varepsilon {\big )}\leq \varepsilon {\big \}}

ou

d(X,Y)=\mathbb {E} \left[\min(|X-Y|,1)\right]

.

Convergência quase certa

Este é o tipo de convergência estocástica mais semelhante à convergência pontual conhecida a partir da análise real elementar.

Definição

Dizer que a sequência $X n$ converge quase certamente, quase em todo lugar, com probabilidade 1 ou fortemente em direção a $X$ significa que^[4]

\operatorname {Pr} \!\left(\lim _{n\to \infty }\!X_{n}=X\right)=1.

Isto significa que os valores de $X n$ se aproximam do valor de $X$ no sentido de que os eventos para os quais $X n$ não converge a $X$ têm probabilidade zero. Usando o espaço de probabilidade $(\Omega ,{\mathcal {F}},\operatorname {Pr} )$ e o conceito da variável aleatória como uma função de $\Omega$ a R, isto equivale à afirmação

\operatorname {Pr} {\Big (}\omega \in \Omega :\lim _{n\to \infty }X_{n}(\omega )=X(\omega ){\Big )}=1.

Usando a noção do limite inferior de uma sequência de conjuntos, a convergência quase certa pode ser definida como:

\operatorname {Pr} {\Big (}\liminf _{n\to \infty }{\big \{}\omega \in \Omega :|X_{n}(\omega )-X(\omega )|<\varepsilon {\big \}}{\Big )}=1\quad {\text{para todo}}\quad \varepsilon >0.

A convergência quase certa é frequentemente denotada colocando-se as letras $q.c.$ sobre uma seta indicando convergência,

X_{n}\,{\xrightarrow {\mathrm {q.c.} }}\,X.

Para elementos aleatórios genéricos $\{X_{n}\}$ em um espaço métrico $(S,d)$ , a convergência quase certa é definida de forma semelhante:

\operatorname {Pr} {\Big (}\omega \in \Omega :\,d{\big (}X_{n}(\omega ),X(\omega ){\big )}\,{\underset {n\to \infty }{\longrightarrow }}\,0{\Big )}=1

Propriedades

A convergência quase certa implica convergência em probabilidade pelo lema de Fatou e, por isso, implica convergência em distribuição. É a noção de convergência usada na lei forte dos grandes números.^[10]
O conceito de convergência quase certa não vem de uma topologia sobre o espaço de variáveis aleatórias. Isto significa que não há topologia no espaço de variáveis aleatórias tal que as sequências quase certamente convergentes são exatamente as sequências convergentes em relação àquela topologia. Em particular, não há métrica de convergência quase certa.

Convergência certa

Dizer que a sequência de variáveis aleatórias $X_{n}$ definida ao longo do mesmo espaço de probabilidade (isto é, um processo aleatório) converge certamente, em todo lugar ou pontualmente a $X$ significa que

\lim _{n\to \infty }X_{n}(\omega )=X(\omega ),\,\,\forall \omega \in \Omega .

em que $\Omega$ é o espaço amostral do espaço de probabilidade subjacente sobre o qual as variáveis aleatórias são definidas.

Esta é a noção de convergência pontual de uma sequência de funções estendida a uma sequência de variáveis aleatórias, lembrando que as variáveis aleatórias são elas mesmas funções.

{\big \{}\omega \in \Omega \,|\,\lim _{n\to \infty }X_{n}(\omega )=X(\omega ){\big \}}=\Omega .

A convergência certa de uma variável aleatória implica todos os outros tipos de convergência descritos acima. A diferença entre a convergência quase certa e a convergência certa está nos conjuntos com probabilidade zero. Por isso, o conceito de convergência certa de variáveis aleatórias é muito raramente usado.

Convergência em média

Dado um número real $r \geq 1$ , dizemos que a sequência $X n$ converge na $r$ -ésima média ou na norma L^r^[12] à variável aleatória $X$ se os $r$ -ésimos momentos absolutos $\mathrm {E} (|X_{n}|^{r})$ e $\mathrm {E} (|X|^{r})$ de $X_{n}$ e $X$ existem e

\lim _{n\to \infty }\operatorname {E} \left(|X_{n}-X|^{r}\right)=0,

em que o operador $\mathrm {E}$ denota o valor esperado. A convergência na $r$ -ésima média nos diz que o valor esperado da $r$ -ésima potência da diferença entre $X_{n}$ e $X$ converge a zero.

Este tipo de convergência é frequentemente denotado colocando-se L^r sobre uma seta indicando convergência:

X_{n}\,{\xrightarrow {L^{r}}}\,X.

Os casos mais importantes de convergência na $r$ -ésima média são:

Quando $X n$ converge na $r$ -ésima média a $X$ para $r=1$ , dizemos que $X n$ converge em média a $X$ .
Quando $X n$ converge na $r$ -ésima média a $X$ para $r=2$ , dizemos que $X n$ converge em média quadrática a $X$ .

A convergência na na $r$ -ésima média, para $r\geq 1$ , implica convergência em probabilidade pela desigualdade de Markov.^[13] Além disso, se $r>s\geq 1$ , a convergência na $r$ -ésima média implica convergência na $s$ -ésima média. Assim, a convergência em média quadrática implica a convergência em média.

Vale notar que, se $X_{n}{\xrightarrow {L^{r}}}X$ , então

\lim _{n\to \infty }E[|X_{n}|^{r}]=E[|X|^{r}]

Propriedades

Se o espaço de probabilidade for completo:

Se $X_{n}\ {\xrightarrow {p}}\ X$ e $X_{n}\ {\xrightarrow {p}}\ Y$ , então $X=Y$ quase certamente.
Se $X_{n}\ {\xrightarrow {q.c.}}\ X$ e $X_{n}\ {\xrightarrow {q.c.}}\ Y$ , então $X=Y$ quase certamente.
Se $X_{n}\ {\xrightarrow {L^{r}}}\ X$ e $X_{n}\ {\xrightarrow {L^{r}}}\ Y$ , então $X=Y$ quase certamente.
Se $X_{n}\ {\xrightarrow {p}}\ X$ e $Y_{n}\ {\xrightarrow {p}}\ Y$ , então $aX_{n}+bY_{n}\ {\xrightarrow {p}}\ aX+bY$ (para quaisquer números reais $a$ e $b$ ) e $X_{n}Y_{n}{\xrightarrow {p}}\ XY$ .
Se $X_{n}\ {\xrightarrow {q.c.}}\ X$ e $Y_{n}\ {\xrightarrow {q.c.}}\ Y$ , então $aX_{n}+bY_{n}\ {\xrightarrow {q.c.}}\ aX+bY$ (para quaisquer números reais $a$ e $b$ ) e $X_{n}Y_{n}{\xrightarrow {q.c.}}\ XY$ .
Se $X_{n}\ {\xrightarrow {L^{r}}}\ X$ e $Y_{n}\ {\xrightarrow {L^{r}}}\ Y$ , então $aX_{n}+bY_{n}\ {\xrightarrow {L^{r}}}\ aX+bY$ (para quaisquer números reais $a$ e $b$ ).
Nenhuma das afirmações acima é verdadeira para convergência em distribuição.

A cadeia de implicações entre as várias noções de convergências estão notadas em suas respectivas seções. Elas são, usando notação de setas:

{\begin{matrix}{\xrightarrow {L^{s}}}&{\underset {s>r\geq 1}{\Rightarrow }}&{\xrightarrow {L^{r}}}&&\\&&\Downarrow &&\\{\xrightarrow {q.c.}}&\Rightarrow &{\xrightarrow {\ p\ }}&\Rightarrow &{\xrightarrow {\ d\ }}\end{matrix}}

Estas propriedades, unidas a uma série de outros casos especiais, estão resumidas na lista abaixo:

Convergência quase certa implica convergência em probabilidade:^[14]

X_{n}\ {\xrightarrow {q.c.}}\ X\quad \Rightarrow \quad X_{n}\ {\xrightarrow {p}}\ X

Convergência em probabilidade implica que existe uma subsequência $(k_{n})$ que quase certamente converge:^[15]

X_{n}\ {\xrightarrow {p}}\ X\quad \Rightarrow \quad X_{k_{n}}\ {\xrightarrow {a.s.}}\ X

Convergência em probabilidade implica convergência em distribuição:^[14]

X_{n}\ {\xrightarrow {p}}\ X\quad \Rightarrow \quad X_{n}\ {\xrightarrow {d}}\ X

Convergência na $r$ -ésima média implica convergência em probabilidade:

X_{n}\ {\xrightarrow {L^{r}}}\ X\quad \Rightarrow \quad X_{n}\ {\xrightarrow {p}}\ X

Convergência na $r$ -ésima média implica convergência na média de ordem mais baixa, assumindo que ambas as ordens são maiores ou iguais a um:

X_{n}\ {\xrightarrow {L^{r}}}\ X\quad \Rightarrow \quad X_{n}\ {\xrightarrow {L^{s}}}\ X,

sendo

r>s\geq 1

.

Se $X_{n}$ convergir em distribuição a uma constante $c$ , então $X_{n}$ converge em probabilidade a $c$ :^[14]

X_{n}\ {\xrightarrow {d}}\ c\quad \Rightarrow \quad X_{n}\ {\xrightarrow {p}}\ c,

sendo

c

uma constante.

Se $X n$ convergir em distribuição a $X$ e a diferença entre $X_{n}$ e $Y_{n}$ converge em probabilidade a zero, então $Y_{n}$ também converge em distribuição a $X$ :^[14]

X_{n}\ {\xrightarrow {d}}\ X,\ \ |X_{n}-Y_{n}|\ {\xrightarrow {p}}\ 0\ \quad \Rightarrow \quad Y_{n}\ {\xrightarrow {d}}\ X

Se $X_{n}$ convergir em distribuição a $X$ e $Y_{n}$ convergir em distribuição a uma constante $c$ , então o vetor conjunto $(X_{n},Y_{n})$ converge em distribuição a $(X,c)$ :

X_{n}\ {\xrightarrow {d}}\ X,\ \ Y_{n}\ {\xrightarrow {d}}\ c\ \quad \Rightarrow \quad (X_{n},Y_{n})\ {\xrightarrow {d}}\ (X,c)

sendo

c

uma constante.

A condição de que

Y n

convirja a uma constante é importante. Se convergisse a uma variável aleatória

Y

, então não se poderia concluir que

(X_{n},Y_{n})

converge a

(X,Y)

.

Se $X_{n}$ convergir em probabilidade a $X$ e $Y_{n}$ convergir em probabilidade a $Y$ , então o vetor conjunto $(X_{n},Y_{n})$ converge em probabilidade a $(X,Y)$ :^[14]

X_{n}\ {\xrightarrow {p}}\ X,\ \ Y_{n}\ {\xrightarrow {p}}\ Y\ \quad \Rightarrow \quad (X_{n},Y_{n})\ {\xrightarrow {p}}\ (X,Y)

Se $X n$ convergir em probabilidade a $X$ e $P (| X n | \leq b) = 1$ para todo $n$ e algum $b$ , então $X n$ converge na $r$ -ésima média a $X$ para todo $r \geq 1$ . Em outras palavras, se $X n$ convergir em probabilidade a $X$ e todas as variáveis aleatórias $X n$ forem quase certamente limitadas acima e abaixo, então $X n$ converge a $X$ também em qualquer $r$ -ésima média.
Geralmente, convergência em distribuição não implica convergência quase certa. Entretanto, para uma dada sequência $\{X_{n}\}$ que converge em distribuição a $X_{0}$ , é sempre possível encontrar um novo espaço de probabilidade $(\Omega ,{\mathcal {F}},P)$ e variáveis aleatórias $\{Y_{n},n=0,1,...\}$ definidas neste espaço tal que $Y_{n}$ seja igual em distribuição $X n$ para todo $n\geq 0$ e $Y_{n}$ convirja a $Y_{0}$ quase certamente.^[14]
Se para todo $\varepsilon >0$

\sum _{n}\mathbb {P} \left(|X_{n}-X|>\varepsilon \right)<\infty ,

então dizemos que

X n

converge quase completamente ou quase em probabilidade em direção a

X

. Quando

X_{n}

converge quase completamente em direção a

X

, então também converge quase certamente a

X

. Em outras palavras, se

X n

convergir em probabilidade a

X

de forma suficientemente rápida, isto é, se a sequência acima das probabilidades de cauda for somável para todo

ε > 0

, então,

X n

converge quase certamente a

X

. Esta é uma implicação direta do lema de Borel-Cantelli.

Se $S n$ for uma soma de $n$ variáveis aleatórias independentes reais:

S_{n}=X_{1}+\cdots +X_{n}\,

então

S n

converge quase certamente se e somente se

S n

convergir em probabilidade.

O teorema da convergência dominada dá condições suficientes para que a convergência quase certa implique convergência $L^{1}$

\left.{\begin{matrix}X_{n}{\xrightarrow {a.s.}}X\\|X_{n}|<Y\\\mathrm {E} (Y)<\infty \end{matrix}}\right\}\quad \Rightarrow \quad X_{n}{\xrightarrow {L^{1}}}X

Uma condição necessária e suficiente para a convergência $L^{1}$ é que $X_{n}{\xrightarrow {P}}X$ e a sequência $(X_{n})$ seja uniformemente integrável.

Referências

↑ Grimmett, Geoffrey; Stirzaker, David (31 de maio de 2001). Probability and Random Processes (em inglês). [S.l.]: OUP Oxford. ISBN 9780198572220
↑ Dudley, R. M. (14 de outubro de 2002). Real Analysis and Probability (em inglês). [S.l.]: Cambridge University Press. ISBN 9780521007542
↑ ^a ^b Billingsley, Patrick (25 de junho de 2013). Convergence of Probability Measures (em inglês). [S.l.]: John Wiley & Sons. ISBN 9781118625965
↑ ^a ^b ^c vaart, A. W. van der; Wellner, Jon (9 de março de 2013). Weak Convergence and Empirical Processes: With Applications to Statistics (em inglês). [S.l.]: Springer Science & Business Media. ISBN 9781475725452
↑ Bickel, Peter J.; Klaassen, Chris A. J.; Ritov, Ya'acov; Wellner, Jon A. (1 de junho de 1998). Efficient and Adaptive Estimation for Semiparametric Models (em inglês). [S.l.]: Springer New York. ISBN 9780387984735
↑ vaart, A. W. van der; Wellner, Jon (9 de março de 2013). Weak Convergence and Empirical Processes: With Applications to Statistics (em inglês). [S.l.]: Springer Science & Business Media. ISBN 9781475725452
↑ Romano, Joseph P.; Siegel, A. F. (1 de junho de 1986). Counterexamples in Probability And Statistics (em inglês). [S.l.]: CRC Press. ISBN 9780412989018
↑ Scheffe, Henry (26 de maio de 2017). «A Useful Convergence Theorem for Probability Distributions». The Annals of Mathematical Statistics (em inglês). 18 (3): 434–438. ISSN 0003-4851. doi:10.1214/aoms/1177730390
↑ ^a ^b CASELLA, GEORGE; BERGER, ROGER L. INFERENCIA ESTATISTICA. [S.l.]: CENGAGE. ISBN 9788522108947
↑ ^a ^b Billingsley, Patrick (1 de março de 1986). Probability and measure (em inglês). [S.l.]: Wiley. ISBN 9780471804789
↑ ^a ^b Dudley, R. M. (14 de outubro de 2002). Real Analysis and Probability (em inglês). [S.l.]: Cambridge University Press. ISBN 9780521007542
↑ Ledoux, Michel; Talagrand, Michel (9 de março de 2013). Probability in Banach Spaces: Isoperimetry and Processes (em inglês). [S.l.]: Springer Science & Business Media. ISBN 9783642202124
↑ Williams, David (14 de fevereiro de 1991). Probability with Martingales (em inglês). [S.l.]: Cambridge University Press. ISBN 9780521406055
↑ ^a ^b ^c ^d ^e ^f Vaart, A. W. van der (19 de junho de 2000). Asymptotic Statistics (em inglês). [S.l.]: Cambridge University Press. ISBN 9780521784504
↑ Gut, Allan (17 de outubro de 2012). Probability: A Graduate Course (em inglês). [S.l.]: Springer Science & Business Media. ISBN 9781461447078

Este artigo incorpora material do artigo "Convergência de variáveis aleatórias", do Citizendium, que está sob a licença Creative Commons Attribution-ShareAlike 3.0 Unported, porém não sob a GFDL.

[1] Grimmett, Geoffrey; Stirzaker, David (31 de maio de 2001). Probability and Random Processes (em inglês). [S.l.]: OUP Oxford. ISBN 9780198572220

[2] Dudley, R. M. (14 de outubro de 2002). Real Analysis and Probability (em inglês). [S.l.]: Cambridge University Press. ISBN 9780521007542

[:2-3] Billingsley, Patrick (25 de junho de 2013). Convergence of Probability Measures (em inglês). [S.l.]: John Wiley & Sons. ISBN 9781118625965

[:3-4] vaart, A. W. van der; Wellner, Jon (9 de março de 2013). Weak Convergence and Empirical Processes: With Applications to Statistics (em inglês). [S.l.]: Springer Science & Business Media. ISBN 9781475725452

[5] Bickel, Peter J.; Klaassen, Chris A. J.; Ritov, Ya'acov; Wellner, Jon A. (1 de junho de 1998). Efficient and Adaptive Estimation for Semiparametric Models (em inglês). [S.l.]: Springer New York. ISBN 9780387984735

[6] vaart, A. W. van der; Wellner, Jon (9 de março de 2013). Weak Convergence and Empirical Processes: With Applications to Statistics (em inglês). [S.l.]: Springer Science & Business Media. ISBN 9781475725452

[7] Romano, Joseph P.; Siegel, A. F. (1 de junho de 1986). Counterexamples in Probability And Statistics (em inglês). [S.l.]: CRC Press. ISBN 9780412989018

[8] Scheffe, Henry (26 de maio de 2017). «A Useful Convergence Theorem for Probability Distributions». The Annals of Mathematical Statistics (em inglês). 18 (3): 434–438. ISSN 0003-4851. doi:10.1214/aoms/1177730390

[:5-9] CASELLA, GEORGE; BERGER, ROGER L. INFERENCIA ESTATISTICA. [S.l.]: CENGAGE. ISBN 9788522108947

[:4-10] Billingsley, Patrick (1 de março de 1986). Probability and measure (em inglês). [S.l.]: Wiley. ISBN 9780471804789

[:1-11] Dudley, R. M. (14 de outubro de 2002). Real Analysis and Probability (em inglês). [S.l.]: Cambridge University Press. ISBN 9780521007542

[12] Ledoux, Michel; Talagrand, Michel (9 de março de 2013). Probability in Banach Spaces: Isoperimetry and Processes (em inglês). [S.l.]: Springer Science & Business Media. ISBN 9783642202124

[13] Williams, David (14 de fevereiro de 1991). Probability with Martingales (em inglês). [S.l.]: Cambridge University Press. ISBN 9780521406055

[:0-14] ↑ ^a ^b ^c ^d ^e ^f Vaart, A. W. van der (19 de junho de 2000). Asymptotic Statistics (em inglês). [S.l.]: Cambridge University Press. ISBN 9780521784504

[15] Gut, Allan (17 de outubro de 2012). Probability: A Graduate Course (em inglês). [S.l.]: Springer Science & Business Media. ISBN 9781461447078

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]