Jump To Content

LearnHub




Distribuição de Probabilidade

Distribuição t de Student


A distribuição t de Student é uma distribuição de probabilidade estatística. A distribuição t é uma distribuição de probabilidade teórica. É simétrica, campaniforme, e semelhante à curva normal padrão, porém com caudas mais largas, ou seja, uma simulação da t de Student pode gerar valores mais extremos que uma simulação da normal. O único parâmetro v que a define se chama graus de liberdade, e caracteriza a sua forma. Quanto maior for esse parâmetro, mais próxima da normal ela será.



Distribuição de Pareto



A distribuição Pareto, que contém o nome do economista italiano Vilfredo Pareto.
Fora do campo da economia, é por vezes referido como o Bradford distribuição.
Pareto originalmente é usada para descrever a distribuição da riqueza entre os indivíduos.
Esta ideia é por vezes expressa de forma mais simples como o princípio Pareto ou a "regra 80-20", que diz que 20% da população controla 80% da riqueza [1].
Pode ser visto a partir a função densidade de probabilidade (PDF) gráfico da direita, que a "probabilidade" ou fração da população que possui uma pequena quantidade de riqueza por pessoa é bastante elevado e, em seguida, diminui de forma constante conforme riqueza aumenta. Essa distribuição não se limita a descrever riqueza ou distribuição renda, mas para muitas situações em que for encontrado um equilíbrio na distribuição do "pequeno" para os "grandes". Os exemplos que se seguem são por vezes vistas como Pareto-distribuídos aproximadamente:
Os tamanhos dos assentamentos humanos (poucas cidades, muitas aldeias / vilas)
Tamanho distribuição do tráfego Internet que usa o protocolo TCP (muitos arquivos pequenos, alguns grandes operadores)
Aglomerados de condensação de Bose-Einstein próximo de zero absoluto
Os valores das reservas de petróleo nos campos de petróleo (um pequeno número de grandes campos, muitos pequenos campos)
O comprimento distribuição de postos de trabalho afectos supercomputadores (alguns grandes, pequenas, que muitas)
Os retornos sobre o preço individual padronizado stocks
Tamanhos de partículas areia
Tamanhos de meteoritos
Números de espécies por gênero (envolvido subjectivity Existe: A tendência para dividir um gênero em duas ou mais aumenta com o número de espécies do mesmo)
Áreas ardidas nos incêndios florestais
Gravidade do acidente grandes perdas para determinadas linhas de negócio, tais como responsabilidade civil geral, comercial auto, e os trabalhadores compensação.


Distribuição beta


Distribuição beta.
Distribuição beta.

Em estatística, uma distribuição beta é uma distribuição de probabilidade continua, com dois parâmetrosa e b cuja função de densidade para valores 0 < x < 1 é

f(x) = \frac{\Gamma(a+b)}{\Gamma(a)\Gamma(b)}x^{a-1}(1-x)^{b-1}

Aqui, Γ é a função gama.

O valor esperado e a variância de uma variável aleatória X com distribuição beta são

E[X]=\frac{a}{a+b}
V[X]=\frac{ab}{(a+b+1)(a+b)^2}.

Um caso especial da distribuição beta, com a = 1 e b = 1 é a probabilidade uniforme.



Distribuição de Weibull


A distribuição de Weibull, nomeada pelo seu criador Waloddi Weibull, é uma distribuição de probabilidade contínua, usada em estudos de tempo de vida de equipamentos e estimativa de falhas.

Sua função de densidade é

f(x;k,\lambda) = {k \over \lambda} \left({x \over \lambda}\right)^{k-1} e^{-(x/\lambda)^k}\,

para x \geq 0 e f(x;k,λ) = 0 para x < 0, aonde k > 0 é o parâmetro de forma e λ > 0 é o parâmetro de escala da distribuição.

A distribuição de Weibull é usualmente plotada em uma escala específica (gráfico de Weibull), no qual a função é representada por uma reta.

Esta distribuição mostra uma boa aderência a dados de falha de equipamentos, necessitando de menos ocorrências que outras distribuições.

A função distribuição acumulada da distribuição de Weilbull para diferentes valores de k e λ.


Distribuição Discreta

A distribuição discreta descreve quantidades aleatórias (dados de interesse) que podem assumir valores particulares e os valores são finitos. Por exemplo, uma variável aleatória discreta pode assumir somente os valores 0 e 1, ou qualquer inteiro não negativo, etc. Um exemplo de variável climatológica discreta são as tempestades com granizo.

Distribuição Chi-Quadrado.


A função densidade de probabilidade da distribuição χ²
A função densidade de probabilidade da distribuição χ²


A função distribuição acumulada da distribuição χ²
A função distribuição acumuladada distribuição χ²


O coeficiente Chi-Quadrado (ler qui-quadrado), ou chi quadrado, normalmente escrito como χ² é um valor da dispersão para duas variáveis de escala nominal, usado em alguns testes estatísticos. Ele diz-nos em que medida é que os valores observados se desviam do valor esperado, caso as duas variáveis não estivessem correlacionadas.

Quanto maior o chi-quadrado, mais significante é a relação entre a variável dependente e a variável independente.

Este valor está relacionado com uma distribuição, chamada Distribuição Chi-Quadrado.

A Distribuição Chi-quadrado com k graus de liberdade é a distribuição gama com parâmetros (k/2, 1/2).

Quanto maior o número de casos (n) ou o número de linhas ou colunas da tabela de contingência, maior será o Chi-quadrado. Por isso não faz sentido comparar o Chi-quadrado de duas relações entre variáveis. Para o efeito existem outros coeficientes, entre os quais o coeficiente de contingência.

A distribuição Chi-quadrado pode ser simulada a partir da distribuição normal. Por definição, se Z_1, Z_2, \ldots Z_k\, forem k distribuições normais padronizadas (ou seja, média 0 e desvio padrão 1)independentes, então a soma de seus quadrados é uma distribuição Chi-quadrado com k graus de liberdade:

\chi^2_k = Z_1^2 + Z_2^2 + \ldots + Z_k^2\,

Um corolário imediato da definição é que a soma de duas Chi-quadrado independentes também é uma Chi-quadrado:

\chi^2_a + \chi^2_b = \chi^2_{a+b}\,

Distribuições Contínuas

A maioria das variáveis atmosféricas podem assumir valores contínuos. A temperatura, a precipitação, a altura geopotencial, a velocidade do vento, e outras quantidades não estão restritas a valores inteiros de unidades físicas em que são medidas. Embora a natureza da medição e os sistemas de relatos é tal que as medidas atmosféricas são arredondadas para valores discretos, mas o conjunto de valores observados normalmente é grande o suficiente para que a maioria das variáveis possam ainda ser tratadas como quantidades contínuas.

Existem duas funções associadas a cada variável contínua X: a função densidade de probabilidade, simbolizada por f(X), e a função cumulativa de probabilidade, ou função de distribuição de probabilidade representada por F(X).

Há muitas distribuições teóricas contínuas. Algumas das mais usadas em ciências atmosféricas são: distribuição normal, distribuição gamma, distribuição de valores extremos e distribuição exponencial. Neste material vamos tratar dos modelos probabilísticos citados, que têm importância prática na investigação científica, abordando as formas das funções densidade de probabilidade, bem como a esperança e a variância.

Distribuição Normal


A distribuição de probabilidade contínua mais importante e mais utilizada é a distribuição normal, geralmente citada como curva normal ou curva de Gauss. Sua importância em análise matemática resulta do fato de que muitas técnicas estatísticas, como análise de variância, de regressão e alguns testes de hipótese, assumem e exigem a normalidade dos dados. Além disso, a ampla aplicação dessa distribuição vem em parte devido ao teorema do limite central. Este teorema declara que na medida em que o tamanho da amostra aumenta, a distribuição amostral das médias amostrais tende para uma distribuição normal (Triola, 1998). Esta explicação parece um pouco complicada, portanto segue uma abordagem mais detalhada sobre a mesma.

Teorema do Limite Central

A capacidade de usar amostras para fazer inferências sobre parâmetros populacionais depende do conhecimento da distribuição amostral. Para obtermos uma distribuição amostral é necessário repetir n vezes um experimento e após calcular a média das amostras. Este procedimento fornece um novo conjunto de dados que é denominado de distribuição amostral. Na verdade o que o teorema do limite central quer dizer é que se uma população tem distribuição normal, a distribuição das médias amostrais extraídas da população também terá distribuição normal, para qualquer tamanho de amostra. Além disso, mesmo no caso de uma distribuição não-normal, a distribuição das médias amostrais será aproximadamente normal, desde que a amostra seja grande. Este é um resultado notável, na verdade, pois nos diz que não é necessário conhecer a distribuição de uma população para podermos fazer inferência sobre ela a partir de dados amostrais. A única restrição é que o tamanho da amostra seja grande. Uma regra prática muito usada é que a amostra deve consistir de 30 ou mais observações.

Estes resultados são conhecidos como o Teorema do Limite Central e representam talvez o conceito mais importante na inferência estatística.

Em geral, a distribuição amostral das médias amostrais é a distribuição das médias amostrais quando extraímos repetidas amostras de mesmo tamanho, da mesma população. Em outras palavras, se extrairmos amostras de mesmo tamanho da mesma população, calculamos suas médias e construímos um histograma destas médias, esse histograma tende para a forma de um sino de uma distribuição normal. Isto é verdade independentemente da forma da distribuição da população original.

Suponhamos que a variável x represente notas que podem ter, ou não, distribuição normal, e que a média dos valores x seja m e o desvio-padrão seja s. Suponha que coletemos amostras de tamanho n e calculemos as médias amostrais. O que sabemos sobre a coleção de todas as médias amostrais que obtemos repetindo esse experimento? O Teorema do Limite Central nos diz que, na medida em que o tamanho n da amostra aumenta, a distribuição amostral das médias amostrais tente para uma distribuição normal com média m e desvio-padrão .


Your Comment
Textile is Enabled (View Reference)