Distribuição
t de
Student
A distribuição
t de Student é uma
distribuição de probabilidade
estatística. A distribuição t é uma distribuição de probabilidade
teórica. É simétrica, campaniforme, e semelhante à curva normal
padrão, porém com caudas mais largas, ou seja, uma
simulação da t de Student pode gerar valores mais extremos que uma
simulação da normal. O único parâmetro v que a define se chama
graus de liberdade, e caracteriza a
sua forma. Quanto maior for esse parâmetro, mais próxima da normal
ela será.
![]()
Distribuição de
Pareto
![]()
![]()
Distribuição beta
Em estatística, uma distribuição beta é uma distribuição de probabilidade continua, com dois parâmetrosa e b cuja função de densidade para valores 0 < x < 1 é
-

-
Aqui, Γ é a função gama.
O valor esperado e a variância de uma variável aleatória X com distribuição beta são
-
![E[X]=\frac{a}{a+b}](http://upload.wikimedia.org/math/0/7/7/077871166dae78e2b2176225958f3c68.png)
-
. -
Um caso especial da distribuição beta, com a = 1 e b = 1 é a probabilidade uniforme.
Distribuição de
Weibull
A distribuição de Weibull, nomeada pelo seu criador Waloddi Weibull, é uma distribuição de probabilidade contínua, usada em estudos de tempo de vida de equipamentos e estimativa de falhas.
Sua função de densidade é
para
e f(x;k,λ) = 0 para
x < 0, aonde
k > 0 é o parâmetro de
forma e λ >
0 é o parâmetro de escala da
distribuição.
A distribuição de Weibull é usualmente plotada em uma escala específica (gráfico de Weibull), no qual a função é representada por uma reta.
Esta distribuição mostra uma boa aderência a dados de falha de equipamentos, necessitando de menos ocorrências que outras distribuições.
Distribuição Discreta
A distribuição discreta descreve quantidades aleatórias (dados de interesse) que podem assumir valores particulares e os valores são finitos. Por exemplo, uma variável aleatória discreta pode assumir somente os valores 0 e 1, ou qualquer inteiro não negativo, etc. Um exemplo de variável climatológica discreta são as tempestades com granizo.
Distribuição
Chi-Quadrado.
O coeficiente Chi-Quadrado (ler qui-quadrado), ou chi quadrado, normalmente escrito como χ² é um valor da dispersão para duas variáveis de escala nominal, usado em alguns testes estatísticos. Ele diz-nos em que medida é que os valores observados se desviam do valor esperado, caso as duas variáveis não estivessem correlacionadas.
Quanto maior o chi-quadrado, mais significante é a relação entre a variável dependente e a variável independente.
Este valor está relacionado com uma distribuição, chamada Distribuição Chi-Quadrado.
A Distribuição Chi-quadrado com k graus de liberdade é a distribuição gama com parâmetros (k/2, 1/2).
Quanto maior o número de casos (n) ou o número de linhas ou colunas da tabela de contingência, maior será o Chi-quadrado. Por isso não faz sentido comparar o Chi-quadrado de duas relações entre variáveis. Para o efeito existem outros coeficientes, entre os quais o coeficiente de contingência.
A distribuição Chi-quadrado pode ser simulada a partir da distribuição normal. Por
definição, se
forem k distribuições normais padronizadas (ou seja, média 0 e
desvio padrão 1)independentes, então a soma de seus
quadrados é uma distribuição Chi-quadrado com k graus de
liberdade:

Um corolário imediato da definição é que a soma de duas Chi-quadrado independentes também é uma Chi-quadrado:
A maioria das variáveis atmosféricas podem assumir valores contínuos. A temperatura, a precipitação, a altura geopotencial, a velocidade do vento, e outras quantidades não estão restritas a valores inteiros de unidades físicas em que são medidas. Embora a natureza da medição e os sistemas de relatos é tal que as medidas atmosféricas são arredondadas para valores discretos, mas o conjunto de valores observados normalmente é grande o suficiente para que a maioria das variáveis possam ainda ser tratadas como quantidades contínuas.
Existem duas funções associadas a cada variável contínua X: a função densidade de probabilidade, simbolizada por f(X), e a função cumulativa de probabilidade, ou função de distribuição de probabilidade representada por F(X).
Há muitas distribuições teóricas contínuas. Algumas das mais usadas em ciências atmosféricas são: distribuição normal, distribuição gamma, distribuição de valores extremos e distribuição exponencial. Neste material vamos tratar dos modelos probabilísticos citados, que têm importância prática na investigação científica, abordando as formas das funções densidade de probabilidade, bem como a esperança e a variância.
Distribuição Normal
![]()
A distribuição de probabilidade contínua mais importante e mais utilizada é a distribuição normal, geralmente citada como curva normal ou curva de Gauss. Sua importância em análise matemática resulta do fato de que muitas técnicas estatísticas, como análise de variância, de regressão e alguns testes de hipótese, assumem e exigem a normalidade dos dados. Além disso, a ampla aplicação dessa distribuição vem em parte devido ao teorema do limite central. Este teorema declara que na medida em que o tamanho da amostra aumenta, a distribuição amostral das médias amostrais tende para uma distribuição normal (Triola, 1998). Esta explicação parece um pouco complicada, portanto segue uma abordagem mais detalhada sobre a mesma.
Teorema do Limite Central
A capacidade de usar amostras para fazer inferências sobre parâmetros populacionais depende do conhecimento da distribuição amostral. Para obtermos uma distribuição amostral é necessário repetir n vezes um experimento e após calcular a média das amostras. Este procedimento fornece um novo conjunto de dados que é denominado de distribuição amostral. Na verdade o que o teorema do limite central quer dizer é que se uma população tem distribuição normal, a distribuição das médias amostrais extraídas da população também terá distribuição normal, para qualquer tamanho de amostra. Além disso, mesmo no caso de uma distribuição não-normal, a distribuição das médias amostrais será aproximadamente normal, desde que a amostra seja grande. Este é um resultado notável, na verdade, pois nos diz que não é necessário conhecer a distribuição de uma população para podermos fazer inferência sobre ela a partir de dados amostrais. A única restrição é que o tamanho da amostra seja grande. Uma regra prática muito usada é que a amostra deve consistir de 30 ou mais observações.
Estes resultados são conhecidos como o Teorema do Limite Central e representam talvez o conceito mais importante na inferência estatística.
Em geral, a distribuição amostral das médias amostrais é a distribuição das médias amostrais quando extraímos repetidas amostras de mesmo tamanho, da mesma população. Em outras palavras, se extrairmos amostras de mesmo tamanho da mesma população, calculamos suas médias e construímos um histograma destas médias, esse histograma tende para a forma de um sino de uma distribuição normal. Isto é verdade independentemente da forma da distribuição da população original.
Suponhamos que a variável x represente notas que podem ter, ou não, distribuição normal, e que a média dos valores x seja m e o desvio-padrão seja s. Suponha que coletemos amostras de tamanho n e calculemos as médias amostrais. O que sabemos sobre a coleção de todas as médias amostrais que obtemos repetindo esse experimento? O Teorema do Limite Central nos diz que, na medida em que o tamanho n da amostra aumenta, a distribuição amostral das médias amostrais tente para uma distribuição normal com média m e desvio-padrão .
