Cavalcante Consultores – treinamento e consultoria em finanças e Excel

Distribuição normal

Cavalcante Consultores > Biblioteca de Excel > Distribuição normal

O que é?

A distribuição normal (também chamada distribuição gaussiana, em homenagem a Carl Friedrich Gauss) é um importante modelo de distribuição estatística, observado freqüentemente em experimentos relacionados ao estudo de fenômenos de ciências tão distintas quanto biologia, física e economia.

Uma variável aleatória X seguindo um modelo de distribuição normal é representada por X ~ N(?, ?2), onde ? representa a média, e ?, o desvio padrão. O segundo parâmetro da distribuição, ?2, é a variância de X. A definição dos parâmetros de uma distribuição normal vem das seguintes caracterísicas:

Estas restrições dão origem a uma curva em formato de sino, com espaço amostral infinito e a propriedade de que suas medidas de tendência central (média, mediana e moda) são idênticas. Por conta disso, é possível baseá-la apenas nos dois parâmetros listados anteriormente (? e ?).

O Excel dispõe de duas duas funções relacionadas à distribuição normal: DIST.NORM e INV.NORM; a primeira calcula a probabilidade cumulativa x de ocorrência de um valor y (ou seja, calcula x = P(X < y). A segunda função obtém y para um x dado.

Exemplo

No exemplo a seguir, um instituto de pesquisas realiza uma amostragem com 5000 pessoas para obter uma estimativa da altura média do brasileiro adulto. Estas pessoas são sorteadas para a pesquisa através de uma estratificação adequada, que reflita os dados de toda a população do país. Observe os resultados, categorizados por faixas de altura:

Neste experimento, notamos que os valores registrados se adensam nas alturas centrais, crescendo até determinado ponto e depois decrescendo. Esta amostra tem, aproximadamente, as características de comportamento descritas anteriormente, de forma que uma aproximação normal pode ser uma bom modelo para a distribuição de altura do brasileiro adulto. Veja o gráfico das categorias nas quais dividimos as observações:

A aparência de sino dos pontos reforça a idéia de que estamos lidando com uma distribuição aproximadamente normal. Ao calcularmos a média e o desvio padrão da amostra, obtemos os seguintes valores:

Estes valores permitem a caracterização de uma distribuição normal induzida pela amostra, cuja curva está representada em laranja no gráfico:

Observe que a curva normal definida por N(1,653 m; 0,030 m2) modela bem os valores medidos. Nesta distribuição normal, uma linha vertical cortando a média separa a distribuição em duas partes:

Dispondo deste modelo, podemos utilizar as funções de distribuição normal do Excel (ou, no caso de estarmos trabalhando com papel, uma tabela de distribuição normal) para obter facilmente uma série de informações sobre nossa população. Por exemplo, podemos responder qual é a porcentagem da população adulta de estatura considerada "normal", entre 1,50 m e 1,90 m. Este valor é numericamente igual à área abaixo:

Pratique!