Estimativa de uma proporçãoEditar
Uma situação relativamente simples é a estimativa de uma proporção. Por exemplo, podemos querer estimar a proporção de residentes numa comunidade com pelo menos 65 anos de idade.
O estimador de uma proporção é p ^ = X / n {\displaystyle {\p}}=X/n}
, onde X é o número de observações ‘positivas’ (por exemplo, o número de pessoas fora das n pessoas amostradas que têm pelo menos 65 anos). Quando as observações são independentes, este estimador tem uma distribuição binomial (em escala) (e é também a média amostral dos dados de uma distribuição Bernoulli). A variância máxima desta distribuição é 0,25n, o que ocorre quando o parâmetro verdadeiro é p = 0,5. Na prática, como p é desconhecido, a variância máxima é freqüentemente usada para avaliações de tamanho de amostra. Se uma estimativa razoável para p é conhecida a quantidade p ( 1 – p ) {\\i1-p) {\i1}.
pode ser usado no lugar de 0,25.
Para um n suficientemente grande, a distribuição de p ^ ^ estilo de exibição ^ que ^p}}
será aproximado por uma distribuição normal. 25º Episódio 25º, à direita. Div>>div id=”847aaa0c6fb”>Esq.25] [n}{n}right) , onde Z é um Z-score padrão para o nível de confiança desejado (1,96 para um intervalo de confiança de 95%).
se quisermos ter um intervalo de confiança que seja W unidades total em largura (W/2 em cada lado da média da amostra), resolveríamos
Z 0,25 n = W / 2 {\i1}displaystyle Z{\i}sqrt {\i}frac {0.25}{n}}=W/2}
para n, produzindo o tamanho da amostra
n = Z 2 W 2 {\i1}displaystyle n={\i1}{\i1}{Z^{2}}{W^{2}}}}
, no caso de usar .5 como a estimativa mais conservadora da proporção. (Nota: W/2 = margem de erro.)
Outra forma, a fórmula seria Z p ( 1 – p ) n = W / 2 {\displaystyle Z{\sqrt {\frac {p(1-p)}}=W/2}
, que rende n = 4 Z 2 p ( 1 – p ) W 2 {\displaystyle n={\frac {\frac {\p(1-p)}{W^{2}}}}
.
Por exemplo, se estamos interessados em estimar a proporção da população dos EUA que apoia um candidato presidencial em particular, e queremos que a largura do intervalo de confiança de 95% seja no máximo de 2 pontos percentuais (0,02), então precisaríamos de uma amostra de (1,962)/(0,022) = 9604. É razoável usar a estimativa de 0,5 para p neste caso, porque as corridas presidenciais são frequentemente próximas de 50/50, e também é prudente usar uma estimativa conservadora. A margem de erro neste caso é de 1 ponto percentual (metade de 0,02).
O precedente é normalmente simplificado…
( p ^ – 1,96 0,25 n , p ^ + 1,96 0,25 n ) {\i1}esquerda({\i}-1,96 {\i}-1,96 {\i}sqrt {\i}frac {\i}.25,{n},{\i1}widehat {p}+1.96 {\i}sqrt {0.25}{n}direita){div>
formará um intervalo de confiança de 95% para a proporção verdadeira. Se esse intervalo não precisa ser maior que W unidades de largura, a equação
4 0,25 n = W {\i1}{\i1}= W {\i}displaystyle 4{\i}{\i}frac {0,25}{\i}=W}
pode ser resolvido para n, produzindo n = 4/W2 = 1/B2 onde B é o erro vinculado na estimativa, ou seja a estimativa é normalmente dada como dentro de ± B. Assim, para B = 10% é necessário n = 100, para B = 5% é necessário n = 400, para B = 3% é necessário aproximadamente n = 1000, enquanto para B = 1% é necessário um tamanho de amostra de n = 10000. Estes números são citados frequentemente em relatórios de sondagens de opinião e outras sondagens por amostragem. No entanto, lembre-se sempre que os resultados relatados podem não ser o valor exato, já que os números são de preferência arredondados para cima. Sabendo que o valor de n é o número mínimo de pontos de amostra necessários para obter o resultado desejado, o número de inquiridos deve então estar sobre ou acima do mínimo.
Estimativa de uma médiaEditar
Uma proporção é um caso especial de uma média. Ao estimar a média da população usando uma amostra (iid) independente e distribuída de forma idêntica de tamanho n, onde cada valor de dado tem variância σ2, o erro padrão da média da amostra é:
σ n . estilo de exibição {\\frac {\sigma }{\sqrt {\n}}.}
Esta expressão descreve quantitativamente como a estimativa se torna mais precisa à medida que o tamanho da amostra aumenta. Usando o teorema do limite central para justificar a aproximação da média da amostra com uma distribuição normal produz um intervalo de confiança da forma
( x ¯ – Z σ n , x ¯ + Z σ n ) {\i1}-{\i1}-{\i1}-{\i1}-{\i1}- esquerda({\i}- barra {\i}-frrac {\i}-{\i}- zsqrt {\i},\Esquad..,\z z-qrt {n}{n=direito), onde Z é um padrão Z-score para o nível de confiança desejado (1.96 para um intervalo de confiança de 95%).
se desejarmos ter um intervalo de confiança que seja W unidades total em largura (W/2 em cada lado da média da amostra), nós resolveríamos
Z σ n = W / 2 {\frac {\sqrt {\sqrt {n}}=W/2}
para n,
. (Nota: W/2 = margem de erro.)
Por exemplo, se estivermos interessados em estimar a quantidade pela qual um medicamento baixa a pressão arterial de um indivíduo com um intervalo de confiança de 95% que é de seis unidades de largura, e sabemos que o desvio padrão da pressão arterial na população é de 15, então o tamanho da amostra necessária é de 4 × 1.96 2 × 15 2 6 2 = 96,04 {\i1}=96,04 {\i} {\i1}=96,04 {\i}
, que seria arredondado para 97, porque o valor obtido é o tamanho mínimo da amostra, e os tamanhos das amostras devem ser inteiros e devem estar sobre ou acima do mínimo calculado.