Determinação do tamanho da amostra

Estimativa de uma proporçãoEditar

Artigo principal: Proporção populacional

Uma situação relativamente simples é a estimativa de uma proporção. Por exemplo, podemos querer estimar a proporção de residentes numa comunidade com pelo menos 65 anos de idade.

O estimador de uma proporção é p ^ = X / n {\displaystyle {\p}}=X/n}

\ que p = X/n

, onde X é o número de observações ‘positivas’ (por exemplo, o número de pessoas fora das n pessoas amostradas que têm pelo menos 65 anos). Quando as observações são independentes, este estimador tem uma distribuição binomial (em escala) (e é também a média amostral dos dados de uma distribuição Bernoulli). A variância máxima desta distribuição é 0,25n, o que ocorre quando o parâmetro verdadeiro é p = 0,5. Na prática, como p é desconhecido, a variância máxima é freqüentemente usada para avaliações de tamanho de amostra. Se uma estimativa razoável para p é conhecida a quantidade p ( 1 – p ) {\\i1-p) {\i1}.

{\i1-p)}

pode ser usado no lugar de 0,25.

Para um n suficientemente grande, a distribuição de p ^ ^ estilo de exibição ^ que ^p}}

{\i}

será aproximado por uma distribuição normal. 25º Episódio 25º, à direita. Div>>div id=”847aaa0c6fb”>Esq.25] [n}{n}right) , onde Z é um Z-score padrão para o nível de confiança desejado (1,96 para um intervalo de confiança de 95%).

se quisermos ter um intervalo de confiança que seja W unidades total em largura (W/2 em cada lado da média da amostra), resolveríamos

Z 0,25 n = W / 2 {\i1}displaystyle Z{\i}sqrt {\i}frac {0.25}{n}}=W/2}

{\i1}{\i1}{\i1}=W/2}

para n, produzindo o tamanho da amostra

n = Z 2 W 2 {\i1}displaystyle n={\i1}{\i1}{Z^{2}}{W^{2}}}}

{\displaystyle n={\frac {Z^{2}}{W^{2}}}}

, no caso de usar .5 como a estimativa mais conservadora da proporção. (Nota: W/2 = margem de erro.)

Outra forma, a fórmula seria Z p ( 1 – p ) n = W / 2 {\displaystyle Z{\sqrt {\frac {p(1-p)}}=W/2}

{\displaystyle Z{\sqrt {\frac {\p(1-p)}}=W/2}

, que rende n = 4 Z 2 p ( 1 – p ) W 2 {\displaystyle n={\frac {\frac {\p(1-p)}{W^{2}}}}

{\i1}displaystyle n={\i1}frac {4Z^{2}p(1-p)}{W^{2}}}}

.

Por exemplo, se estamos interessados em estimar a proporção da população dos EUA que apoia um candidato presidencial em particular, e queremos que a largura do intervalo de confiança de 95% seja no máximo de 2 pontos percentuais (0,02), então precisaríamos de uma amostra de (1,962)/(0,022) = 9604. É razoável usar a estimativa de 0,5 para p neste caso, porque as corridas presidenciais são frequentemente próximas de 50/50, e também é prudente usar uma estimativa conservadora. A margem de erro neste caso é de 1 ponto percentual (metade de 0,02).

O precedente é normalmente simplificado…

( p ^ – 1,96 0,25 n , p ^ + 1,96 0,25 n ) {\i1}esquerda({\i}-1,96 {\i}-1,96 {\i}sqrt {\i}frac {\i}.25,{n},{\i1}widehat {p}+1.96 {\i}sqrt {0.25}{n}direita){div>

{\i1}displaystyle left(widehat {p}{p}-1.96qrt {0,25},{0,25}{n},{p>widehat {p}+1,96 {sqrt {0,25}{n}}}

formará um intervalo de confiança de 95% para a proporção verdadeira. Se esse intervalo não precisa ser maior que W unidades de largura, a equação

4 0,25 n = W {\i1}{\i1}= W {\i}displaystyle 4{\i}{\i}frac {0,25}{\i}=W}

{\\sqrt {\sqrt {\n}}}=W}

pode ser resolvido para n, produzindo n = 4/W2 = 1/B2 onde B é o erro vinculado na estimativa, ou seja a estimativa é normalmente dada como dentro de ± B. Assim, para B = 10% é necessário n = 100, para B = 5% é necessário n = 400, para B = 3% é necessário aproximadamente n = 1000, enquanto para B = 1% é necessário um tamanho de amostra de n = 10000. Estes números são citados frequentemente em relatórios de sondagens de opinião e outras sondagens por amostragem. No entanto, lembre-se sempre que os resultados relatados podem não ser o valor exato, já que os números são de preferência arredondados para cima. Sabendo que o valor de n é o número mínimo de pontos de amostra necessários para obter o resultado desejado, o número de inquiridos deve então estar sobre ou acima do mínimo.

Estimativa de uma médiaEditar

Uma proporção é um caso especial de uma média. Ao estimar a média da população usando uma amostra (iid) independente e distribuída de forma idêntica de tamanho n, onde cada valor de dado tem variância σ2, o erro padrão da média da amostra é:

σ n . estilo de exibição {\\frac {\sigma }{\sqrt {\n}}.}

{\i1}{\i1}displaystyle {\i}{\i1}frac {\i}{\iqrt {\i}.}

Esta expressão descreve quantitativamente como a estimativa se torna mais precisa à medida que o tamanho da amostra aumenta. Usando o teorema do limite central para justificar a aproximação da média da amostra com uma distribuição normal produz um intervalo de confiança da forma

( x ¯ – Z σ n , x ¯ + Z σ n ) {\i1}-{\i1}-{\i1}-{\i1}-{\i1}- esquerda({\i}- barra {\i}-frrac {\i}-{\i}- zsqrt {\i},\Esquad..,\z z-qrt {n}{n=direito), onde Z é um padrão Z-score para o nível de confiança desejado (1.96 para um intervalo de confiança de 95%).

se desejarmos ter um intervalo de confiança que seja W unidades total em largura (W/2 em cada lado da média da amostra), nós resolveríamos

Z σ n = W / 2 {\frac {\sqrt {\sqrt {n}}=W/2}

{\displaystyle {\sqrt {\sqrt {n}}=W/2}

para n,

{\i1}{\i1}displaystyle n={\i1}frac {4Z^{2}\i}sigma ^{W^{2}}}}

. (Nota: W/2 = margem de erro.)

Por exemplo, se estivermos interessados em estimar a quantidade pela qual um medicamento baixa a pressão arterial de um indivíduo com um intervalo de confiança de 95% que é de seis unidades de largura, e sabemos que o desvio padrão da pressão arterial na população é de 15, então o tamanho da amostra necessária é de 4 × 1.96 2 × 15 2 6 2 = 96,04 {\i1}=96,04 {\i} {\i1}=96,04 {\i}

{\i1}{\i1}{\i1}displaystyle {\i}{\i1}{\i1}{\i1}{\i1}div>><img src={\i1}{\i1}displaystyle {\i}{\i1}frac {\i1}vezes 1.96^{\i}{\i}{\i1}{\i1}{\i1}vezes 15^{\i}}=96.04}”>

, que seria arredondado para 97, porque o valor obtido é o tamanho mínimo da amostra, e os tamanhos das amostras devem ser inteiros e devem estar sobre ou acima do mínimo calculado.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *