Bom dia!
Estou enviando o próximo conteúdo que iremos ter em Estatística II.
Beijos,
Mary.
ESTIMAÇÃO E INTERVALO DE CONFIANÇA
Frequentemente necessitamos, por meio de amostras, conhecer informações gerais da população.
A estatística indutiva é a ferramenta que vai nos auxiliar neste processo, ou seja, vai nos permitir tirar conclusões probabilísticas sobre aspectos das populações, com base na observação de amostras extraídas dessas populações.
A partir das condições em que se realiza um experimento ou um teste estatístico, podemos esperar um resultado ou outro. Se estivermos preparando um teste de controle de qualidade na produção de um componente eletrônico à base de um único material e fabricado com máquinas de alta precisão, poderemos esperar que algo em torno de 99% deles estejam em perfeitas condições e 1% não seja aprovado no controle. Em outros casos, como na fabricação de um tipo de biscoito com cobertura e recheio, por exemplo, a existência de diversos ingredientes, desde a farinha até o chocolate da cobertura, causará maior variação no produto final, de modo que, se estivermos controlando o peso, dificilmente conseguiremos mais de 95% dos pacotes com peso dentro do limite estipulado por lei, que é de 1% acima ou abaixo do valor marcado na embalagem.
As situações que acabamos de mencionar mostram que o estatístico deve ter a sensibilidade de prever os percentuais de erros possíveis no teste ou na estimativa que ele estiver preparando, tentando, é claro, diminuí-los e, assim, aumentar a certeza das previsões.
INTERVALOS DE CONFIANÇA são usados para indicar a confiabilidade de uma estimativa. Por exemplo, um IC pode ser usado para descrever quão confiáveis são os resultados de uma pesquisa. Sendo todas as outras coisas iguais, uma pesquisa que resulte num IC pequeno é mais confiável do que uma que resulte num IC maior.
TEORIA DA AMOSTRAGEM
A teoria da amostragem é um estudo das relações existentes entre a população e as amostras dela extraídas. Constitui o que chamamos de estatística indutiva ou inferência estatística que consiste em inferir (concluir, deduzir) dados importantes sobre uma população a partir da análise de resultados observados em amostras aleatórias. Como toda conclusão deduzida a partir da amostragem é acompanhada de um grau de incerteza ou risco, o problema fundamental da inferência estatística é medir o grau de incerteza ou risco das generalizações.
ESTIMATIVAS
Um dos métodos para realizar inferências a respeito dos parâmetros é a estimação, que determina estimativas dos parâmetros populacionais. Parâmetros são medidas numéricas que descrevem uma população. Conhecemos os seguintes parâmetros: média, mediana, moda, variância, desvio padrão e coeficiente de variação. Existem dois tipos de estimação de um parâmetro populacional: estimação por ponto e a estimação por intervalo.
Nas estimativas pontuais, chegamos a afirmações do tipo:
a) A média das idades é 18 anos;
b) O consumo médio é 1,3 kg/mês;
c) São 23% de crianças obesas.
Nas estimativas intervalares, chegamos a afirmações do tipo:
a) A média das idades está entre 19 e 22 anos;
b) O candidato X ganhará de 12 a 15,5% dos votos;
c) Choverá de 20 a 60 milímetros nesse dia.
Algumas estimativas pontuais já foram feitas em exemplos anteriores, seja quando calculamos a média das médias amostrais ou alguma proporção. De fato, as estimativas pontuais da média e da proporção correspondem ao valor da media das médias ou à proporção média. Também o desvio padrão da população obtido através do desvio da distribuição amostral, feito anteriormente, se enquadra neste caso.
Toda estimativa acarretará, entretanto, uma certa margem de erro, os quais devemos saber prever. O cálculo ou dimensionamento desse erro leva-nos à estimativa intervalar, ou seja, a um intervalo onde aquela média ou aquela proporção tem certa chance de estar correta. A partir desse raciocínio, vamos utilizar o conceito de intervalos de confiança.
Exemplo de estimativa pontual: Para avaliar a taxa de desemprego em determinado estado, escolhe-se uma amostra aleatória de 1.000 habitantes em idade de trabalho e contam-se os desempregados: 87. Estimar a proporção de desempregados em todo estado.
p= 87/1000 → p= 0,087 = 8,7%
Estimação por Ponto
A partir das observações, usando o estimador, procura-se encontrar um valor numérico único (estimativa) que esteja bastante próximo do verdadeiro valor do parâmetro.
Este procedimento não permite julgar a magnitude (tamanho) do erro que podemos estar cometendo, mas a distribuição por amostragem dos estimadores torna possível o estudo das qualidades do estimador.
ESTIMADORES PONTUAIS DOS PRINCIPAIS PARÂMETROS POPULACIONAIS
PARÂMETRO | ESTIMADOR |
MÉDIA (͞x) | ͞x = 1/n. ∑xi |
VARIÃNCIA (s²) | S² = 1/n-1. ∑(xi - ͞x)² |
DESVIO PADRÃO (s) | S = √s² |
PROPORÇÃO (p) | P = x/n, onde x= nº de elementos da amostra que possuem a característica. n = tamanho da amostra. |
Estimação por intervalo
Procura-se determinar um intervalo que contenha o valor do parâmetro populacional, com certa margem de segurança. Esse procedimento permite julgar a magnitude do erro que podemos estar cometendo.
Neste tipo de estimativa temos um intervalo de valores em torno do parâmetro amostral, no qual julgamos, com um risco conhecido de erro, estar o parâmetro da população. A esse intervalo chamamos intervalo de confiança.
ESTIMATIVA DE MÉDIAS DE UMA POPULAÇÃO
Para efetuar a Estimativa de Médias de uma População utiliza-se desvio padrão da distribuição que constitui a amostra (distribuição amostral). Deve-se levar em consideração se o desvio padrão da população é ou não conhecido.
Para desvio padrão populacional conhecido, temos:
Estimativa Pontual da Média
Amostra População
͞x ͞X
Estimativa Intervalar da Média
Amostra População
͞x m ± zS onde s= s/√n
Lembrando que:
͞x= Média da Amostra;
m= Média da População;
s= desvio padrão da amostra;
S= desvio padrão da população;
n= número de elementos da amostra;
z= número de desvios padrão da tabela normal.
Assim, teremos a estimativa intervalar dada pela fórmula:
m= z. S/√n
|
Exemplos
1) Construir intervalos de confiança de 90%, 95% e 99% para a média de uma população aproximadamente normal, que apresenta numa amostra de 100 elementos extraída dessa população desvio padrão 2 e média (͞x)= 35,6.
Determinação de z:
Ao observarmos a representação da distribuição normal sabemos que toda a área entre a curva e sua base tem valor 100%. Logo, utilizamos 50% da curva.
Intervalos de confiança de 90%→ 90%:2 = 45%. Na Tabela para a Distribuição Normal Padronizada encontramos o valor mais próximo de 0,45, que é 0,4505. Para esse valor temos z= 1,65. Para 95% e 99% procedemos da mesma maneira.
Confiança Desejada | Z | Fórmula | Intervalo de Confiança |
90% | 1,65 | m±1,65. S/√n | 35,6 ±1,65. 2/√100= 35,6± 0,330 |
95% | 1,96 | m±1,96. S/√n | 35,6 ±1,96. 2/√100= 35,6± 0,392 |
99% | 2,58 | m±2,58. S/√n | 35,6 ±2,58. 2/√100= 35,6± 0,516 |
Podemos representar os intervalos de confiança da seguinte maneira:
a) 90% → [35,270; 35,930]
b) 95% → [35,208; 35,992]
c) 99% → [35,084; 35,116]
2) Os pesos das pessoas de uma cidade se distribuem de forma normal, com média= 64 kg e desvio padrão= 2,6 kg. Determinar os limites do intervalo de confiança de:
a) 95%
Neste caso, os limites são ͞x = 1,96 s, correspondendo, portanto, a:
64 + 1,96. 2,6 = 69,096 kg
64 – 1,96. 2,6 = 58,904 kg
Resposta: O intervalo de confiança de 95% é [58,904; 69,096] kg.
b) 99%
Neste caso, z= 2,58 e os limites são:
64 + 2,58. 2,6 = 70,708
64 – 2,58. 2,6 = 57,292
Resposta: O intervalo de confiança de 99% é [57,292; 70,708] kg.
c) 98%
Agora, deveremos usar a tabela, sendo inicialmente preciso dividir 98 por 2, encontrando assim 49%. Consultando a tabela, teremos z= 2,33. Assim, encontramos os seguintes limites e intervalos de confiança:
64 + 2,33. 2,6 = 70,058
64 – 2,33. 2,6 = 57,942
Resposta: O intervalo de confiança de 98% é [57,942; 70,058] kg.
3) O Instituto Nacional de Pesos e Medidas fixa uma variação de apenas 1% no peso declarado dos alimentos industrializados. Assim, uma lata de leite em pó de 500 g, por exemplo, deve ter o seu peso real variável apenas de 495 a 505 gramas e, sendo encontradas embalagens com pesos inferiores ao limite máximo, a fábrica é multada. Qual deve ser o desvio padrão limite para o acompanhamento estatístico da produção do leite em pó se a fábrica fixar um nível de confiança de 99%?
A variação de 5 (1%) gramas deve corresponder a 2,58 s (99% :2 = 47,5%). Assim:
2,58 s = 5 → s = 5/2,58 → s = 1,94
Resposta: O maior valor do desvio para que sejam obedecidos os critérios fixados é 1,94 g.
EXERCÍCIOS
1) Para uma população de elementos cuja média é 32,3 e o desvio padrão 1,4, determine os limites dos intervalos de confiança de:
a) 90% b) 95% c) 97% d) 98% e) 99%
a) 90/2= 45%
Resposta: [29,99; 34,61]
b) 95/2= 47,5%
Resposta: [29,56; 35,04]
c) 97/2= 48,5%
Resposta: [29,26; 35,34]
d) 98/2= 49%
Resposta: [29,04; 35,56]
e) 99/2= 49,5%.
Resposta: [28,69; 35,91]
2) Uma produção de manteiga embalada em pacotes de 150g não pode ter seu peso fora do intervalo [148,5; 151,5]. Calcule o valor limite do desvio padrão para um intervalo de confiança de:
a) 90% b) 95% c) 99%
a) Resposta s= 0,91
b) Resposta s= 0,77
c) Resposta s = 0,58
3) Para uma dada semana, foi tomada uma amostra aleatória de 30 empregados horistas selecionados de um grande número de empregados de uma fábrica, a qual apresentou um salário médio de ͞x= R$ 180,00 com um desvio padrão da amostra de s= R$ 14,00. Qual o nível do salário médio para todos os empregados, com um grau de confiança de 95% nesta estimativa?
Resposta ͞x= [174,98; 185,01] reais.
Assim, podemos afirmar que o nível do salário médio para todos os empregados está entre R$ 174,98 e R$ 185,02, cm um grau de confiança de 95% nesta estimativa.
4) Suponha que o desvio padrão da vida útil de uma determinada marca de um conversor de imagem de televisão é s= 500 horas, mas que a média da vida útil é desconhecida. Supõe-se que a vida útil dos conversores tem uma distribuição aproximadamente normal. Para uma amostra de n= 15, a média da útil é X= 8.900 horas de operação. Construir um intervalo de confiança de 95% e de 90% para estimar a média da população.
a) Para 95%
͞Resposta x= 8.647; 9.153] horas.
b) Para 90%
Resposta x= [8.687; 9.113] horas.
Erro padrão da estimativa
Ao se obter uma amostra qualquer de tamanho n, calcula-se a média aritmética populacional. Provavelmente, se uma nova amostra aleatória for realizada, a média aritmética obtida será diferente daquela da primeira amostra. A variabilidade das médias é estimada pelo seu erro padrão. Assim, o erro padrão avalia a precisão do cálculo da média populacional.
O erro padrão é dado pela fórmula:

Onde,
Sx → é o erro padrão
s → é o desvio padrão
n → é o tamanho da amostra
Observação: quanto melhor a precisão no cálculo da média populacional, menor será o erro padrão.
Exemplo 1. Numa população obteve-se desvio padrão de 2,64 com uma amostra aleatória de 60 elementos. Qual o provável erro padrão?
Solução:
Isso indica que a média pode variar 0,3408 para mais ou para menos.
Exemplo 2. Numa população obteve-se desvio padrão de 1,32 com uma amostra aleatória de 121 elementos. Sabendo que para essa mesma amostra obteve-se uma média de 6,25, determine o valor mais provável para a média dos dados.
Solução: Para determinarmos o valor mais provável da média dos dados devemos calcular o erro padrão da estimativa. Assim, teremos:

Finalizando, o valor mais provável para a média dos dados obtidos pode ser representado por:![]()
Por Marcelo Rigonatto
Especialista em Estatística e Modelagem Matemática
Equipe Brasil Escola
Desvio Padrão da Distribuição Amostral das Médias
O desvio padrão da distribuição amostral das médias é usualmente chamado de ERRO PADRÃO, e é calculado pela fórmula:
s͞x = s/√n
A distribuição amostral das médias tem uma disposição que, normalmente, é menor do que a dispersão dos valores individuais. Isto é muito fácil d constatar se considerarmos um exemplo numérico: tomaremos um conjunto de apenas 4 elementos e dele sacaremos todas as amostras possíveis de dos deles, para mostrar os resultados da dispersão. É importante salientar que, no caso de conjuntos muito numerosos ou praticamente infinitos, o número de amostras não precisa, e nem poderá se esgotar.
Conjunto = {2, 4, 6, 8}
Média (͞x)= 2+ 4+ 6+ 8/4 → ͞x = 5
Desvio (s) = √(2-5)²+ (4-5)²+ (6-5)²+ (8-5)²/4= √20/4= √5 = 2,236
Amostras= {(2,2), (2,4), (2,6), (2,8), (4,2), (4,4), (4,6), (4,8), (6,2), (6,4), (6,6), (6,8), (8,2), (8,4), (8,6), (8,8)}
Média em cada amostra = {2, 3, 4, 5, 3, 4, 5, 6, 4, 5, 6, 7, 5, 6, 7, 8}
MÉDIA DAS MÉDIAS DAS AMOSTRAS
M= 2+ 3+ 4+ 5+ 3+ 4+ 5+ 6+ 4+ 5+ 6+ 7+ 5+ 6+ 7+ 8/16
M = 5
Desvio da distribuição das médias (s͞x) = √(2-5)²+ (3-5)²+ (4-5)²+ (5-5)²+ (3-5)²+ (4-5)²+ (5-5)²+ (6-5)²+ (4-5)²+ (5-5)²+ (6-5)²+ (7-5)²+ (5-5)²+ (6-5)²+ (7-5)²+ (8-5)²/16
s͞x = √40/16= √2,5 = 1,581
s/s͞x = 2,236/1,581 1,4142 ~ √2
Se nos lembrarmos de que as amostras sacadas foram de dois elementos, teremos:
s/s͞x = √n
ou s/√n = s͞x
DISTRIBUIÇÃO AMOSTRAL DAS MÉDIAS
Se a população é finita e de tamanho N conhecido, e se a amostragem é feita sem reposição, então, o desvio padrão das médias amostrais é calculado pela fórmula:
s͞x= s/√n. (√N-n/√N-1)
Média e Desvio Padrão das Proporções
Se, ao invés de estarmos investigando uma média qualquer, estivermos checando uma proporção, quer dizer, se, ao invés de querermos saber, por exemplo, o peso médio dos alunos da classe, desejarmos saber qual a proporção de alunos com peso acima de 80 kg, precisaremos, neste caso, avaliar essa proporção em cada amostragem, para depois estimar a proporção real na tabulação.
Vejamos um exemplo. Vamos supor que desejamos avaliar a proporção de alunos da escola X com peso acima de 80 kg. Peguemos uma amostra de 50 alunos e verifiquemos que, destes, 12 pesam mais que 80 kg. Teremos, portanto, a seguinte fração:
12/50 = 0,24 → Corresponde a 24%. A este número chamaremos de p.
O desvio padrão estimado da distribuição amostral das proporções (sp) = √p(1-p)/n, onde n é o número de elementos nas amostras. No nosso caso:
Sp = √0,24.(1-0,24)/50 → sp = √0,1824/50→ sp = √0,0036→ sp = 0,06→ 6%
Temos, então, que a proporção amostral é de 24% e o desvio padrão é de 6%.
Exemplos
1) Para avaliar a idade média dos assistentes de um show de rock, perguntou-se a idade a 12 grupos de 4 pessoas de cada vez. Os resultados foram tabulados:
18 | 18 | 20 | 21 | 15 | 19 | 14 | 20 | 19 | 18 | 22 | 20 |
16 | 17 | 16 | 18 | 16 | 18 | 24 | 16 | 21 | 14 | 21 | 16 |
21 | 19 | 17 | 17 | 19 | 18 | 20 | 19 | 23 | 18 | 19 | 20 |
17 | 22 | 16 | 15 | 17 | 16 | 17 | 16 | 17 | 13 | 24 | 21 |
∑= 72 | 76 | 69 | 71 | 67 | 71 | 75 | 71 | 80 | 63 | 86 | 77 |
͞x= 18 | 19 | 17,25 | 17,75 | 16,75 | 17,75 | 18,75 | 17,75 | 20 | 15,75 | 21,5 | 19,25 |
Determinar a média de cada amostra, a média das médias e o desvio padrão da distribuição das médias das amostras.
Verificamos que n=4 (4 pessoas por grupo)
a) Média das Médias
M= ∑ ͞xi/n→ M= 878/48→ M= 18,29
b) Desvio da distribuição das médias (s͞x)
s͞x= √(18-18,29)²+ (19-18,29²+ (17,25-18,29)²+ (17,75-18,29)²+ (16,75-18,29)²+ (17,75-18,29)²+ (18,75-18,29)²+ (17,75-18,29)²+ (20-18,29)²+ (15,75-18,29)²+ (21,5-18,29)²+ (19,25-18,29)²/12
s͞x= √0,084+ 0,504+ 1,082+ 0,292+ 2,372+ 0,292+ 0,212+ 0,292+ 2,924+ 6,452+ 10,304+ 0,922/12
s͞x= √25,729/12→ s͞x= √2,144 → s͞x= 1,464
Previsão do desvio padrão de toda a população (s)
s= s͞x.√n → s= 1,46. √4 → s= 1,46 . 2 → s= 2,928
2) Para avaliar a porcentagem de pessoas presentes ao show de rock que gostavam também de samba, foram consultadas 100 pessoas e obtidas 22 respostas positivas. Neste caso, p= 22/100= 22%, e o desvio será:
sp = √p(1-p)/n → sp = √0,22.(1-0,22)/100
sp = 0,041 = 4,1%
Exercícios
1) Uma população conhecida de pessoas de certo bairro possui idades distribuídas normalmente com média de 20 anos e desvio padrão de 2,6 anos. Quais os limites do intervalo de confiança de 90% da média amostral de 20 elementos?
Resposta: Em números inteiros, temos: [19 anos; 21 anos]
2 )De uma produção de chocolates retirou-se algumas amostras de 10 elementos. Calculou-se a média de cada uma, a média das médias (M) e o desvio padrão da distribuição das médias (s͞x). Os valores encontrados foram:
M= 198,7 gramas; s͞x= 3,54 gramas
Pede-se:
a) A estimativa do desvio padrão (s) de toda a produção de chocolates.
Resposta: 11,19
b) A média real da produção de chocolates dentro de um intervalo de confiança de 95%.
Resposta: [176,77; 220,63]
c) A média real da produção de chocolates dentro de um intervalo de confiança de 99%.
Resposta: [169,83; 227,57]
d) Dentre os intervalos encontrados nas respostas aos itens b e c acima, qual deles tem maior amplitude?
Resposta: O item c tem maior amplitude.
3) A média de idade de pessoas que procuraram um Posto de Atendimento é ͞x= 50 anos e o desvio padrão é de 12 anos. Se considerarmos uma amostra de tamanho n= 36 pessoas, determinar o erro padrão da distribuição.
Resposta: s͞x =2 anos
4) Um auditor tom uma amostra aleatória de tamanho n= 16 de um conjunto de N= 100 contas a receber. Não se conhece o desvio padrão dos valores das 100 contas a receber. Contudo, o desvio padrão da amostra é s= R$ 57,00. Determinar o valor do erro padrão da distribuição de amostragem da média.
Resposta: s͞x=13,126
5) Um auditor toma uma amostra de n= 36 de uma população de 1.000 contas a receber. O desvio padrão da população é desconhecido, mas o desvio padrão da amostra é R$ 43,00. Se o verdadeiro valor da média da população de contas a receber é ͞x= 260,00, qual a probabilidade de que a média da amostra seja menor ou igual a R$ 250,00?
Resposta: P= 8,23%
6) Um analista de mercados obtém dados de uma amostra de 100 consumidores de um total de 400 que adquiriram uma “oferta especial”. As 100 pessoas gastaram, na loja, uma média de ͞x= R$ 24,57 com um desvio padrão de s= R$ 6.60. Usando um intervalo de 95% de confiança, estimar o valor médio de compra para todos os 400 clientes.
Resposta: x͞= [23,45; 25,69] reais
Exercícios Gerais
1) O valor médio das vendas de um determinado produto durante o último ano foi de M= R$ 3.400,00 por varejista que trabalha com o produto, com um desvio padrão de s= R$ 200,00. Se um grande número de varejistas trabalha com o produto, determinar o erro padrão da média para uma amostra de tamanho n=25.
Resposta: s͞x= 40 reais
2) Com referência ao exercício anterior, suponha que apenas 100 varejistas trabalham com o produto. Determinar o erro padrão da média para uma amostra de n=25.
Observação: Ao fazer amostras de uma população finita, a fórmula para o cálculo do erro padrão estimado da média, é dada por:
s͞x= s/√n. (√N-n/√N-1)
Resposta: s͞x= 34,82
3) O número de estabelecimentos varejistas numa cidade é muito grande. Determinar o intervalo de confiança para a média do valor de vendas de 95% dado que os valores de vendas são considerados normalmente distribuídos, sendo que ͞x= R$ 3.425,00, s= R$ 200,00 e n= 25.
Resposta: [3.346,60; 3.503,40]
4) Para uma amostra de 50 firmas tomada de uma indústria, o número médio de empregados é 420,4 com desvio padrão na amostra de 55,7. Nesta indústria, há um total de 380 firmas. Determinar o erro padrão da média para ser usado na estimação de média populacional por um intervalo de confiança.
Resposta: sx= 7,35
5) Um analista de um departamento de pessoal seleciona aleatoriamente os registros de 16 empregados horistas e acha que a taxa média de salário por hora R$ 7,50. Supõe-se que os salários na firma sejam distribuídos normalmente. Se o desvio padrão dos salários é R$ 1,00, estimar a taxa média de salário na firma usando um intervalo de confiança de 80%.
Resposta: [7,18; 7,82] reais
6) Um departamento de manutenção recebeu um carregamento de 100 máquinas defeituosas. Para uma amostra de 10 destas máquinas, o tempo médio necessário para o conserto foi ͞x= 85 minutos, com desvio padrão de s= 15 minutos. Estimar o tempo médio, por máquina, necessário para consertar as máquinas do carregamento, usando um intervalo de confiança de 90%.
Resposta: ͞x= [77,55; 92,45]