Erro limite da fórmula do valor médio. Erros médios e marginais de amostragem

Para caracterizar a confiabilidade dos indicadores amostrais, é feita uma distinção entre erros amostrais médios e marginais, que são característicos apenas das observações amostrais. Estes indicadores refletem a diferença entre a amostra e os indicadores gerais correspondentes.

Erro médio da amostraé determinado principalmente pelo tamanho da amostra e depende da estrutura e do grau de variação da característica em estudo.

O significado do erro médio de amostragem é o seguinte. Os valores calculados da fração amostral (w) e da média amostral () são, por sua natureza, variáveis ​​aleatórias. Eles podem assumir valores diferentes dependendo de quais unidades específicas da população geral se enquadram na amostra. Por exemplo, se, ao determinar a idade média dos empregados de uma empresa, mais jovens forem incluídos em uma amostra e trabalhadores mais velhos forem incluídos em outra, as médias amostrais e os erros amostrais serão diferentes. Erro médio de amostragemé determinado pela fórmula:

(27) ou - reamostragem. (28)

Onde: μ é o erro médio de amostragem;

σ é o desvio padrão de uma característica na população geral;

n é o tamanho da amostra.

O valor do erro μ mostra como o valor médio da característica, estabelecido pela amostra, difere do valor real da característica na população geral.

Segue-se da fórmula que o erro amostral é diretamente proporcional ao desvio padrão e inversamente proporcional à raiz quadrada do número de unidades na amostra. Isso significa, por exemplo, que quanto maior a dispersão dos valores de uma característica na população geral, ou seja, quanto maior a dispersão, maior deve ser o tamanho da amostra se quisermos confiar nos resultados de uma pesquisa amostral . Por outro lado, com uma pequena variância, pode-se limitar a um pequeno número de populações amostrais. O erro de amostragem estará então dentro dos limites aceitáveis.

Como o tamanho da população geral N durante a amostragem diminui durante a seleção não repetida, um fator adicional é incluído na fórmula para calcular o erro amostral médio

(1- ). A fórmula para o erro médio de amostragem tem a seguinte forma:

O erro médio é menor para amostragem não repetitiva, o que a torna mais utilizada.

As conclusões práticas requerem uma caracterização da população geral com base nos resultados da amostra. As médias e proporções amostrais são aplicadas à população geral, levando em consideração o limite de seu possível erro, e com um nível de probabilidade que o garanta. Dado um nível de probabilidade específico, o valor do desvio normalizado é escolhido e o erro amostral marginal é determinado.

Confiabilidade (probabilidade de confiança) da estimativa X por X* chamado probabilidade γ , com a qual a desigualdade


׀Х-Х*׀< δ, (30)

onde δ é o erro amostral marginal que caracteriza a largura do intervalo em que se encontra o valor do parâmetro estudado da população geral com probabilidade γ.

Confiável nomeie o intervalo (X* - δ; X* + δ) que cobre o parâmetro investigado X (ou seja, o valor do parâmetro X está dentro desse intervalo) com uma dada confiabilidade γ.

Normalmente, a confiabilidade da estimativa é definida antecipadamente, e um número próximo a um é tomado como γ: 0,95; 0,99 ou 0,999.

O erro limite δ está relacionado ao erro médio μ da seguinte forma: , (31)

onde: t é o fator de confiança, dependendo da probabilidade P, com o qual se pode argumentar que o erro marginal δ não excederá o erro médio t vezes μ (também é chamado de pontos críticos ou quantis da distribuição de Student).

Como decorre da razão, o erro marginal é diretamente proporcional ao erro amostral médio e ao coeficiente de confiança, que depende do nível de confiabilidade da estimativa.

Da fórmula do erro amostral médio e da razão entre os erros marginal e médio, obtemos:

Levando em conta a probabilidade de confiança, esta fórmula tomará a forma.

Como se sabe, em estatística existem duas maneiras de observar fenômenos de massa, dependendo da completude da cobertura do objeto: contínua e não contínua. Uma variação da observação descontínua é a observação seletiva.

Debaixo observação seletiva é entendida como uma observação não contínua, na qual unidades da população estudada, selecionadas aleatoriamente, são submetidas a exame estatístico (observação).

A observação seletiva se propõe a caracterizar toda a população de unidades para a parte examinada, sujeita a todas as regras e princípios da observação estatística e do trabalho cientificamente organizado de seleção de unidades.

O conjunto de unidades selecionadas para o levantamento em estatística é normalmente chamado de amostra de população , e o conjunto de unidades a partir do qual a seleção é feita é chamado população geral . As principais características da população geral e amostral são apresentadas na Tabela 1.

Tabela 1 - As principais características da população geral e amostral
IndicadorDesignação ou fórmula
População População da amostra
Número de unidades N n
O número de unidades que têm um recurso M m
Proporção de unidades com este recurso p = M/N ω = m/n
Proporção de unidades que não possuem esse recurso q = 1 - p 1 - w
Valor médio sinal
Dispersão sinal
Dispersão de um recurso alternativo (dispersão de uma ação) pq ω (1 - ω)

Ao realizar a observação seletiva, ocorrem erros sistemáticos e aleatórios. Erros sistemáticos surgem devido à violação das regras de seleção de unidades na amostra. Ao alterar as regras de seleção, esses erros podem ser eliminados.

Erros aleatórios surgem devido à natureza descontínua da pesquisa. Caso contrário, eles são chamados de erros de representatividade (representatividade). Os erros aleatórios são divididos em erros de amostragem médios e marginais, que são determinados tanto no cálculo do recurso quanto no cálculo do compartilhamento.

Os erros médio e limite estão relacionados pela seguinte relação :Δ = tμ, onde Δ é o erro amostral marginal, μ é o erro amostral médio, t é o fator de confiança determinado em função do nível de probabilidade. A Tabela 2 mostra alguns valores de t retirados da teoria das probabilidades.

O valor do erro médio de amostragem é calculado diferencialmente dependendo do método de seleção e do procedimento de amostragem. As principais fórmulas para calcular os erros de amostragem são apresentadas na Tabela 3.

Tabela 3 - Fórmulas Básicas para Cálculo de Erros de Amostragem em Seleção Repetitiva e Não Repetida
IndicadorDesignação e fórmula
População População da amostra
Erro médio de recurso para reamostragem aleatória
Erro médio de compartilhamento para reamostragem aleatória
Erro de limite de um recurso em caso de re-seleção aleatória
Erro de compartilhamento marginal na nova seleção aleatória
Erro médio de um recurso para seleção aleatória não repetitiva
Erro médio de compartilhamento na amostragem aleatória não repetitiva
Limite de erro de um recurso com seleção aleatória não repetitiva
Erro de compartilhamento marginal para seleção aleatória não repetitiva

O cálculo dos erros amostrais médios e marginais permite determinar os possíveis limites em que as características da população geral serão .

Por exemplo, para uma média amostral, esses limites são definidos com base nas seguintes relações:

Limites da participação do traço na população geral p.

Exemplos de resolução de problemas no tópico "Observação de amostragem em estatística"

Tarefa 1 . Há informações sobre a produção de produtos (obras, serviços) obtidas com base na observação amostral de 10% das empresas da região:

Determine: 1) para as empresas incluídas na amostra: a) a dimensão média da produção por empresa; b) dispersão do volume de produção; c) a parcela de empresas com um volume de produção superior a 400 mil rublos; 2) para a região como um todo, com probabilidade de 0,954, os limites dentro dos quais se pode esperar: a) o volume médio de produção por empreendimento; b) a parcela de empresas com um volume de produção superior a 400 mil rublos; 3) o volume total de produção na região.

Decisão

Para resolver o problema, expandimos a tabela proposta.

1) Para as empresas incluídas na amostra, a dimensão média da produção por empresa

110800/400 = 277 mil rublos

Calculamos a dispersão do volume de produção de forma simplificada σ 2 = 35640000/400 - 277 2 = 89100 - 76229 = 12371.

O número de empresas cujo volume de produção excede 400 mil rublos. é igual a 36+12 = 48, e sua participação é igual a ω = 48:400 = 0,12 = 12%.

2) Da teoria da probabilidade sabe-se que com uma probabilidade P=0,954 o fator de confiança t=2. Erro de amostragem marginal

2√12371:400 = 11,12 mil rublos

Vamos definir os limites da média geral: 277-11,12 ≤Xav ≤ 277+11,12; 265,88 ≤Xav ≤ 288,12

Erro de amostragem marginal da parcela de empresas

2√0,12*0,88/400 = 0,03

Vamos definir os limites do compartilhamento geral: 0,12-0,03≤ p ≤0,12+0,03; 0,09≤ p≤0,15

3) Como o grupo de empresas considerado é 10% do total de empresas da região, existem 4.000 empresas na região como um todo. Então o volume total de produção na região está dentro de 265,88×4000≤Q≤288,12×4000; 1063520 ≤ Q ≤ 1152480

Tarefa 2 . De acordo com os resultados de uma auditoria de controlo pelas autoridades fiscais a 400 estruturas empresariais, 140 delas não indicam integralmente os rendimentos sujeitos a tributação nas suas declarações fiscais. Determine na população geral (para toda a região) a proporção de estruturas empresariais que ocultaram parte de suas receitas tributárias com probabilidade de 0,954.

Decisão

De acordo com a condição do problema, o número de unidades na população amostral é n=400, o número de unidades com a característica considerada é m=140, a probabilidade é P=0,954.

Da teoria da probabilidade sabe-se que com a probabilidade P=0,954 o fator de confiança t=2.

A proporção de unidades que possuem o atributo indicado é determinada pela fórmula: p=w+∆p, onde w = m/n=140/400=0,35=35%,
e o erro limite da característica ∆p é obtido pela fórmula: ∆p= t √w(1-w)/n = 2√0,35×0,65/400 ≈ 0,5 = 5%

Então p = 35±5%.

Responda : A percentagem de estruturas empresariais que ocultaram parte dos seus rendimentos fiscais com uma probabilidade de 0,954 é de 35±5%.

O conceito de observação seletiva.

Seletivo tal observação é chamada em que a característica de todo o conjunto de unidades é dada de acordo com algumas de suas partes, selecionadas em ordem aleatória.

Razões para usar a observação seletiva:

1. Economia de material, mão de obra, recursos financeiros e tempo.

2. A observação selecionada muitas vezes leva a um aumento na precisão dos dados, uma vez que uma diminuição no número de unidades de observação reduz drasticamente os erros no registro dos valores de um sinal (erros de impressão, subcontagem, contagem dupla ...).

3. A observação seletiva é a única possível se a observação for acompanhada de danos completos ou parciais aos objetos observados (qualidade dos lotes de ovos, resistência dos tecidos, etc.).

Essa parte das unidades que são selecionadas para observação é geralmente chamada de amostra de população ou simplesmente amostragem, e todo o conjunto de unidades a partir do qual a seleção é feita - população geral.

Foi adotado o seguinte sistema de designação de indicadores para a população selecionada e geral.

Dependendo da aplicação da técnica de seleção, a amostra é dividida em seriada (aninhada) e tipológica.

· Quando tipológico amostragem, a população geral é dividida em tipos (grupos, distritos), e então é feita uma seleção aleatória de unidades de cada tipo.

· No serial a amostra é escolhida não por unidades, mas por certas séries, grupos, áreas dentro das quais se realiza a observação contínua.

Há duas maneiras de selecionar unidades em uma amostra:

- nova seleção

cada unidade da amostra é devolvida à população geral e tem a chance de ser reamostrada.

- seleção não repetitiva

a unidade selecionada não é devolvida à população e as unidades restantes têm maior probabilidade de serem incluídas na amostra. A amostragem não repetitiva fornece resultados mais precisos, mas às vezes não pode ser feito (pesquisa da demanda do consumidor).

A qualidade dos resultados da amostragem depende do quanto a composição da amostra representa a população geral, ou seja, do quanto a amostra representante(representante). Para garantir a representatividade da amostra, é necessário observar o princípio da seleção aleatória das unidades.

Erro de amostragem

O conceito e os tipos de erros de amostragem

Como a população estatística em estudo consiste em unidades com características variadas, a composição da população amostral pode diferir em certa medida da composição da população geral.

A discrepância entre as características da amostra e a população geral é erro de amostragem.

Tipos de erros de amostragem

A principal tarefa do método de amostragem é estudar erros aleatórios de representatividade.

Erro médio de amostragem

O erro aleatório de representatividade depende dos seguintes fatos (supõe-se que não haja erros de registro):

1. Quanto maior o tamanho da amostra, ceteris paribus, menor o erro de amostragem, ou seja, erro de amostragem é inversamente proporcional ao seu tamanho.

2. Quanto menor a variação do atributo, menor o erro amostral. Se o sinal não variar e, consequentemente, a variância for zero, então não haverá erro amostral, porque qualquer unidade da população irá caracterizar com precisão toda a população nesta base. Assim, o erro amostral é diretamente proporcional à magnitude da variância.

Em estatística matemática, está provado que o valor do erro médio de uma reamostragem aleatória pode ser determinado pela fórmula

No entanto, deve-se ter em mente que a magnitude da dispersão na população em geral s2 não sabemos, porque observação seletiva. Só podemos calcular a variância na população da amostra S2. A razão entre as variâncias da população geral e amostral é expressa pela fórmula:

(6.2)

Se um n grande, portanto

s2 = S2

E a fórmula para o erro médio de reamostragem (6.1.) terá a forma:

Mas aqui consideramos apenas o erro de amostragem para o valor médio da característica de interesse. Há também um indicador da proporção de unidades com uma característica de interesse. O cálculo do erro deste indicador tem características próprias.

A variação do indicador de ação característica é determinada pela fórmula:

S 2 \u003d w (1-w) (6.4)

Então o erro amostral médio para a medida da participação do recurso será igual a:

(6.5)

A prova das fórmulas (6.3) e (6.5) começa a partir do esquema de reamostragem. Normalmente, a amostra é organizada de forma não repetitiva. Porque com seleção não repetitiva, o tamanho da população em geral Né abreviado no código de amostragem, um fator adicional é incluído nas fórmulas de erro de amostragem , e as fórmulas assumem a forma:

(6.6)

(6.7)

Exemplo 1. Vamos determinar o quanto a amostra e os indicadores gerais diferem de acordo com os dados de uma amostra não repetida de 10% do desempenho dos alunos.

Cálculo do erro de não reamostragem para a média:

n= 100 N= 1000

Encontre a variância da amostra usando a fórmula:

Aqui, o valor não é conhecido, que pode ser encontrado como uma média ponderada ordinária:

Por isso,

Aqueles. podemos dizer que a nota média de todos os alunos () é 3,65 ± 0,07

Agora vamos calcular a proporção de alunos na população geral estudando para "4" e "5".

Com base na amostra, encontraremos a proporção de alunos que receberam notas “4” e “5”.

(ou 64%)

O cálculo do erro de não reamostragem para a ação é feito de acordo com a fórmula:

(ou 4,5%)

Assim, a proporção de alunos matriculados em "4" e "5" na população geral ( P) é 0,64±0,045 (ou 64%±4,5%).

Erro de amostragem marginal

O fato de que a média geral e a participação geral não ultrapassarão certos limites pode ser afirmado não com certeza absoluta, mas apenas com um certo grau de probabilidade.

Em estatística matemática, prova-se que as características gerais se desviam das da amostra pela quantidade de erro amostral (± m), apenas com uma probabilidade de 0,683. No que diz respeito aos estudos amostrais, entende-se que os valores dos limites podem ser garantidos apenas em 683 casos em 1000. Nos restantes 317 casos, os valores desses limites serão diferentes.

A probabilidade de julgamento pode ser aumentada expandindo os limites de desvio tomando como medida o erro médio de amostragem, aumentado por t uma vez.

Aqueles. com um certo grau de probabilidade, podemos afirmar que os desvios das características da amostra das gerais não excederão um determinado valor, que é chamado de erro amostral marginal D (delta):

Onde t– fator de confiança (fator de multiplicidade do erro), determinado em função do nível de confiança com o qual é necessário garantir os resultados de um estudo amostral.

Na prática, são usadas tabelas onde as probabilidades são calculadas para vários valores t. Vamos dar uma olhada em alguns deles.

t Probabilidade t Probabilidade
0,5 0,383 2,0 0,954
1,0 0,683 2,5 0,988
1,5 0,866 3,0 0,997

Por exemplo, se em nosso exemplo queremos aumentar a probabilidade de julgamento para 0,954, então tomamos t= 2 e assim alterar os limites de desvios da nota média de todos os alunos e a proporção de alunos matriculados em "4" e "5".

Ou seja, (6.9)

Ou seja, (6.10)

Durante a observação seletiva, deve-se assegurar acidente seleção da unidade. Cada unidade deve ter a mesma oportunidade de ser selecionada com as demais. É nisso que se baseia a amostragem aleatória.

Para amostra aleatória adequada refere-se à seleção de unidades de toda a população geral (sem divisão preliminar em nenhum grupo) por sorteio (principalmente) ou algum outro método semelhante, por exemplo, usando uma tabela de números aleatórios. Seleção aleatória Esta seleção não é aleatória. O princípio da aleatoriedade sugere que a inclusão ou exclusão de um objeto da amostra não pode ser influenciada por nenhum fator que não seja o acaso. Um exemplo realmente aleatório a seleção pode servir como circulação de prêmios: do número total de bilhetes emitidos, uma certa parte dos números que contabilizam os ganhos é selecionada aleatoriamente. Além disso, todos os números têm a mesma oportunidade de entrar na amostra. Nesse caso, o número de unidades selecionadas no conjunto de amostra geralmente é determinado com base na proporção aceita da amostra.

Compartilhamento de amostra é a razão entre o número de unidades da população da amostra e o número de unidades da população geral:

Então, com uma amostra de 5% de um lote de peças em 1000 unidades. tamanho da amostra Pé de 50 unidades e com uma amostra de 10% - 100 unidades. etc. Com a correta organização científica da amostragem, os erros de representatividade podem ser reduzidos a valores mínimos, como resultado, a observação seletiva torna-se suficientemente precisa.

A seleção aleatória adequada "em sua forma pura" raramente é usada na prática da observação seletiva, mas é o ponto de partida entre todos os outros tipos de seleção, contém e implementa os princípios básicos da observação seletiva.

Consideremos algumas questões da teoria do método de amostragem e a fórmula do erro para uma amostra aleatória simples.

Ao aplicar o método de amostragem em estatísticas, geralmente são usados ​​dois tipos principais de indicadores generalizantes: o valor médio de uma característica quantitativa e o valor relativo do recurso alternativo(a proporção ou proporção de unidades na população estatística, que diferem de todas as outras unidades desta população apenas pela presença da característica em estudo).

Compartilhamento de amostra (W), ou frequência, é determinada pela razão do número de unidades que possuem a característica em estudo t, ao número total de unidades de amostragem P:

Por exemplo, se de 100 detalhes da amostra ( n=100), 95 peças se tornaram padrão (t=95), então a fração da amostra

W=95/100=0,95 .

Para caracterizar a confiabilidade dos indicadores amostrais, existem meio e erro de amostragem marginal.

Erro de amostragem ? ou, em outras palavras, o erro de representatividade é a diferença entre a amostra correspondente e as características gerais:

*

*

O erro de amostragem é característico apenas de observações seletivas. Quanto maior o valor desse erro, mais os indicadores da amostra diferem dos indicadores gerais correspondentes.

A média amostral e a parcela amostral são inerentemente variáveis ​​aleatórias, que pode assumir valores diferentes dependendo de quais unidades da população foram incluídas na amostra. Portanto, os erros de amostragem também são variáveis ​​aleatórias e podem assumir valores diferentes. Portanto, determine a média dos erros possíveis - o erro médio da amostra.

Do que depende erro de amostragem médio? Sujeito ao princípio da seleção aleatória, o erro médio de amostragem é determinado principalmente tamanho da amostra: quanto maior a população, ceteris paribus, menor o erro amostral médio. Cobrindo uma pesquisa amostral com um número crescente de unidades da população geral, caracterizamos cada vez mais com precisão toda a população.

O erro amostral médio também depende grau de variação traço estudado. O grau de variação, como você sabe, é caracterizado pela dispersão? 2 ou w(1-w)-- para um recurso alternativo. Quanto menor a variação do recurso e, portanto, a variância, menor o erro amostral médio e vice-versa. Com dispersão zero (o atributo não varia), o erro amostral médio é zero, ou seja, qualquer unidade da população geral caracterizará com precisão toda a população de acordo com esse atributo.

A dependência do erro amostral médio em seu volume e o grau de variação do atributo é refletido nas fórmulas que podem ser usadas para calcular o erro amostral médio em condições de observação amostral, quando as características gerais ( x,p) são desconhecidos e, portanto, não é possível encontrar o erro amostral real diretamente das fórmulas (form. 1), (form. 2).

C Com seleção aleatória erros médios calculado teoricamente pelas seguintes fórmulas:

* para a característica quantitativa média

* para compartilhamento (característica alternativa)

Já que praticamente a variância do atributo na população geral? 2 não é exatamente conhecido, na prática eles usam o valor da variância S 2 calculada para a população amostral com base na lei dos grandes números, segundo a qual a população amostral com tamanho amostral suficientemente grande reproduz com precisão as características do população geral.

Por isso, fórmulas de cálculo meio erros de amostragem reamostragem aleatória será a seguinte:

* para a característica quantitativa média

* para compartilhamento (característica alternativa)

No entanto, a variância da população amostral não é igual à variância da população geral e, portanto, os erros amostrais médios calculados pelas fórmulas (form. 5) e (form. 6) serão aproximados. Mas na teoria da probabilidade está provado que a variância geral é expressa através da eletiva pela seguinte relação:

Como P/(n-1) para suficientemente grande P -- valor próximo da unidade, pode-se supor que, portanto, nos cálculos práticos dos erros médios de amostragem, as fórmulas (form. 5) e (form. 6) podem ser usadas. E somente em casos de amostra pequena (quando o tamanho da amostra não excede 30) é necessário levar em consideração o coeficiente P/(n-1) e calcule erro médio de amostra pequena de acordo com a fórmula:

W X Com seleção aleatória não repetitiva nas fórmulas acima para calcular os erros médios de amostragem, é necessário multiplicar a expressão raiz por 1-(n/N), pois o número de unidades na população geral é reduzido no processo de amostragem não repetitiva. Portanto, para uma seleção não repetitiva fórmulas de cálculo erro médio de amostragem terá a seguinte forma:

* para a característica quantitativa média

* para compartilhamento (característica alternativa)

. (formulário 10)

Como P sempre menos N, então o fator adicional 1-( s/n) será sempre menor que um. Segue-se disso que o erro médio com seleção não repetitiva será sempre menor do que com seleção repetida. Ao mesmo tempo, com uma porcentagem relativamente pequena da amostra, esse fator é próximo de um (por exemplo, com uma amostra de 5% é 0,95; com uma amostra de 2% é 0,98 etc.). Portanto, às vezes, na prática, as fórmulas (formulários 5) e (formulários 6) são usadas para determinar o erro amostral médio sem o multiplicador especificado, embora a amostra seja organizada como não repetida. Isso ocorre quando o número de unidades da população geral N é desconhecido ou ilimitado, ou quando P muito pouco comparado a N, e em essência, a introdução de um fator adicional, próximo de um, praticamente não afetará o valor do erro amostral médio.

Amostragem mecânica consiste no fato de que a seleção de unidades na amostra a partir do geral, dividida por um critério neutro em intervalos iguais (grupos), é realizada de forma que apenas uma unidade seja selecionada de cada grupo da amostra. Para evitar erros sistemáticos, deve-se selecionar a unidade que está no meio de cada grupo.

Ao organizar a seleção mecânica, as unidades da população são pré-organizadas (geralmente em uma lista) em uma determinada ordem (por exemplo, em ordem alfabética, por localização, em ordem crescente ou decrescente dos valores de qualquer indicador que não esteja associado com a propriedade em estudo, etc.), etc.), após o que um determinado número de unidades é selecionado mecanicamente, em um determinado intervalo. Nesse caso, o tamanho do intervalo na população geral é igual ao recíproco da parcela da amostra. Assim, com uma amostra de 2%, a cada 50 unidades (1: 0,02) é selecionada e verificada, com uma amostra de 5%, a cada 20 unidades (1: 0,05), por exemplo, detalhe descendente da máquina.

Com uma população suficientemente grande, a seleção mecânica em termos de precisão dos resultados é próxima da aleatoriedade adequada. Portanto, para determinar o erro médio de uma amostra mecânica, são utilizadas as fórmulas para amostragem autoaleatória não repetitiva (form. 9), (form. 10).

Para selecionar unidades de uma população heterogênea, o chamado amostra típica , que é utilizado nos casos em que todas as unidades da população geral podem ser divididas em vários grupos qualitativamente homogêneos, semelhantes de acordo com as características que afetam os indicadores estudados.

Ao pesquisar empresas, tais grupos podem ser, por exemplo, indústria e subsetor, formas de propriedade. Então, de cada grupo típico, é feita uma seleção individual de unidades na amostra por uma amostra aleatória ou mecânica.

Uma amostra típica é geralmente usada no estudo de populações estatísticas complexas. Por exemplo, em uma pesquisa amostral dos orçamentos familiares de trabalhadores e empregados em determinados setores da economia, a produtividade do trabalho dos trabalhadores de uma empresa, representada por grupos separados por qualificação.

Uma amostra típica fornece resultados mais precisos em comparação com outros métodos de seleção de unidades em um conjunto de amostras. A tipificação da população geral garante a representatividade dessa amostra, a representação de cada grupo tipológico nela, o que permite excluir a influência da dispersão intergrupos no erro amostral médio.

Ao determinar erro médio de uma amostra típica como um indicador de variação é a média das variâncias intragrupo.

O erro médio de amostragem são encontrados pelas fórmulas:

* para a característica quantitativa média

(reseleção); (formulário 11)

(seleção irreversível); (formulário 12)

* para compartilhamento (característica alternativa)

(reseleção); (form.13)

(seleção não repetitiva), (form. 14)

onde é a média das variâncias intragrupo para a população amostral;

A média das variâncias intragrupo da parcela (característica alternativa) na população amostral.

amostragem em série envolve a seleção aleatória da população geral não de unidades individuais, mas de seus grupos iguais (ninhos, séries) para submeter todas as unidades, sem exceção, à observação em tais grupos.

O uso da amostragem seriada deve-se ao fato de que muitas mercadorias para seu transporte, armazenamento e venda são acondicionadas em embalagens, caixas, etc. Portanto, ao controlar a qualidade das mercadorias embaladas, é mais racional verificar várias embalagens (séries) do que selecionar a quantidade necessária de mercadorias de todas as embalagens.

Como dentro de grupos (séries) todas as unidades sem exceção são examinadas, o erro amostral médio (ao selecionar séries iguais) depende apenas da variância intergrupos (entre séries).

C O erro de amostragem médio para a pontuação média durante a seleção serial, eles são encontrados pelas fórmulas:

(reseleção); (form.15)

(seleção não repetitiva), (form. 16)

Onde r- número de séries selecionadas; R- número total de episódios.

A variância intergrupo da amostra em série é calculada da seguinte forma:

onde está a média eu- ª série; - a média geral para toda a população da amostra.

C Erro médio de amostragem para compartilhamento (recurso alternativo) na seleção serial:

(reseleção); (formulário 17)

(seleção não repetitiva). (formulário 18)

Intergrupo(entre séries) variação da parcela de amostra em série determinado pela fórmula:

, (formulário 19)

onde é a participação do recurso em euª série; - a participação total da característica em toda a amostra.

Na prática de levantamentos estatísticos, além dos métodos de seleção previamente considerados, utiliza-se sua combinação (seleção combinada).

O conceito de observação seletiva.

Com o método estatístico de observação, é possível utilizar dois métodos de observação: contínuo, abrangendo todas as unidades da população, e seletivo (não contínuo).

Por amostragem entende-se um método de pesquisa associado ao estabelecimento de indicadores generalizantes da população para algumas de suas partes com base no método de seleção aleatória.

Com a observação seletiva, uma parte relativamente pequena de toda a população (5-10%) é submetida a exame.

A totalidade a ser examinada chama-se população geral.

A parte das unidades selecionadas da população geral que é objeto da pesquisa é chamada de amostra de população ou amostra.

Indicadores que caracterizam a população geral e amostral:

1) Partilha de um sinal alternativo;

NO população a proporção de unidades que possuem alguma característica alternativa é denotada pela letra “P”.

NO quadro de amostragem a proporção de unidades que possuem algum atributo alternativo é denotada pela letra "w".

2) O tamanho médio do recurso;

NO população o tamanho médio de um recurso é indicado por uma letra (média geral).

NO quadro de amostragem o tamanho médio de um recurso é indicado por uma letra (média da amostra).

Definição de erro de amostragem.

A observação seletiva baseia-se no princípio da igual possibilidade de incluir unidades da população geral na amostra. Isso evita erros observacionais sistemáticos. No entanto, devido ao fato de a população em estudo ser composta por unidades com características variadas, a composição da amostra pode diferir da composição da população geral, causando discrepâncias entre as características gerais e amostrais.

Tais discrepâncias são chamadas de erros de representatividade ou erros de amostragem.

Determinar o erro amostral é a principal tarefa a ser resolvida durante a observação seletiva.

Em estatística matemática, está provado que o erro médio de amostragem é determinado pela fórmula:

Onde m é o erro de amostragem;

s 2 0 é a variância da população geral;

n é o número de unidades amostrais.

Na prática, a variância amostral da população s 2 é usada para determinar o erro amostral médio.

Há uma igualdade entre as variâncias geral e amostral:

(2).

Pode-se ver pela fórmula (2) que a variância geral é maior que a variância da amostra pelo valor (). No entanto, para um tamanho de amostra suficientemente grande, essa razão é próxima da unidade, então podemos escrever que

No entanto, esta fórmula para determinar o erro médio de amostragem só é aplicável à reamostragem.

Na prática, geralmente é usado seleção não repetitiva e o erro amostral médio é calculado de forma ligeiramente diferente, pois o tamanho da amostra diminui ao longo do estudo:

(4)

onde n é o tamanho da amostra;

N é o tamanho da população geral;

s 2 - variância amostral.

Para a proporção de uma característica alternativa, o erro de amostragem médio em sem reseleçãoé determinado pela fórmula:

(5), onde

w (1-w) - o erro médio da parcela da amostra do recurso alternativo;

w é a parcela da característica alternativa da população amostral.

No nova seleção o erro médio da parcela de um recurso alternativo é determinado por uma fórmula simplificada:

(6)

Se um o tamanho da amostra não excede 5%, o erro médio da parcela amostral e a média amostral são determinados pelas fórmulas simplificadas (3) e (6).

A determinação do erro médio da média amostral e da parcela amostral é necessária para estabelecer os possíveis valores da média geral (x) e da parcela geral (P) com base na média amostral (x) e parcela amostral (w).

Um dos valores possíveis dentro dos quais a média geral está localizada é determinado pela fórmula:

Para a quota geral, este intervalo pode ser escrito como :

(8)

As características assim obtidas da parcela e da média na população geral diferem do valor da parcela da amostra e da média amostral pelo valor m. No entanto, isso não pode ser garantido com total certeza, mas apenas com um certo grau de probabilidade.

Na estatística matemática, está provado que os limites dos valores das características da média geral e amostral diferem por m apenas com uma probabilidade de 0,683. Portanto, apenas em 683 casos em 1000 a média geral está dentro x= xmx, em outros casos, ultrapassará esses limites.

A probabilidade de julgamentos pode ser aumentada expandindo os limites dos desvios tomando como medida o erro amostral médio, aumentado em t vezes.

O fator t é chamado de fator de confiança. É determinado em função do nível de confiança com que é necessário garantir os resultados do estudo.

O matemático A.M. Lyapushev calculou vários valores de t, que geralmente são fornecidos em tabelas prontas.

Artigos recentes da seção:

Como reduzir os danos da radiação eletromagnética
Como reduzir os danos da radiação eletromagnética

Agora eles falam muito sobre radiação eletromagnética, à qual qualquer pessoa moderna está inevitavelmente exposta, especialmente um morador de uma grande cidade. Quão...

Radiação eletromagnética causa doenças graves
Radiação eletromagnética causa doenças graves

A interação de campos eletromagnéticos externos com o corpo humano é realizada induzindo campos internos e correntes elétricas, o valor ...

A revolta do corpo da Checoslováquia
A revolta do corpo da Checoslováquia

A revolta do Corpo da Checoslováquia - o discurso das tropas da Checoslováquia contra o regime soviético, em maio-agosto de 1918 na região do Volga, na Sibéria e nos Urais. NO...