Coleta de dados na estatistica

O que é a coleta de dados?

A coleta de dados é a obtençao, registro e organizaçao das informaçoes que sao revelantes para o estudo. Para coleta-los precisamos definir o que queremos estudar e quais sao os tipos de dados. Tambem devemos identificar a populacao e a amostra, garantindo que os dados estudados sejam representativos e uteis para a analise, evitando análises irrelevantes e delimitando o foco do estudo.

Tipos de Dados

  • Dados Qualitativos: Representam categorias ou atributos (ex.: cor dos olhos, gênero).
  • Dados Quantitativos: Representam valores numéricos e podem ser subdivididos em:
    • Discretos: Contagens (ex.: número de filhos).
    • Contínuos: Medidas (ex.: altura, peso).

Exemplo em Python:

# Exemplo de tipos de dados 
qualitativos = ["azul", "verde", "vermelho"] 
quantitativos_discretos = [1, 2, 3, 4] 
quantitativos_continuos = [1.5, 2.3, 3.7] 
print("Qualitativos:", qualitativos) 
print("Quantitativos Discretos:", quantitativos_discretos) 
print("Quantitativos Contínuos:", quantitativos_continuos) 

1.1.3 Populaçao e amostra

  • População: Refere-se ao conjunto completo de indivíduos, objetos ou eventos sobre os quais se deseja tirar conclusões. Exemplo: todos os habitantes de um país.
  • Amostra: É um subconjunto da população que é estudado diretamente, pois analisar toda a população pode ser inviável em termos de tempo, custo ou logística.

1.2 Medidas descritivas

1.2.1 Medidas de Tendência Central

As medidas de tendencia central indicam o valor central ou tipico de um conjunto de dados e sao as seguintes :

  • Média: Soma de todos os valores dividida pelo número de observações (quantidade de dados).
Dados : 2, 4, 6, 8

Media = soma dos dados/ quantidade de dados = (2 + 4 + 6 + 8)/4 = 5

Dados : 2, 4, 6, 8, 1, 3

Media = soma dos dados/ quantidade de dados = (2 + 4 + 6 + 8 +1+3)/6 = 4
  • Mediana: Valor central de um conjunto ordenado de dados, em outras palavras : A mediana é o ponto que divide o conjunto ao meio.

Se o número de valores é ímpar, a mediana é o valor no meio.

Dados = 5, 3, 11, 7, 9

Dados (ordenados): 3,5,7,9,11 (ímpar)

Mediana = 7.

Se o número de valores é par, a mediana é a média dos dois valores centrais.

Dados = 2, 4, 6, 8, 1, 3

Dados ordenados = 1, 2, 3, 4, 6, 8 (par)

Mediana = (3+4)/2 = 3,5
  • Moda: Valor mais frequente em um conjunto de dados. Util para dados categóricos ou quando queremos identificar a frequência dominante.
Dados: 1,2,2,3,4

Moda = 2 (ocorre duas vezes).

Dados: 5,6,7
Não há moda (todos os valores ocorrem uma vez)

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima