O que é a coleta de dados?
A coleta de dados é a obtençao, registro e organizaçao das informaçoes que sao revelantes para o estudo. Para coleta-los precisamos definir o que queremos estudar e quais sao os tipos de dados. Tambem devemos identificar a populacao e a amostra, garantindo que os dados estudados sejam representativos e uteis para a analise, evitando análises irrelevantes e delimitando o foco do estudo.
Tipos de Dados
- Dados Qualitativos: Representam categorias ou atributos (ex.: cor dos olhos, gênero).
- Dados Quantitativos: Representam valores numéricos e podem ser subdivididos em:
- Discretos: Contagens (ex.: número de filhos).
- Contínuos: Medidas (ex.: altura, peso).
Exemplo em Python:
# Exemplo de tipos de dados
qualitativos = ["azul", "verde", "vermelho"]
quantitativos_discretos = [1, 2, 3, 4]
quantitativos_continuos = [1.5, 2.3, 3.7]
print("Qualitativos:", qualitativos)
print("Quantitativos Discretos:", quantitativos_discretos)
print("Quantitativos Contínuos:", quantitativos_continuos)
1.1.3 Populaçao e amostra
- População: Refere-se ao conjunto completo de indivíduos, objetos ou eventos sobre os quais se deseja tirar conclusões. Exemplo: todos os habitantes de um país.
- Amostra: É um subconjunto da população que é estudado diretamente, pois analisar toda a população pode ser inviável em termos de tempo, custo ou logística.
1.2 Medidas descritivas
1.2.1 Medidas de Tendência Central
As medidas de tendencia central indicam o valor central ou tipico de um conjunto de dados e sao as seguintes :
- Média: Soma de todos os valores dividida pelo número de observações (quantidade de dados).
Dados : 2, 4, 6, 8 Media = soma dos dados/ quantidade de dados = (2 + 4 + 6 + 8)/4 = 5 Dados : 2, 4, 6, 8, 1, 3 Media = soma dos dados/ quantidade de dados = (2 + 4 + 6 + 8 +1+3)/6 = 4
- Mediana: Valor central de um conjunto ordenado de dados, em outras palavras : A mediana é o ponto que divide o conjunto ao meio.
Se o número de valores é ímpar, a mediana é o valor no meio.
Dados = 5, 3, 11, 7, 9
Dados (ordenados): 3,5,7,9,11 (ímpar)
Mediana = 7.
Se o número de valores é par, a mediana é a média dos dois valores centrais.
Dados = 2, 4, 6, 8, 1, 3
Dados ordenados = 1, 2, 3, 4, 6, 8 (par)
Mediana = (3+4)/2 = 3,5
- Moda: Valor mais frequente em um conjunto de dados. Util para dados categóricos ou quando queremos identificar a frequência dominante.
Dados: 1,2,2,3,4
Moda = 2 (ocorre duas vezes).
Dados: 5,6,7
Não há moda (todos os valores ocorrem uma vez)