Math & Statistics Flashcards

Question

O que são variáveis ordinais?

Answer 1

São variáveis categóricas que possuem uma ordem lógica entre as categorias. Exemplo: nível de escolaridade (fundamental, médio, superior).

Answer 2

“Estado civil” → solteiro, casado, divorciado.

Answer 3

“Nível de satisfação” → ruim, regular, bom, ótimo.

Answer 4

Pode ser preservada usando Label Encoding (mantendo a hierarquia) ou convertida em números ordenados que refletem essa relação.

Answer 5

É uma tabela que resume a distribuição dos dados, mostrando quantas vezes cada valor ou categoria aparece em um conjunto de dados.

Answer 6

Frequência absoluta (f): número de ocorrências. Frequência relativa (fr): proporção em relação ao total. Frequência acumulada (fa): soma progressiva das frequências.

Answer 7

Para organizar e visualizar a distribuição dos dados, facilitando a análise e identificação de padrões ou outliers.

Answer 8

Simples: usada para variáveis qualitativas ou quantitativas discretas. Agrupada: usada para variáveis quantitativas contínuas, dividindo os dados em intervalos de classe.

Answer 9

É uma tabela que mostra a distribuição conjunta de duas variáveis categóricas, exibindo como elas se relacionam.

Answer 10

As linhas representam as categorias de uma variável e as colunas as categorias da outra, com as frequências nas células.

Answer 11

Analisar associações e dependências entre duas variáveis categóricas.

Answer 12

Testes de independência entre variáveis, como o teste qui-quadrado (χ²)

Answer 13

Cruzar gênero (masculino/feminino) com preferência de produto (A/B/C) para ver se existe relação entre o gênero e a escolha do produto.

Answer 14

Probabilidade é a medida da chance de um evento ocorrer, variando de 0 (impossível) a 1 (certo). É calculada como o número de casos favoráveis dividido pelo número total de casos possíveis.

Answer 15

O espaço amostral é o conjunto de todos os resultados possíveis de um experimento aleatório. Cada resultado é chamado de elemento amostral, e eventos são subconjuntos desse espaço.

Answer 16

Evento simples: contém apenas um resultado possível do espaço amostral. Evento composto: contém dois ou mais resultados possíveis.

Answer 17

É um processo ou ação cujo resultado não pode ser previsto com certeza, mesmo que todas as condições sejam controladas.

Answer 18

Pode ser repetido em condições idênticas. Possui resultados possíveis bem definidos. O resultado individual é incerto antes da execução

Answer 19

Lançar um dado é um experimento aleatório — sabemos os possíveis resultados (1 a 6), mas não qual número sairá antes de lançar.

Answer 20

Determinístico: o resultado é sempre o mesmo sob as mesmas condições. Aleatório: o resultado varia, mesmo em condições idênticas.

Answer 21

A probabilidade mede a chance de ocorrência dos possíveis resultados de um experimento aleatório.

Answer 22

Um evento é qualquer subconjunto do espaço amostral que representa um ou mais resultados possíveis de um experimento aleatório

Answer 23

É um evento que contém apenas um resultado do espaço amostral. Exemplo: obter o número 3 ao lançar um dado.

Answer 24

É um evento que contém dois ou mais resultados possíveis. Exemplo: obter um número par ao lançar um dado (2, 4 ou 6).

Answer 25

Significa que eles não podem ocorrer ao mesmo tempo. Exemplo: tirar “cara” e “coroa” em um mesmo lançamento de moeda.

Answer 26

S={cara,coroa} — um espaço amostral finito e discreto.

Answer 27

Discreto: resultados contáveis (ex.: faces de um dado). Contínuo: resultados infinitos e não contáveis (ex.: tempo até um evento ocorrer).

Answer 28

A variância é uma medida de dispersão que indica o quanto os valores de um conjunto de dados se afastam da média.

Answer 29

Alta: os valores estão muito dispersos em relação à média. Baixa: os valores estão próximos da média, indicando menor variabilidade.

Answer 30

Não. A variância é expressa em unidades ao quadrado, o que dificulta sua interpretação direta — daí a utilidade do desvio padrão.

Answer 31

É a raiz quadrada da variância. Mede a dispersão média dos dados em torno da média, na mesma unidade dos valores originais.

Answer 32

Desvio padrão pequeno: os dados estão concentrados em torno da média. Desvio padrão grande: os dados estão muito espalhados.

Answer 33

É uma função que descreve como a probabilidade está distribuída em uma variável aleatória contínua. A área sob a curva da FDP em um intervalo representa a probabilidade da variável assumir valores nesse intervalo.

Answer 34

A FDP é usada para variáveis contínuas e envolve integrais, enquanto a PMF (Probability Mass Function) é usada para variáveis discretas e envolve somas.

Answer 35

É um teste estatístico usado para comparar médias de dois grupos e verificar se a diferença entre elas é estatisticamente significativa.

Answer 36

t de uma amostra: compara a média de uma amostra com um valor conhecido. t para amostras independentes: compara médias de dois grupos diferentes. t pareado: compara médias de um mesmo grupo em dois momentos diferentes.

Answer 37

Os dados devem ser aproximadamente normais. As amostras devem ter variâncias homogêneas (no caso de amostras independentes). As observações devem ser independentes entre si.

Answer 38

p < 0,05: rejeita-se a hipótese nula → há diferença significativa entre as médias. p ≥ 0,05: não há evidência suficiente para rejeitar a hipótese nula → as médias são estatisticamente semelhantes.

Answer 39

É o processo de usar dados da amostra para tirar conclusões ou fazer generalizações sobre uma população.

Answer 40

Estimação (pontual e intervalar) e testes de hipóteses.

Answer 41

Diferença natural entre o valor observado na amostra e o valor verdadeiro da população — ocorre por usar apenas parte dos dados.

Answer 42

Probabilidade (geralmente 90%, 95% ou 99%) de que o intervalo de confiança inclua o verdadeiro parâmetro populacional.

Answer 43

Avaliar evidências nos dados da amostra para decidir se rejeitar ou não a hipótese nula sobre um parâmetro da população.

Answer 44

É um procedimento estatístico para avaliar se há evidências suficientes, na amostra, para rejeitar uma afirmação (hipótese nula) sobre a população.

Answer 45

É a afirmação que se deseja testar — representa mudança, diferença ou efeito. Se houver evidência suficiente contra H₀, aceita-se H₁.

Answer 46

É a afirmação inicial que se presume verdadeira até que os dados forneçam evidências fortes o suficiente para rejeitá-la.

Answer 47

É a probabilidade de observar um resultado tão extremo quanto o obtido assumindo que H₀ é verdadeira. Quanto menor o p-valor, maior a evidência contra H₀.

Answer 48

Se p-valor ≤ α (nível de significância), rejeita-se H₀. Se p-valor > α, não se rejeita H₀.

Answer 49

Rejeitar a hipótese nula (H₀) quando ela é verdadeira. É um falso positivo.

Answer 50

Não rejeitar a hipótese nula quando ela é falsa. É um falso negativo.

Answer 51

É a probabilidade de rejeitar H₀ quando ela é realmente falsa. Ou seja, 1 − β (evitar o erro Tipo II).

Answer 52

O nível de significância é a probabilidade máxima de cometer erro Tipo I. Ex: α = 0,05 significa aceitar até 5% de chance de rejeitar H₀ incorretamente.

Answer 53

Amostras pequenas, baixa variabilidade do efeito, nível de significância muito baixo ou testes pouco sensíveis.

Answer 54

Reduzir α (menor chance de erro Tipo I) geralmente aumenta β (maior chance de erro Tipo II), e vice-versa. Há um equilíbrio entre eles.

Answer 55

É um teste que verifica se o parâmetro é diferente de um valor específico, considerando desvios tanto para cima quanto para baixo.

Answer 56

Quando não há direção específica para o efeito — apenas deseja-se saber se há diferença, para mais ou para menos.

Answer 57

É um teste que avalia se o parâmetro é maior ou menor que um valor específico, considerando apenas uma direção.

Answer 58

Quando existe uma hipótese direcional clara, como “a média é maior que X” ou “a proporção é menor que Y”.

Answer 59

Bilateral: soma das áreas nas duas extremidades da distribuição. Unilateral: área apenas em uma das extremidades. Testes unilaterais tendem a gerar p-valores menores para o mesmo efeito.

Answer 60

Testes unilaterais têm maior poder na direção especificada, mas não detectam efeitos na direção oposta. Testes bilaterais são mais conservadores e amplamente recomendados quando não há direção definida.

Answer 61

Quando se quer comparar a média de uma amostra com um valor conhecido, e o desvio-padrão populacional é desconhecido.

Answer 62

Quando se deseja testar se duas médias de grupos independentes são diferentes, assumindo normalidade e variâncias semelhantes (ou não, no caso Welch).

Answer 63

É usado quando as observações dos dois grupos estão emparelhadas (antes/depois, pacientes, medições repetidas).

Answer 64

Para comparar 3 ou mais médias simultaneamente, verificando se pelo menos um grupo difere significativamente dos outros.

Answer 65

H₀: Todas as médias dos grupos são iguais. H₁: Pelo menos uma média é diferente.

Answer 66

Aplicar testes pós-hoc (como Tukey, Bonferroni) para identificar quais grupos diferem entre si.

Answer 67

Quando a amostra é grande (n ≥ 30) ou o desvio-padrão populacional é conhecido, e deseja-se comparar uma média com um valor hipotético.

Answer 68

Quando se deseja comparar uma proporção observada com uma proporção teórica, ou comparar proporções entre dois grupos, com n grande.

Answer 69

A distribuição Normal padrão (média 0, desvio padrão 1).

Answer 70

Avalia se duas variáveis categóricas são independentes, comparando frequências observadas e esperadas em uma tabela de contingência.

Answer 71

Testa se a distribuição observada de frequências segue uma distribuição teórica esperada (ex.: uniforme, proporcional, categorial pré-definida).

Answer 72

Dados categóricos. Observações independentes. Frequências esperadas ≥ 5 na maioria das células.

Answer 73

É um teste que compara duas variâncias para verificar se são estatisticamente iguais, assumindo normalidade.

Answer 74

Quando se deseja verificar se duas populações têm variâncias iguais antes de aplicar testes paramétricos como o t convencional.

Answer 75

Ele é muito sensível à violação da normalidade, podendo gerar conclusões incorretas quando os dados não seguem uma distribuição Normal.

Answer 76

Testa se duas ou mais variâncias são iguais, sendo robusto a desvios de normalidade — adequado para dados reais.

Answer 77

Quando se assume que os dados são aproximadamente normais e se deseja testar homogeneidade de variâncias entre vários grupos.

Answer 78

Bartlett: mais poderoso, porém sensível à não normalidade. Levene: menos sensível à violação da normalidade — recomendado na maioria dos casos práticos.

Math & Statistics Flashcards

Foundations (107 cards)