Python & Data Structures Flashcards

(26 cards)

1
Q

Por que listas são amplamente usadas em Data Science?

A

Servem como ponto de partida para armazenar e manipular coleções de dados antes de convertê-las em estruturas mais eficientes como arrays ou DataFrames.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qual a vantagem de usar NumPy arrays em vez de listas comuns?

A

Arrays do NumPy são mais rápidos, consomem menos memória e permitem operações vetorizadas sem loops explícitos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

O que é um DataFrame do pandas?

A

Uma estrutura de dados bidimensional (tipo tabela) usada para armazenar e manipular dados tabulares, semelhante a uma planilha do Excel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qual estrutura de dados é mais adequada para operações matemáticas em ML?

A

numpy.ndarray, pois suporta álgebra linear e operações matriciais usadas em treinamento de modelos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

O que é uma Series do pandas?

A

É uma estrutura unidimensional rotulada (similar a uma coluna de DataFrame), usada para representar variáveis isoladas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Como os dicionários são usados em Data Science?

A

Para armazenar pares de chave-valor, úteis em mapeamentos de rótulos, parâmetros de modelos e resultados de métricas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qual estrutura do Python é ideal para representar um vetor de características de um modelo ML?

A

Um numpy array unidimensional.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Como converter um DataFrame em um array NumPy?

A

Usando o método .values ou .to_numpy() — exemplo: df.to_numpy().

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

O que é um sparse matrix e onde é usada?

A

Uma matriz que armazena apenas valores diferentes de zero — usada em NLP e modelos com muitos recursos (alta dimensionalidade).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Como as estruturas de dados impactam o desempenho de modelos de ML?

A

Estruturas otimizadas (como arrays e matrizes esparsas) reduzem tempo de processamento e uso de memória, acelerando o treinamento e a inferência.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quais são as principais estruturas de dados nativas do Python?

A

Listas, Tuplas, Conjuntos (sets) e Dicionários (dicts).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

O que caracteriza uma lista em Python?

A

É ordenada, mutável e permite elementos duplicados. Criada com [].

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quando usar tuplas em vez de listas?

A

Quando os dados não devem ser alterados, pois tuplas são imutáveis e mais eficientes em desempenho.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

O que é um set em Python?

A

Um conjunto não ordenado, mutável e sem elementos duplicados. Ideal para operações como união e interseção.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Como os dicionários organizam os dados?

A

Em pares de chave-valor, permitindo acesso rápido aos dados pela chave, e não pelo índice.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

O que é o NumPy?

A

É uma biblioteca Python usada para computação numérica eficiente, com suporte a arrays multidimensionais e operações vetorizadas.

17
Q

Qual é o principal tipo de dado usado no NumPy?

A

O objeto ndarray, que representa um array N-dimensional.

18
Q

O que é o Pandas?

A

É uma biblioteca Python usada para análise e manipulação de dados, oferecendo estruturas como Series e DataFrame.

19
Q

Qual é o comando mais comum para importar o Pandas?

A

import pandas as pd

20
Q

O que é um DataFrame?

A

É uma estrutura de dados bidimensional (tabelar), com linhas e colunas nomeadas, semelhante a uma planilha do Excel.

21
Q

Como ler um arquivo CSV no Pandas?

A

pd.read_csv(“nome_do_arquivo”)

22
Q

Como visualizar as primeiras linhas de um DataFrame?

A

df.head() — por padrão mostra as 5 primeiras linhas

23
Q

Como selecionar uma coluna específica de um DataFrame?

A

df[“coluna”] ou df.coluna

24
Q

Como filtrar linhas com base em uma condição?

A

df[df[“coluna”] > 100]

25
Como verificar valores ausentes (NaN) no DataFrame?
df.isnull() ou df.isna()
26
Como agrupar dados e calcular estatísticas com Pandas?
df.groupby("coluna").mean()