¿Qué métodos son más performantes que ordenar y usar head() para encontrar los valores más grandes o pequeños?
Respuesta: .nlargest() y .nsmallest(). Explicación: Estos métodos son más eficientes porque no necesitan ordenar todo el conjunto de datos, solo encontrar los n valores extremos, especialmente si la serie no está ya ordenada.
¿Qué información proporciona df.describe() sobre un DataFrame?
Respuesta: Estadísticas descriptivas de las columnas numéricas. Explicación: Incluye el conteo, media, desviación estándar, mínimo, máximo y los percentiles.
¿Cuál es la diferencia entre una propiedad y un método en pandas?
Respuesta: Una propiedad se accede sin paréntesis (ej. df.shape) y describe un atributo, mientras que un método se llama con paréntesis (ej. df.mean()) y realiza una acción. Explicación: df.shape es una propiedad que contiene una tupla con las dimensiones, mientras que df.mean() es un método que calcula la media.
¿Cuál es la función de Series.value_counts()?
Respuesta: Contar la frecuencia de cada valor único en una Serie. Explicación: Es extremadamente útil para entender la distribución de datos categóricos.
¿Cómo se debe entender ‘todo es objeto en Python’ en el contexto de pandas?
Respuesta: Un DataFrame y una Serie son tipos de objetos, con sus propias propiedades y métodos. Explicación: Este concepto es fundamental en Python y se aplica a pandas, donde interactuamos con objetos DataFrame y Series.
¿Qué información proporciona Series.describe()?
Respuesta: Estadísticas descriptivas de una Serie. Explicación: Funciona tanto para datos numéricos como para texto, ofreciendo estadísticas relevantes para cada tipo de dato.
¿Qué hace el método df.head(n)?
Respuesta: Devuelve las primeras n filas de un DataFrame. Explicación: Por defecto, si no se especifica n, devuelve las primeras 5 filas. Es uno de los métodos básicos para una exploración rápida del DataFrame.
¿Qué comando se usa para contar la frecuencia de combinaciones únicas de valores de múltiples columnas?
Respuesta: df.value_counts([‘Columna1’, ‘Columna2’]) Explicación: Esto devuelve una Serie donde el índice es una combinación de los valores de las columnas especificadas y los valores son las frecuencias de esas combinaciones.
¿Qué hace el método df.tail(n)?
Respuesta: Devuelve las últimas n filas de un DataFrame. Explicación: Por defecto, si no se especifica n, devuelve las últimas 5 filas. Es útil para verificar el final de un conjunto de datos.
¿Qué hace el método df.squeeze()?
Respuesta: Si el DataFrame tiene una sola columna, lo convierte en una Serie. Si es un DataFrame de 1x1, lo convierte en un escalar. Explicación: Es útil cuando una operación puede devolver un DataFrame de una columna o una Serie, y se quiere asegurar que el resultado sea una Serie.
¿Qué son los accesores en pandas y cuáles son los dos ejemplos mencionados?
Respuesta: Son propiedades que permiten usar métodos específicos para ciertos tipos de datos. Los ejemplos son .str para texto y .dt para fechas. Explicación: Por ejemplo, para convertir una columna de texto a mayúsculas se usaría Series.str.upper().
¿Cómo se manejan los empates al usar ‘value_counts().head()’?
Respuesta: Los empates preservan el orden de su primera aparición en los datos originales. Explicación: Esto se debe a que la ordenación que utiliza es un ‘sort estable’, lo que significa que los elementos que se consideran iguales mantienen su orden relativo original.
¿Cómo se escriben comentarios en el código de Python?
Respuesta: Usando el símbolo de almohadilla (#). Explicación: El texto que sigue a # en una línea es ignorado por el intérprete y sirve para documentar y aclarar el código.