6  Lectura de archivos csv

En el análisis de datos con Pandas, la función pd.read_csv() es una herramienta esencial para importar datos desde archivos CSV. Esta poderosa función no solo simplifica la carga de datos, sino que también ofrece una amplia gama de opciones flexibles que permiten una adaptación precisa a las diversas necesidades de importación.

Aprender a personalizar la lectura de tus archivos CSV es esencial para alinearlos con los objetivos específicos de tu proyecto. Ya sea que necesites saltar filas, interpretar fechas o utilizar una columna como índice, pd.read_csv() te brinda todas las herramientas necesarias para preparar tus datos para un análisis de datos efectivo y poderoso en Pandas.

Es más que una simple función de importación; es la clave para desbloquear el potencial completo de tus datos en el entorno de Pandas, permitiéndote centrarte en lo que realmente importa: obtener infromación valiosa a través del análisis de datos.

import pandas as pd
f = "../data/Cuernavaca_To_1dia_comas.csv"
cuerna = pd.read_csv(f)
cuerna.head() # hacerlo primero sin head
tiempo To
0 2012-01-01 00:00:00 19.3
1 2012-01-01 01:00:00 18.6
2 2012-01-01 02:00:00 17.9
3 2012-01-01 03:00:00 17.3
4 2012-01-01 04:00:00 16.6
type(cuerna)
pandas.core.frame.DataFrame
cuerna = pd.read_csv(f) #Muestra las opciones que tiene shift + tab adentro de parentesis
cuerna = pd.read_csv(f,index_col=0)
cuerna.index
Index(['2012-01-01 00:00:00', '2012-01-01 01:00:00', '2012-01-01 02:00:00',
       '2012-01-01 03:00:00', '2012-01-01 04:00:00', '2012-01-01 05:00:00',
       '2012-01-01 06:00:00', '2012-01-01 07:00:00', '2012-01-01 08:00:00',
       '2012-01-01 09:00:00', '2012-01-01 10:00:00', '2012-01-01 11:00:00',
       '2012-01-01 12:00:00', '2012-01-01 13:00:00', '2012-01-01 14:00:00',
       '2012-01-01 15:00:00', '2012-01-01 16:00:00', '2012-01-01 17:00:00',
       '2012-01-01 18:00:00', '2012-01-01 19:00:00', '2012-01-01 20:00:00',
       '2012-01-01 21:00:00', '2012-01-01 22:00:00', '2012-01-01 23:00:00'],
      dtype='object', name='tiempo')