Sábado 11:00–13:00

Análisis de Datos Abiertos en Python + Jupyter

Ignacio Heredia, Agustín Benassi (Beni), Martin Elias Costa

Audience level:
Intermedia

Descripción

Haremos un recorrido desde las fuentes de datos hasta las herramientas que nos permiten explotarlos analíticamente. Vamos a contarles qué es un Portal de Datos Abiertos, qué APIs interesantes exponen datos y cómo aprovechar herramientas como Jupyter, pandas, matplotlib, numpy y scipy para darles valor agregado.

Resumen

Desde hace algunos años, los Datos Abiertos se convirtieron en una tendencia global y cada vez hay más gobiernos, organismos internacionales y actores de todo tipo que tienden a publicar sus datos en formatos abiertos, usando plataformas estandarizadas.

El esfuerzo en la publicación de datos tiene sentido si maximiza sus posibilidades de reutilización y creación de valor agregado a partir de ellos.

En este taller vamos a mostrar cómo puede ser el recorrido desde las fuentes de datos hasta las herramientas que nos permiten explotarlos analíticamente.

En la primer parte, contaremos qué es un Portal de Datos Abiertos, cómo aprovechar las funcionalidades de CKAN (la plataforma elegida por el Gobierno Nacional de Argentina para publicar datos) y qué otras APIs interesantes exponen datos en forma estandarizada.

Después, vamos a mostrarles las herramientas que utilizamos habitualmente en la Dirección Nacional de Datos e Información Pública para explorar y analizar conjuntos de datos con Python, incluyendo cómo usar un notebook Jupyter integrando al flujo de trabajo librerías como pandas, matplotlib, numpy y scipy.

Slides

Video