Segunda Meetup PyData Granada: La explosiva pareja del análisis Big Data: PySpark en Databricks

/ 27 de marzo de 2023

La Oficina de Software libre colabora en la organización de la conferencia/taller de la comunidad PyData Granada: «La explosiva pareja del análisis Big Data: PySpark en Databricks» junto con NumFocus, la ETS. Ingenierías Informática y de Telecomunicación, Python España y aiImpulsa.

Fecha: Jueves 27 de Abril de 2023, a las 18:30 en la ETSIIT.

Detalles

PyData es una comunidad diversa de personas interesadas en el uso y desarrollo de herramientas de análisis de datos con el objetivo de compartir ideas y aprender. Nos reunimos para discutir las mejores prácticas, nuevos enfoques y tecnologías emergentes para la gestión de datos, procesamiento, análisis y visualización. Utilizamos muchos lenguajes de programación, incluyendo (pero no limitado a) Python, Julia y R.

### AGENDA
6:15pm – Apertura de puertas y networking
6:20pm – Breve presentación de PyData Granada
Noticias e información sobre la comunidad.
6:30pm – La explosiva pareja del análisis Big Data: PySpark en Databricks.

Todos conocemos las maravillas que pueden hacer los modelos de Machine Learning e Inteligencia Artificial por nosotros pero para poder entrenar estos gigantes de la tecnología es necesario el empleo de datos limpios para que las predicciones sean precisas. Cuantos más datos usemos, mejor será nuestro modelo pero ¿cómo preparar datos masivos de forma ágil, sostenible y sobre todo, mantenible?

Spark es un framework Open Source que nos permite realizar transformación y limpieza de datos masiva mediante la computación paralela en cluster de computadores. PySpark es su API para Python con la que podremos preparar nuestros pipelines de forma sencilla.

Databricks es un servicio cloud que nos ofrece la gestión de nuestros clusters en el cloud así como la automatización de nuestros pipelines una vez estén preparados para ejecutarse. Junto con PySpark hacen una pareja de herramientas indispensable en el mundo del Big Data y de la Inteligencia Artificial.

En este workshop totalmente hands-on veremos:

Paseo e introducción a Databricks

Levantar un cluster
Ejecutar notebooks

Introducción a Spark en Python

Cómo funciona Spark y su ejecución en paralelo
Cómo crear un pipeline Big Data
Optimización de queries y ejecución

Pipeline a producción

Tracking y mantenimiento

Introducción al Streaming de datos

IMPORTANTE >> Para el correcto desarrollo del taller, las personas participantes han de traer sus portátiles. También es obligatoria la inscripción en https://www.meetup.com/es-ES/pydatagrx/events/292425237/

8:00pm – Picoteo y networking

¿Te gustaría hablar en este meetup o en uno futuro? Envíanos tu propuesta a través de nuestras redes sociales.

Publicado en Eventos | Etiquetado ETSIIT, pydata, python, taller

Deja una respuesta Cancelar la respuesta

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.