La Oficina de Software libre colabora en la organizaci贸n de la conferencia/taller de la comunidad PyData Granada: 芦La explosiva pareja del an谩lisis Big Data: PySpark en Databricks禄 junto con NumFocus, la ETS. Ingenier铆as Inform谩tica y de Telecomunicaci贸n, Python Espa帽a y aiImpulsa.
Fecha: Jueves 27 de Abril de 2023, a las 18:30 en la ETSIIT.
Detalles
PyData es una comunidad diversa de personas interesadas en el uso y desarrollo de herramientas de an谩lisis de datos con el objetivo de compartir ideas y aprender. Nos reunimos para discutir las mejores pr谩cticas, nuevos enfoques y tecnolog铆as emergentes para la gesti贸n de datos, procesamiento, an谩lisis y visualizaci贸n. Utilizamos muchos lenguajes de programaci贸n, incluyendo (pero no limitado a) Python, Julia y R.
### AGENDA
6:15pm – Apertura de puertas y networking
6:20pm – Breve presentaci贸n de PyData Granada
Noticias e informaci贸n sobre la comunidad.
6:30pm – La explosiva pareja del an谩lisis Big Data: PySpark en Databricks.
Todos conocemos las maravillas que pueden hacer los modelos de Machine Learning e Inteligencia Artificial por nosotros pero para poder entrenar estos gigantes de la tecnolog铆a es necesario el empleo de datos limpios para que las predicciones sean precisas. Cuantos m谩s datos usemos, mejor ser谩 nuestro modelo pero 驴c贸mo preparar datos masivos de forma 谩gil, sostenible y sobre todo, mantenible?
Spark es un framework Open Source que nos permite realizar transformaci贸n y limpieza de datos masiva mediante la computaci贸n paralela en cluster de computadores. PySpark es su API para Python con la que podremos preparar nuestros pipelines de forma sencilla.
Databricks es un servicio cloud que nos ofrece la gesti贸n de nuestros clusters en el cloud as铆 como la automatizaci贸n de nuestros pipelines una vez est茅n preparados para ejecutarse. Junto con PySpark hacen una pareja de herramientas indispensable en el mundo del Big Data y de la Inteligencia Artificial.
En este workshop totalmente hands-on veremos:
- Paseo e introducci贸n a Databricks
- Levantar un cluster
- Ejecutar notebooks
- Introducci贸n a Spark en Python
- C贸mo funciona Spark y su ejecuci贸n en paralelo
- C贸mo crear un pipeline Big Data
- Optimizaci贸n de queries y ejecuci贸n
- Pipeline a producci贸n
- Tracking y mantenimiento
- Introducci贸n al Streaming de datos
IMPORTANTE >> Para el correcto desarrollo del taller, las personas participantes han de traer sus port谩tiles. Tambi茅n es obligatoria la inscripci贸n en https://www.meetup.com/es-ES/pydatagrx/events/292425237/
8:00pm – Picoteo y networking
驴Te gustar铆a hablar en este meetup o en uno futuro? Env铆anos tu propuesta a trav茅s de nuestras redes sociales.
Deja una respuesta