Desplegando servicios en la nube: Apache Spark

Ponente: Jesús María Aransay Azofra (Universidad de La Rioja)

Lugar: Salón de Actos (Edificio CCT), o a través de Blackboard (https://bit.ly/salaDMC)

Hora: martes 21 de diciembre, 11:00

Resumen: En esta charla ilustraremos cómo se puede automatizar el despliegue de un clúster Apache Spark en la nube (en concreto, en un entorno OpenStack). Para ello usaremos la utilidad “cloud-init” que permite configurar máquinas virtuales durante su creación. Una vez desplegado, presentaremos algunas de las posibilidades de uso de Apache Spark para cálculo distribuido y para ciencia de datos y gestión de información.

El arte de la ciencia de datos. Casos prácticos y tendencias

Ponente: Felipe Ortega (Universidad Rey Juan Carlos de Madrid)

Lugar: Aula 303, Edificio Vives

Hora: martes 1 de julio, 11:30

Abstract: La ciencia de datos se ha convertido en un pilar fundamental sobre el que se desarrollan los avances científicos en numerosas disciplinas. En la actualidad, hablar de ciencia de datos y big data suele ser sinónimo de conceptos como MapReduce y NoSQL, así como de proyectos como Apache Hadoop o Apache Spark. Sin embargo, el procesamiento eficiente de big data no es terreno exclusivo de los sistemas distribuidos o las bases de datos no relacionales.

En esta charla se introducirán los patrones más habituales que podemos usar para implementar proyectos que involucran big data, incluyendo soluciones alternativas a los sistemas distribuidos que ofrecen buen rendimiento a la par que reducen coste y complejidad.

Puedes encontrar las transparencias de la charla en el siguiente enlace.