Saltar al contenido
Instituto de Data Science de Argentina

Diplomatura en Big Data

Modalidad Diplomatura online: Las clases teóricas y las prácticas se emiten por videoconferencia en vivo y son interactivas. Las emisiones se guardan para repaso de los estudiantes y tienen soporte de material PDF. Trabajos prácticos sobre casos reales
Carga horaria:  120 Hs
Duración 12 semanas
Inicia: 20 junio de 2020
Inscripción abierta. Cupos limitados!
Abona la Matrícula y reservá tu vacante.
Costo total: $ 19.900
Matrícula $ 9.900 y dos cuotas de $ 5.000
*Bonificación especial en la Matrícula para quienes se inscriban hasta 10 días antes que inicie la Diplomatura.

$9.900 $7.900

Producto disponible

Descripción

Programa de estudio de la Diplomatura en Big Data

La Diplomatura en Big data está orientada a enseñar a procesar, con aplicaciones informáticas no tradicionales  grandes y complejos conjuntos de datos, estructurados y no estructurados, para extraer valor de los datos almacenados. El objetivo es formular predicciones a través de los patrones observados. Las aplicaciones permiten crear  informes estadísticos y modelos predictivos utilizados en muchísimas áreas temáticas.

¿Sabes qué es Big Data? Mira el video del enlace, que te contamos lo que debes saber de Big Data y por qué es importante para la Ciencia de Datos

Qué es Big Data

Además

Beca gratis

Quién y cómo puede estudiar Ciencia de Datos

Quién y cómo puede estudiar Ciencia de Datos

Programa analítico de la Diplomatura en Big Data

Unidad 1: ¿Qué es y que no es Big Data?

La ciénaga conceptual.
La producción de datos a lo largo del tiempo
El problema del sentido de los datos
La evolución del límite de Big Data a largo del tiempo
La estrategia de los motores relacionales para hacerse “amigables con big data”

Unidad 2: ¿Cuándo usar técnicas de Big Data?

Concepto de paralelización
Ley de Amdhal
Concepto del costo computacional
Concepto de muestra aleatoria
Problemas muestreables y no muestreables
Ventajas y desventajas de Big Data

Unidad 3: Infraestructura de Big Data

Diferentes nodos en Hadoop
Arquitectura de los nodos maestros (Procesadores, Memoria, Discos y Placas de Red)
Arquitectura de los nodos esclavos (Procesadores, Memoria, Discos y Placas de Red)
Arquitectura de los nodos de borde (Procesadores, Memoria, Discos y Placas de Red)
Arquitectura de red (Switches TOR y Distribuidores)
Desventajas de los recursos compartidos para Big Data (virtualización blades y dockers)
Modos de funcionamiento (stand alone,pseudodistribuido, completamente distribuido)
Herramientas de benchmarking

Unidad 4: Hadoop

Filosofía de Hadoop: división y replicación de datos y tareas
Demonios del nodo maestro
Demonios del nodo esclavo
Copia de datos al clustter
Uso del caché distribuido
Ejemplo de Map Reduce: Wordcount
Extracción de los resultados

Unidad 5: Pig

Descarga e instalación
Tipos de datos que maneja
Principales comandos
Aplicación práctica

Unidad 6: Hive

Descarga e instalación
Tipos de datos que maneja
Principales comandos
Aplicación práctica

Unidad 7: Google Cloud SQL

Configuración
Tipos de datos que maneja
Principales usos
Aplicación práctica

Unidad 8: Google Big Table

Configuración
Tipos de datos que maneja
Principales usos
Aplicación práctica

Unidad 9: Spark

Configuración
Tipos de datos que maneja
Principales usos
Aplicación práctica

Unidad 10: Cassandra

Configuración
Tipos de datos que maneja
Principales usos
Aplicación práctica

Docente: Ignacio Urteaga

Catálogo de cursos