Diplomatura en Big Data

Certificado en Big Data

Diplomatura en Big Data. Modalidad Online. Dos clases semanales en vivo por videoconferencias interactivas, una teórica y una práctica. un fuerte componente práctico orientado a proyectos reales para que aprendas haciendo.
Duración: 12 semanas. Dedicación: 10 hs por semana. Carga Horaria: 120 Horas

En Argentina

Valor Promoción:
$49900 Pesos Argentinos

curso de Machine Learning con python en 6 cuotas sin interés
Otros Países

Valor Promoción:
$549 Dólares

Alumnos del exterior de argentina a la diplomatura en machine learning con python

Seleccione la fecha que desea comenzar la cursada. Vacantes Disponibles:

Plan de Estudios de la Diplomatura en Big Data

La duración de cada clase es de 30 a 60 minutos dependiendo del tema, la cantidad de participantes y el nivel de intervenciones conseguido.

Los grupos de participantes son reducidos y de varios países hispanoparlantes. Lo que aporta diferentes visiones y la posibilidad de networking internacional.

Soporte docente por Grupo de WhatsApp, email y foro.

El entrenamiento tiene un componente teórico de los conocimientos para que comprendas el por qué se hace lo que se hace, y

El estudiante tiene actividad complementaria con material de soporte de las clases, material teórico para estudiar, ejercicios resueltos y para resolver. Se realiza corrección de ejercicios y autoevaluaciones.

Objetivos

La Diplomatura en Big data está orientada a enseñar a procesar, con aplicaciones informáticas no tradicionales  grandes y complejos conjuntos de datos, estructurados y no estructurados, para extraer valor de los datos almacenados.

El objetivo es formular predicciones a través de los patrones observados. Las aplicaciones permiten crear  informes estadísticos y modelos predictivos utilizados en muchísimas áreas temáticas.

Veremos que es y que no es Big Data, cuando nos conviene usar los métodos de procesamiento en paralelo al tiempo que la pasamos revista al ecosistema de hadoop. Cubriremos los criterios para diseñar un cluster de hadoop distinguiendo entre los nodos maestros, esclavos y de borde.

Recorreremos el uso de herramientas específicas como spark, cassandra, pig, hive, google cloud sql y google big table.

Programa analítico de la diplomatura en Big Data

Unidad 1: ¿Qué es y que no es Big Data?
  • Definiciones
  • La producción de datos a lo largo del tiempo
  • El problema del sentido de los datos
  • La evolución del límite de Big Data a largo del tiempo
  • La estrategia de los motores relacionales para hacerse “amigables con big data”
  • Ecosistema de Hadoop

Unidad 2: ¿Cuándo usar técnicas de Big Data?

  • Concepto de paralelización
  • Ley de Amdhal
  • Concepto del costo computacional
  • Concepto de muestra aleatoria
  • Problemas muestreables y no muestreables
  • Ventajas y desventajas de Big Data
Unidad 3: Infraestructura de Big Data
  • Diferentes nodos en Hadoop
  • Arquitectura de los nodos maestros (Procesadores, Memoria, Discos y Placas de Red)
  • Arquitectura de los nodos esclavos (Procesadores, Memoria, Discos y Placas de Red)
  • Arquitectura de los nodos de borde (Procesadores, Memoria, Discos y Placas de Red)
  • Arquitectura de red (Switches TOR y Distribuidores)
  • Desventajas de los recursos compartidos para Big Data (virtualización blades y dockers)
  • Modos de funcionamiento  (stand alone,pseudodistribuido, completamente distribuido)
  • Herramientas de benchmarking
Unidad 4: Sistema operativo Linux
  • Instalación
  • Comandos para el sistema de archivos
  • Administración de la seguridad
  • Mantenimiento y copias de seguridad
Unidad 5: Máquina virtual de Hortonworks
  • Descarga e instalación de VirtualBox
  • Descarga e instalación de la máquina virtual
  • Configuración de la máquina virtual
  • Consideraciones de performance
  • Copias de seguridad
Unidad 6: Ecosistema de Big Data
  • Map reduce
  • Configuración de un cluster
  • Zookeeper
  • Ambari
  • Hive en profundidad
  • Ejemplos de punta a punta
  • Datalakes: ingesta y extracción
  • Calidad de los big datos
Unidad 7: Introducción a NoSQL
  • Teoría Concepto de NoSQL.
  • Modelo Relacional vs estructuras No Relacionales.
  • Criterio de selección entre ambos modelos.
  • Relación con los volúmenes de datos y de consultas.
  • ACID en NoSQL.
  • Tecnología MySQL
Unidad 8: Modelos de NoSQL
  • Teoría Distintos modelos NoSQL.
  • Implementación y funcionamiento de cada uno de ellos.
  • Comparación de las distintas soluciones.
  • Tecnología MongoDB, Cassandra, Redis
Unidad 9: Administración de bases NoSQL
  • Teoría Administración y recuperación desde fuentes de datos no estructurados.
  • Interfaces de administración.
  • Técnicas de acceso.
  • Distribución de datos.
  • Escalamiento Horizontal.
  • Tecnología MongoDB, Cassandra, Redis
Unidad 10: Replicación y particionamiento
  • Teoría Replicación y particionamiento.
  • Teorema CAP.
  • Modelos de replicación: Master-Slave; Master-SlaveMaster; peer to peer;
  • Criterios de aprisionamiento. Distintos tipos de consistencia: eventual, por quorum, plena de escritura, plena de lectura.
  • Tecnología MongoDB, Cassandra, Redis
Unidad 11: Criterios de diseño NoSQL
  • Teoría Acceso a estructura NoSQL desde una aplicación.
  • Creación de tablas.
  • Diseño de base de datos.
  • Operaciones CRUD.
  • Tecnología MongoDB, Cassandra, Redis
Unidad 12: Integración NoSQL.
  • Teoría Manejo de grandes volúmenes de datos.
  • Integración de estructuras NoSQL en Data Marts.
  • Comparación de rendimientos con estructuras relacionales.
  • Tecnología MongoDB, Cassandra, Redis

Instancias de evaluación

Examen final.

Requisitos de aprobación

Mínimo 60 % de respuestas correctas.

Equipo docente de la Diplomatura en Big Data

Artículo añadido al carrito.
0 artículos - $0,00
Abrir chat
¿Necesitas asesoramiento?