institutodatascience.org

ciencia de datos con r y python | educación profesional

Adquiere las habilidades necesarias en Ciencia de Datos con R y Python para liderar en un mundo impulsado por los datos y accede a oportunidades laborales de alto nivel.

La ciencia de datos es el motor detrás de la toma de decisiones inteligentes en el mundo moderno. Innovación, dominio y éxito te esperan. ¡Únete a nosotros y desbloquea tu potencial profesional!

Con profesores expertos y un enfoque teórico-práctico, te convertirás en un profesional altamente calificado, preparado para destacar en el competitivo mercado laboral actual. ¿Estás listo para convertirte en un líder en la era de la información?

Modalidad: Online

Clases interactivas por Zoom

Duración: 30 Semanas

3 clases en vivo por semana

Diplomatura en Ciencia de Datos con R y Python

Avalada por la Universidad Tecnológica Nacional UTN Sede Reconquista

El precio original era: USD 453.El precio actual es: USD 349.INSCRIBIRME AHORA

PAGO TOTAL (ACCESO 2 AÑOS)

MEMBRESÍA IDSA: $50.000 o $50 USD por mes*

¡No necesitas experiencia previa en ninguna área! Nuestro programa está cuidadosamente diseñado en etapas para dar la bienvenida a estudiantes de todos los niveles de conocimiento.

¿Por qué Aprender Ciencia de Datos con R y Python en el Instituto Data Science?

La cursada esta planteada para que puedas aplicar las habilidades adquiridas en ciencia de datos con R y Python en diversos campos: negocios, salud, recursos humanos, procesos de servicios y de producción, finanzas, publicidad, y muchos más. Dominara los algoritmos, métodos, técnicas y aplicaciones más importantes utilizados por los científicos de datos del mundo real.

Programa Académico de la Diplomatura en Ciencia de Datos con R y Python

Nivelación (Optativa)

  • Programación lógica.
  • Bases de datos relacionales y no relacionales.
  • Probabilidad y Estadística.

Introducción Conceptual

  • Introducción a la Ciencia de Datos.
  • Niveles a los que opera la ciencia de datos.
  • Introducción a Data Warehouse.
  • Introducción a Data Mining.
  • Introducción a Knowledge Discovery.
  • Introducción a Herramientas OLAP y Tableros de comando.
  • Repaso de herramientas disponibles.
  • Taxonomía de las competencias de un científico de datos.

Introducción a R

  • Variables, vectores y matrices.
  • Dataframes.
  • Paquetes y librerías.
  • Manejo de archivos csv.
  • Conversiones de tipos.
  • Conexión a bases de datos.
  • Ejecución condicional.
  • Bucles.
  • Funciones en R.
  • Medidas estadísticas.
  • Correlaciones.
  • Funciones estadísticas.

Introducción a Python

  • Descarga e instalación.
  • Principales librerías.
  • Variables y tipos de datos.
  • Listas, tuplas y diccionarios.
  • Ejecución condicional.
  • Ciclos definidos e indefinidos.
  • Manejo de Excepciones.
  • Funciones y Generadores.
  • Clases y objetos.
  • Manejo de archivos y directorios.
  • Conexión a archivos planos.
  • Conexión a Excel.
  • Conexión a Bases de Datos.

Tests básicos

  • Repaso de conceptos de probabilidad y estadística.
  • Test de Hipótesis.
  • Correlaciones.
  • AB Test.
  • Cálculo de correlaciones en R con cor.
  • Funciones de distribución en R.
  • Histogramas en R.
  • Gráficos de líneas en R.
  • Gráficos de áreas en R.
  • Uso de NumPy.
  • Uso de Pandas.
  • Uso de MatPlotLib.
  • Módulo matplotlib.
  • Módulo math.
  • Módulo numpy.
  • Módulo yt.
  • Módulo mayavi.

Regresiones

  • Regresión Lineal.
  • Regresión polinómica.
  • Regresión exponencial y logarítmica.
  • Regresión de dos variables.
  • Cálculo de regresiones en R con lm.
  • Cálculo de regresiones logísticas en R con glm.
  • Regresiones en Python.
  • Regresión logística en Python.

Arboles de decisión

  • Algoritmo básico en Excel.
  • División en entrenamiento y prueba.
  • Uso de Rpart y cp.
  • Predicción y valoración de la solución.
  • Uso de Party.
  • Aplicación al problema del call center.
  • Instalación y uso del paquete en Python.
  • Ejemplo en Python.
  • Principales parámetros de ajuste y control.

Clusters

  • Algoritmo básico en Excel.
  • Uso de kmeans en R.
  • Ejemplo de aplicación real en R.
  • Otros algoritmos de agrupamiento en R.
  • Ejercicio de aplicación de agrupamiento de mascotas.
  • Uso de Scikit-Learn en Python.
  • Análisis de componentes principales en Python.
  • K-Medias en Python.
  • Clustering jerárquico en Python.

Reglas de Asociación

  • Algoritmo básico en Access.
  • División en entrenamiento y prueba en R.
  • Uso de arules en R.
  • Ejemplo de una aplicación real votación de reglas en R.
  • Ejemplo de una aplicación real a datos de ventas en supermercados en R.
  • Instalación y uso del paquete en Python.
  • Ejemplo en Python.
  • Principales parámetros de ajuste y control.
  • Esquema de votación de reglas en Python.

Redes Neuronales

  • Algoritmo básico en Excel.
  • División en entrenamiento y prueba en R.
  • Uso de neuralnet.
  • Predicción y valoración de la solución en R.
  • Discusión del problema de legibilidad de los resultados desde el negocio.
  • Competencia entre árboles y redes en un caso concreto en R.
  • Instalación y uso del paquete en Python.
  • Ejemplo en Python.
  • Principales parámetros de ajuste y control en Python.
  • Problema concreto en Python.

Algoritmos genéticos

  • Algoritmo básico en Excel.
  • Discusión del tipo de problemas en los que se aplica.
  • Discusión de otros mecanismos de optimización.
  • Implementación en R del uso de algoritmos genéticos.
  • Valores reales.
  • Binarios.
  • Permutaciones.
  • Implementación en Python.

Series temporales

  • Taxonomía.
  • Separación de componentes.
  • Predicciones.
  • ARIMA implementado en R.
  • Predicción en series con un único período.
  • Predicción en series con múltiples períodos.
  • Predicción en series con períodos variables: renormalización.
  • Implementación en Python.

Método de Simulación de Montecarlo

  • Algoritmo básico en Excel.
  • Discusión de la utilidad del método.
  • Comparación con el análisis de escenarios.
  • Ejemplo de una aplicación real.
  • Ejemplo simple implementado en R.
  • Ejemplo simple implementación en Python.

Minería de textos

  • Clasificación supervisada de piezas de texto.
  • Construcción de una red semántica.
  • Discusión de las posibilidades de reconocimiento de voz.
  • Ejemplos de aplicación real del algoritmo de clasificación.
  • Aplicación a la detección de sentimientos.
  • Ejemplo de implementación en Python.

Vecinos Cercanos (Knn)

  • Instalación y uso del paquete en R.
  • Ejemplo conceptual en Excel.
  • Ejemplo en R.
  • Instalación y uso del paquete en Python.
  • Ejemplo en Python.
  • Principales parámetros de ajuste y control.

Bayes Ingenuo

  • Implementación en Excel.
  • Ejemplo de aplicación en R.
  • Comparación de 4 algoritmos predictivos (Bayes ingenuo, árboles, redes neuronales y regression logística).
  • Ejemplo de aplicación en Python.

Random Forest

  • Bootstrap y bagging.
  • Descripción conceptual del método random forest.
  • Paquete randomForest para R.
  • Ejemplo de aplicación.
  • Comparación con otras técnicas.
  • Implementación en Python.

Métodos bayesianos avanzados

  • Descripción conceptual del método.
  • Regresión lineal bayesiana.
  • Regresión logística bayesiana.
  • Inferencia bayesiana.
  • Red bayesiana.
  • Ejemplos de aplicación en R.
  • Paquete BAS.
  • Paquete brms.
  • Paquete arm.
  • Paquete bnlearnd.
  • Comparación con otras técnicas.
  • Ejemplos de aplicación en Python.

Máquina de soporte vectorial

  • Descripción conceptual del método.
  • Paquete e1071 para R.
  • Ejemplo de aplicación en R.
  • Ejemplo de aplicación en Python.
  • Comparación con otras técnicas.

Discriminante lineal y cuadrático

  • Instalación y uso del paquete.
  • Ejemplo conceptual en Excel.
  • Ejemplo en R.
  • Ejemplo en Python.
  • Principales parámetros de ajuste y control en R.
  • Principales parámetros de ajuste y control en Python.
  • Problema concreto.

Análisis de Fourier

  • Descripción conceptual.
  • Ejemplo conceptual en Excel.
  • Instalación y uso del paquete en R.
  • Instalación y uso del paquete en Python.
  • Ejemplo en R.
  • Ejemplo en Python.

Herramientas geográficas

  • Distancias.
  • Implementación en R.
  • Paquete sf.
  • Paquete nngeo.
  • Aplicación práctica en R.
  • Implementación en Python.
  • Aplicación práctica en Python.

Bases de datos documentales

  • Instalación de MongoDB.
  • Conexión a R.
  • Conexión a Python.
  • Aplicación práctica en R.
  • Aplicación práctica en Python.

Diseño de Datawarehouses

  • Diferencias entre los DW y los OLTP.
  • Tipos de datos y soportes.
  • Dimensiones y jerarquías.
  • Estimación de recursos y tiempos según tipos de datos.
  • Ejemplos de staging.
  • Interacción entre equipos (DB-ETL-Soporte-FrontEnd-Usuarios).
  • Ejercicios de diseño de DW.

Diseño y construcción de ETL

  • Procesos ETL: generalidades, buenas prácticas, esquemas de ETL.
  • Detalles de cada etapa: extracción, limpieza, normalización, transformación, carga.
  • Estrategias de update.
  • Ejercicios de diseño de ETL para la carga inicial.
  • Ejercicios de diseño de ETL para la actualización.
  • Licencia, descarga e instalación de Open Refine.
  • Uso general como herramienta de limpieza de datos.
  • Pre-procesado de los datos.
  • Casos de interés y ejemplos.
  • Licencias, descarga e instalación de Pentaho-Kettle.
  • Pentaho Kettle: funciones, características, utilización.
  • Auditoría y documentación.
  • Ejemplos de uso.

Big Data

  • ¿Qué es Big Data?
  • ¿Cuándo usar Big Data?
  • ¿Cómo armar una infraestructura para Hadoop?
  • Ejemplo de una aplicación de Map Reduce: wordcount.
  • Como evitar Hadoop.

Clases interactivas

Con instructores expertos en el tema, tendrás la oportunidad de participar activamente, hacer preguntas en tiempo real y colaborar con tus compañeros de clase.

Aprende haciendo

Un fuerte componente práctico orientado a proyectos para que aprendas haciendo. Al final de la cursada puedes realizar tus propios proyectos.

Consultas online

Acceso a los tutores por plataformas de mensajería instantánea (Telegram). Se coordinan videollamadas para atender consultas especificas.

Calidad Educativa

La Universidad Tecnológica Nacional FFRq ha reconocido la calidad académica de este programa a través de la Resolución Nº 290/20. Los egresados de esta carrera han recibido ofertas de trabajo en empresas privadas, organismos públicos, entre otras prestigiosas organizaciones.

Primera Línea

La diplomatura en Ciencia de Datos con R y Python ha sido diseñada, desarrollada y actualizada por un equipo de profesionales con amplia experiencia en este campo y te proporcionará las principales herramientas de análisis de datos actuales, y el lenguaje de programación Python.

Oportunidades

Amplía tus horizontes con dos sesiones semanales dirigidas por expertos. Python ofrece aplicaciones versátiles que abarcan diversos campos, brindándote un panorama amplio de oportunidades para desarrollar soluciones innovadoras y transformar el futuro.

Video de presentación de la Diplomatura en Ciencia de Datos con R y Python

Proyectos de Data Science que realizarás en la cursada

La diplomatura en Ciencia de Datos con R y Python incluye un fuerte componente práctico orientado a proyectos para que aprendas haciendo. Al final de la cursada podrás realizar tus propios proyectos.

  • Selección de prospectos: Aprenderás a seleccionar los prospectos de venta que tengan la máxima rentabilidad o máxima ganancia.
  • Predicciones de ventas: Podrás realizar tus propias predicciones de venta para el futuro.
  • Selección de personal: Aprenderás a seleccionar personal dependiendo de ciertos factores.
  • Cartera de Acciones: Distribuir la cartera de acciones de manera de maximizar la rentabilidad y minimizar la variabilidad.
  • Optimización de Cajas: Cómo optimizamos la cantidad de cajas que tiene que haber en un supermercado para controlar la demora.
  • Muchos más proyectos: Durante tu cursada seguirás viendo más proyectos y también los docentes te ayudarán en tu propio proyecto final.

Fórmate como Data Scientist a tu ritmo y sin experiencia previa

Etapa de Nivelación

Clases en vivo de Programación Lógica + Bases de Datos + Probabilidad y Estadística.

Etapa de Introducción

Clases en vivo de Introducción Conceptual + Introducción a los Lenguajes de Programación + Taller de Programación.

Etapa de Especialización

Clases en vivo teóricas y prácticas sobre las principales librerías, técnicas y herramientas.

Nuestra Diplomatura en Ciencia de Datos con R y Python te ofrece una modalidad de cursada flexible y personalizada. Además de las clases online en vivo todas las semanas, tendrás la libertad de avanzar a tu propio ritmo y elegir el orden en que deseas abordar los temas. No hay necesidad de preocuparte por el tiempo, ya que tendrás un año completo para cursar de forma asincrónica si así lo prefieres.

Además, para brindarte un soporte adicional, contamos con grupos de Telegram donde podrás consultar tus dudas con los docentes y obtener asistencia fuera del horario de clases. Nuestro objetivo es asegurarnos de que tengas todas las herramientas necesarias para tu éxito en el campo de la ciencia de datos. ¡Únete a nuestra diplomatura y descubre una forma flexible y enriquecedora de aprender!

Cronograma de la cursada

3 clases en vivo por semana (Horario GTM-3). Las clases se dictan en vivo por Zoom y tienen una duración de 45 a 90 minutos dependiendo del tema y la interacción con los estudiantes. Todas las clases quedan grabadas a disposición de los estudiantes y no se exige asistencia.

Turno Par

Lunes 21:30 Horas

Miércoles 21:30 Horas

Jueves 19:00 Horas

Turno Impar

Lunes 19:00 Horas

Lunes 21:30 Horas

Martes 19:00 Horas

Certificado en Data Science con Python y R

Instancias de Evaluación

Presentación de proyecto final y Examen final de la diplomatura (Mínimo 60 % de respuestas correctas).

Autoevaluación Etapa de Nivelación (optativa).

Formas de pago disponibles

Transferencia Bancaria.

Tarjeta de crédito, débito a través de MercadoPago.

PayPal desde el exterior de Argentina.

Membresía IDSA (Pago Mensual)

PAGO TOTAL (2 años de acceso)

El precio original era: USD 453.El precio actual es: USD 349.INSCRIBIRME AHORA

Equipo docente de la Diplomatura en Ciencia de Datos con R y Python

Ignacio Urteaga Director Ciencia de Datos con R y Python

Ignacio Urteaga

MBA en Dirección de Sistemas de Información. Físico, (Tesis en física nuclear) Investigador, Premiado en 2001 por sus trabajos en Ciencia de Datos. Más de 30 años de experiencia docente en Universidades y en la aplicación de Datos y BI como Director, Gerente o Consultor en el ámbito público y privado.

Anahí Romo Docente Instituto Data Science

Anahí Romo

Licenciada en Ciencias Físicas de la Universidad de Buenos Aires. Maestría en gestión de la energía en la Universidad Nacional de Lanús. Maestría de energías renovables Universidad Nacional de Salta. Desarrolladora Python.

Nicolás del Frate Docente Ciencia de Datos con R y Python

Nicolás del Frate

Ingeniero Electrónico especializado en Telecomunicaciones (FI-UNLP). PM y Program Manager en Google, para proyectos de USA. Más de 20 años de experiencia laboral, en empresas como Ericsson, MCI-Verizon, Telecom Personal, Avaya, ZTE y Telecentro.

Julio Paredes Docente Ciencia de Datos con R y Python

Julio Paredes

Ingeniero Industrial con Maestría en Administración de Empresas con enfoque en análisis de datos. Más de 15 años de experiencia laboral en diversos campos, incluida la inteligencia empresarial, la cadena de suministro y la docencia en TI y gestión.

Jerónimo Pardo Docente Instituto Data Science

Jerónimo Pardo

Licenciatura en Comercio Internacional y Licenciatura en Comercialización en UADE.
Amplios conocimientos en las áreas de Marketing Digital y Community Managment. Especializado en Tecnologías de la Información en UTN y otras universidades en el exterior.

MEMBRESÍA MENSUAL

Valor mensual de la membresía

Artículo añadido al carrito.
0 artículos - USD 0
Abrir chat
1
¿Alguna consulta? Estamos online.
Escanea el código
¿Dudas? Consulta por WhatsApp.