🔥 6 cuotas sin interés con todos los medios de pago | Con tu inscripción te incluimos GRATIS el Curso Experto en Power BI 👨‍🏫

Diplomatura en Ciencia de Datos con R y Python

La Diplomatura en Ciencia de Datos con R y Python es un programa educativo de formación avanzada que aborda los principales fundamentos, métodos y técnicas de la ciencia de datos moderna, con énfasis en su aplicación práctica en contextos reales mediante los lenguajes R y Python, ampliamente utilizados en ámbitos académicos, científicos y productivos.

El programa está diseñado para brindar una comprensión sólida e integrada del ciclo completo de la ciencia de datos, abarcando desde la adquisición, limpieza y exploración de datos, hasta el análisis estadístico, la visualización, el modelado predictivo y la interpretación de resultados para la toma de decisiones.

A lo largo de la diplomatura, se articulan conceptos teóricos fundamentales, prácticas guiadas y el análisis de casos reales, permitiendo al estudiante desarrollar competencias técnicas y analíticas aplicables a distintos dominios, como negocios, industria, investigación, sector público y tecnología.

EDICIÓN 2026

Certificado UTN diplomatura en ciencia de datos con R y Python - Instituto Data Science Argentina

Universidad Tecnológica Nacional
+ Instituto Data Science

Resolución Nro. 290/20 · UTN FRRQ


Tu mejor certificado es tu proyecto público.

Garantía de Satisfacción: 30 días

Modalidad: Online, En vivo
Duración: 8 Meses
Clases por semana: 4 por Zoom

Vacantes Disponibles

$999.000,00INSCRIBIRME AHORA

Ciencia de Datos con R y Python Formas de pago

Programa Académico

Etapa de Nivelación

Programación lógica

Introducción a la Programación Lógica. Tipos de Variables. Ejecución condicional. Ciclos. Funciones. Conceptos generales.

Bases de datos relacionales

Introducción a Bases de Datos. Relaciones. Formas normales. Operaciones sobre tablas. Joins. Objetos de las bases de datos. Optimización de consultas. Arquitectura de las bases de datos. SQL Server.

Probabilidad y Estadística

Introducción a Estadística.

Curso Experto en Power BI (On-demand)

Introducción al Power BI como herramienta clave. Los datos dentro de la administración empresarial con BI. Cargar datos a Power BI utilizando Power Query. Generación de columnas y tabla calendario para lograr una buena gestión de los datos. Utilizar Dax para gestionar datos. Diseño de informes / gráficos. Proyecto final. (6 clases grabadas).

Etapa de Introducción

Introducción Conceptual

Introducción a la Ciencia de Datos. Niveles a los que opera la ciencia de datos. Introducción a Data Warehouse. Introducción a Data Mining. Introducción a Knowledge Discovery. Introducción a Herramientas OLAP y Tableros de comando. Repaso de herramientas disponibles. Taxonomía de las competencias de un científico de datos.

Introducción a Python

Descarga e instalación. Principales librerías. Variables y tipos de datos. Listas, tuplas y diccionarios. Ejecución condicional. Ciclos definidos e indefinidos. Manejo de Excepciones. Funciones y Generadores. Clases y objetos. Manejo de archivos y directorios. Conexión a archivos planos. Conexión a Excel. Conexión a Bases de Datos.

Introducción a R

Variables, vectores y matrices. Dataframes. Paquetes y librerías. Manejo de archivos csv. Conversiones de tipos. Conexión a bases de datos. Ejecución condicional. Bucles. Funciones en R. Medidas estadísticas. Correlaciones. Funciones estadísticas.

Taller de Programación

Talleres prácticos en vivo de programación, para seguir reforzando sus conocimientos.

Análisis Exploratorio

Uso de NumPy. Uso de Pandas. Uso de MatPlotLib. Módulo matplotlib. Módulo math. Módulo numpy. Módulo yt. Módulo mayavi.

Tests básicos

Repaso de conceptos de probabilidad y estadística. Test de Hipótesis. Correlaciones. AB Test. Cálculo de correlaciones en R con cor. Funciones de distribución en R. Histogramas en R. Gráficos de líneas en R. Gráficos de áreas en R. Uso de NumPy. Uso de Pandas. Uso de MatPlotLib. Módulo matplotlib. Módulo math. Módulo numpy. Módulo yt. Módulo mayavi.

Regresiones

Regresión Lineal. Regresión polinómica. Regresión exponencial y logarítmica. Regresión de dos variables. Cálculo de regresiones en R con lm. Cálculo de regresiones logísticas en R con glm. Regresiones en Python. Regresión logística en Python.

Arboles de decisión

Algoritmo básico en Excel. División en entrenamiento y prueba. Uso de Rpart y cp. Predicción y valoración de la solución. Uso de Party. Aplicación al problema del call center. Instalación y uso del paquete en Python. Ejemplo en Python. Principales parámetros de ajuste y control.

Clusters

Algoritmo básico en Excel. Uso de kmeans en R. Ejemplo de aplicación real en R. Otros algoritmos de agrupamiento en R. Ejercicio de aplicación de agrupamiento de mascotas. Uso de Scikit-Learn en Python. Análisis de componentes principales en Python. K-Medias en Python. Clustering jerárquico en Python.

Reglas de Asociación

Algoritmo básico en Access. División en entrenamiento y prueba en R. Uso de arules en R. Ejemplo de una aplicación real votación de reglas en R. Ejemplo de una aplicación real a datos de ventas en supermercados en R. Instalación y uso del paquete en Python. Ejemplo en Python. Principales parámetros de ajuste y control. Esquema de votación de reglas en Python.

Redes Neuronales

Algoritmo básico en Excel. División en entrenamiento y prueba en R. Uso de neuralnet. Predicción y valoración de la solución en R. Discusión del problema de legibilidad de los resultados desde el negocio. Competencia entre árboles y redes en un caso concreto en R. Instalación y uso del paquete en Python. Ejemplo en Python. Principales parámetros de ajuste y control en Python. Problema concreto en Python.

Algoritmos genéticos

Algoritmo básico en Excel. Discusión del tipo de problemas en los que se aplica. Discusión de otros mecanismos de optimización. Implementación en R del uso de algoritmos genéticos. Valores reales. Binarios. Permutaciones. Implementación en Python.

Series temporales

Taxonomía. Separación de componentes. Predicciones. ARIMA implementado en R. Predicción en series con un único período. Predicción en series con múltiples períodos. Predicción en series con períodos variables: renormalización. Implementación en Python.

Método de Simulación de Montecarlo

Algoritmo básico en Excel. Discusión de la utilidad del método. Comparación con el análisis de escenarios. Ejemplo de una aplicación real. Ejemplo simple implementado en R. Ejemplo simple implementación en Python.

Minería de textos

Clasificación supervisada de piezas de texto. Construcción de una red semántica. Discusión de las posibilidades de reconocimiento de voz. Ejemplos de aplicación real del algoritmo de clasificación. Aplicación a la detección de sentimientos. Ejemplo de implementación en Python.

Vecinos Cercanos (Knn)

Instalación y uso del paquete en R. Ejemplo conceptual en Excel. Ejemplo en R. Instalación y uso del paquete en Python. Ejemplo en Python. Principales parámetros de ajuste y control.

Bayes Ingenuo

Implementación en Excel. Ejemplo de aplicación en R. Comparación de 4 algoritmos predictivos (Bayes ingenuo, árboles, redes neuronales y regression logística). Ejemplo de aplicación en Python.

Random Forest

Bootstrap y bagging. Descripción conceptual del método random forest. Paquete randomForest para R. Ejemplo de aplicación. Comparación con otras técnicas. Implementación en Python.

Métodos bayesianos avanzados

Descripción conceptual del método. Regresión lineal bayesiana. Regresión logística bayesiana. Inferencia bayesiana. Red bayesiana. Ejemplos de aplicación en R. Paquete BAS. Paquete brms. Paquete arm. Paquete bnlearnd. Comparación con otras técnicas. Ejemplos de aplicación en Python.

Máquina de soporte vectorial

Descripción conceptual del método. Paquete e1071 para R. Ejemplo de aplicación en R. Ejemplo de aplicación en Python. Comparación con otras técnicas.

Discriminante lineal y cuadrático

Instalación y uso del paquete. Ejemplo conceptual en Excel. Ejemplo en R. Ejemplo en Python. Principales parámetros de ajuste y control en R. Principales parámetros de ajuste y control en Python. Problema concreto.

Análisis de Fourier

Descripción conceptual. Ejemplo conceptual en Excel. Instalación y uso del paquete en R. Instalación y uso del paquete en Python. Ejemplo en R. Ejemplo en Python.

Herramientas geográficas

Distancias. Implementación en R. Paquete sf. Paquete nngeo. Aplicación práctica en R. Implementación en Python. Aplicación práctica en Python.

Bases de datos documentales

Instalación de MongoDB. Conexión a R. Conexión a Python. Aplicación práctica en R. Aplicación práctica en Python.

Diseño de Datawarehouses

Diferencias entre los DW y los OLTP. Tipos de datos y soportes. Dimensiones y jerarquías. Estimación de recursos y tiempos según tipos de datos. Ejemplos de staging. Interacción entre equipos (DB-ETL-Soporte-FrontEnd-Usuarios). Ejercicios de diseño de DW.

Diseño y construcción de ETL

Procesos ETL: generalidades, buenas prácticas, esquemas de ETL. Detalles de cada etapa: extracción, limpieza, normalización, transformación, carga. Estrategias de update. Ejercicios de diseño de ETL para la carga inicial. Ejercicios de diseño de ETL para la actualización. Licencia, descarga e instalación de Open Refine. Uso general como herramienta de limpieza de datos. Pre-procesado de los datos. Casos de interés y ejemplos. Licencias, descarga e instalación de Pentaho-Kettle. Pentaho Kettle: funciones, características, utilización. Auditoría y documentación. Ejemplos de uso.

Big Data

¿Qué es Big Data? ¿Cuándo usar Big Data? ¿Cómo armar una infraestructura para Hadoop? Ejemplo de una aplicación de Map Reduce: wordcount. Como evitar Hadoop.

Tutorías Proyecto Final

En esta etapa los estudiantes realizaran su proyecto final de cursada con tutoría docente. Pueden ver algunos proyectos finales de cursada de nuestros egresados en Nuestro Canal de YouTube.

Próximas cohortes 2026

Cada comisión está limitada a 20 estudiantes para preservar la dinámica de tutoría individual y los foros activos. Reservá tu vacante con tu inscripción.

11 de Mayo 2026

(Máximo 20 estudiantes, últimas vacantes)

Clases en vivo: Lunes 21:30 Horas, Martes 20:30 Horas, Miércoles 21:30 Horas y Jueves 20:30 Horas.

$999.000,00INSCRIBIRME AHORA

25 de Mayo 2026

(Máximo 20 estudiantes, últimas vacantes)

Clases en vivo: Clases en vivo: Lunes 19:00 Horas, Lunes 21:30 Horas, Martes y Jueves 19:00 Horas.

$999.000,00INSCRIBIRME AHORA

08 de Junio 2026

(Máximo 20 estudiantes, últimas vacantes)

Clases en vivo: Lunes 21:30 Horas, Martes 20:30 Horas, Miércoles 21:30 Horas y Jueves 20:30 Horas.

$999.000,00INSCRIBIRME AHORA

Tu mejor certificado es lo que vas a construir.

Cada egresado defiende un proyecto aplicado a un caso de negocio real, tutoriado por un docente especializado. Quedan publicados en YouTube y son la evidencia técnica que las empresas evalúan al momento de contratar.

Clasificación de Víctimas Fatales en Siniestros Viales con Machine Learning

Clasificación de Víctimas Fatales en Siniestros Viales con Machine Learning

Clasificación de Víctimas Fatales en Siniestros Viales con Machine Learning Proyecto Final de Santiago MuñozDiplomatura en Python orientado a Científico ...
Predicción del Nivel del Río Paraná

Predicción del Nivel del Río Paraná

Predicción del Nivel del Río Paraná: Inteligencia Artificial para la Gestión del Riesgo Hídrico Proyecto Final de Gabriel Alfredo Regali ...
Prediciendo el Hábitat Mosquito Aedes en Argentina

Prediciendo el Hábitat Mosquito Aedes en Argentina

Proyecto: Prediciendo el Hábitat Mosquito Aedes albopictus en Argentina Proyecto Final de Arturo A. LizuainDiplomatura en Python orientado a Científico ...
Predicción de la Severidad de Accidentes de Tránsito

Predicción de la Severidad de Accidentes de Tránsito para Optimización de Costos de Seguro

Proyecto: Predicción de la Severidad de Accidentes de Tránsito para Optimización de Costos de Seguro Proyecto Final de Gonzalo GuzziDiplomatura ...
Skincare

SkinRate.ai: Prediciendo Éxito en Skincare

Proyecto: SkinRate.ai: Prediciendo Éxito en Skincare con Python y Ciencia de Datos Proyecto Final de Valentina Andrea LoreficeDiplomatura de Python ...
Predicción de fuga de clientes de compañía de telecomunicaciones

Fuga de clientes en companía de Telecomunicaciones

Machine Learning aplicado a la retención de clientes: cómo un modelo predictivo puede reducir las pérdidas en más del 80% ...

Proyectos finales publicados desde 2018, accesibles en nuestro canal de YouTube y en el Laboratorio de Datos.

Profesionales activos en industria y academia.

Quienes te van a acompañar en la cursada combinan investigación, docencia universitaria y aplicación real de AI, Data Science y Data Analytics en empresas del sector privado y público.

Ignacio Urteaga Instituto Data Science Argentina

Ignacio Urteaga

Director del Programa

MBA en Dirección de Sistemas de Información. Físico, (Tesis en física nuclear) Investigador, Premiado en 2001 por sus trabajos en Ciencia de Datos. Más de 30 años de experiencia docente en Universidades y en la aplicación de Datos y BI como Director, Gerente o Consultor en el ámbito público y privado.

¿Quieres saber mas sobre Ignacio?

Anahí Romo Docentes Instituto Data Science

Anahí Romo

Docente

Licenciada en Ciencias Físicas de la Universidad de Buenos Aires. Maestría en gestión de la energía en la Universidad Nacional de Lanús. Maestría de energías renovables Universidad Nacional de Salta. Desarrolladora Python.

¿Quieres saber mas sobre Anahí?

Lo que dicen quienes ya pasaron por acá.

Preguntas Frecuentes

¿Qué es la ciencia de datos y por qué es importante aprenderla hoy?

La ciencia de datos es el campo que combina programación, estadística y análisis para transformar datos en decisiones. Es clave en sectores como salud, finanzas, marketing, gobierno y tecnología.

¿Cuál es la diferencia entre Data Analytics y Ciencia de Datos?

Data Analytics se centra en analizar datos históricos para generar insights y reportes. Ciencia de Datos incluye además modelos predictivos, machine learning y técnicas avanzadas, brindándote más herramientas para resolver problemas complejos.

¿Necesito experiencia en programación para estudiar Ciencia de Datos?

    No es necesario. Nuestra metodología está diseñada para principiantes. Comenzás aprendiendo Python y R desde cero, junto con fundamentos de estadísticas y análisis de datos, avanzando paso a paso hasta desarrollar proyectos reales.

¿Cuál es el roadmap para aprender Ciencia de Datos con R y Python?

El aprendizaje se organiza en 4 etapas:

  1. Nivelación: fundamentos de programación, estadística básica y manejo de datos.
  2. Introducción: análisis de datos, visualización y primeros modelos con R y Python.
  3. Especialización: machine learning, predicción y técnicas avanzadas de modelado.
  4. Proyecto final: aplicás todo lo aprendido en un proyecto guiado por nuestros docentes.

¿Qué proyectos de Ciencia de Datos puedo hacer durante la diplomatura?

Vas a desarrollar dashboards interactivos, análisis de series temporales, modelos predictivos y análisis exploratorio de datos, aplicando R y Python en casos reales que podrás incluir en tu portafolio profesional.
Podes ver los proyectos finales de algunos de nuestros egresados en Nuestro Canal de YouTube.

¿Qué herramientas y librerías voy a usar?

Trabajarás con RStudio, Python, Jupyter Notebook, Google Colab y GitHub. Entre las librerías: pandas, tidyverse, matplotlib, scikit-learn, entre otras.

¿Cuánto tiempo lleva aprender Ciencia de Datos con R y Python?

La diplomatura dura 8 meses. Se recomienda dedicar entre 6 y 8 horas semanales entre clases y práctica. La cursada se divide en etapas, las distintas etapas van reiniciando de forma constante, para que también puedas ir realizando cada etapa a tu ritmo aprovechando las clases en vivo.

¿Es necesario saber inglés para aprender Ciencia de Datos?

No es obligatorio. Todos los contenidos están en español, incluyendo videos, notebooks y tutorías del proyecto final. Conocer inglés puede ayudar a explorar documentación y recursos avanzados, pero no es un requisito para completar la diplomatura.

¿Qué salidas laborales ofrece esta diplomatura?

Podés trabajar como Data Scientist, Analista de Datos, Business Intelligence Analyst o aplicar los conocimientos en tu sector actual para tomar decisiones basadas en datos.

¿Qué certificación obtengo al finalizar?

A lo largo del cursado, vas a aplicar lo aprendido mediante ejercicios prácticos, actividades integradoras y foros. Al finalizar, deberás presentar un proyecto final integrador y rendir un examen teórico, que requiere al menos un 60% de respuestas correctas para aprobar.

Al aprobar el programa, recibirás una certificación académica avalada por la Universidad Tecnológica Nacional (UTN) y el Instituto Data Science.

¿Cómo puedo inscribirme y qué formas de pago están disponibles?

Haz clic en inscribirse ahora y completa tus datos o escribinos por WhatsApp: +541139148021 o Mail: info@institutodatascience.org. Nuestro equipo te va a asesorar personalmente.

$999.000,00INSCRIBIRME AHORA

Instituto Data Science Formas de pago

6 cuotas sin interés tarjetas de crédito Visa, Mastercard y Amex emitidas por entidades bancarias.
20% Off en un pago por transferencia bancaria.
Comunidad de egresados del Instituto Data Science Argentina, 10% de descuento adicional.

$999.000,00INSCRIBIRME AHORA

Podes inscribirte desde toda latinoamérica
Artículo añadido al carrito.
0 artículos - $0,00