fbpx

Experto en Minería de Textos

Certificado en Experto en Minería de Textos con Python

La calidad académica del curso Experto en Minería de Textos con Python ha sido avalada por la Resolución Nro 290/20 de la Universidad Tecnológica Nacional UTN FRRQ.

Duración: 4 semanas – 2 clases en vivo por semana – Carga horaria: 40 Horas.

$28.800,00INSCRIBIRME AHORA

Fechas de Inicio – Plan de Estudio – Formas de pago – Equipo Docente

¿Qué vas a aprender con nuestro Certificado en Minería de Textos con Python?

La minería de textos es el proceso de analizar información por medio de la identificación de patrones o correlaciones entre los términos. Lo que permite encontrar información que no está explícita dentro del texto.

El curso experto en Minería de Texto con Python fue pensado para ofrecer los conocimientos y herramientas necesarias para poder aplicar efectivamente esta disciplina en el mundo real.

Las posibilidades que ofrece esta disciplina son realmente amplias por ejemplo te mencionaremos algunos de los trabajos en la siguiente lista: Traducción Asistida/Automática, Reconocimiento de habla, Corrección ortográfica, Detección de tópicos, Generación automática de resúmenes, Extracción de información, Sentiment Analysis, Chatbots, Etc

 Clases en vivo

Todas las clases en vivo quedan grabadas a disposición de los estudiantes y no se exige asistencia. También dispones de clases de ediciones anteriores.

 Aprende haciendo

Un fuerte componente práctico orientado a proyectos para que aprendas haciendo. Al final de la cursada presentas tu propio proyecto.

Consultas online

Participa en el grupo de WhatsApp para realizar tus consultas fuera del horario de clases. Se coordinan videollamadas para atender consultas especificas.


Fechas de inicio del curso Experto en Minería de Texto con Python para nuevos estudiantes

Horarios de cursada

Lunes y Miércoles 20 horas (GTM-3)


Promociones y formas de pago para acceder al curso

En Argentina puedes abonar en 6 cuotas sin interés con tarjeta de crédito.

6 cuotas sin interés

También puedes abonar tu diplomatura en un pago por Transferencia Bancaria, Rapipago, PagoFácil o Tarjeta de Debito.

$28.800,00INSCRIBIRME AHORA

El valor del curso abonando desde el exterior de Argentina es de $259 Dólares. Consulta con nuestros asesores las formas de pago disponibles en tu país.

Alumnos del exterior de argentina

Plan de estudios del certificado Experto en Minería de Textos con Python

La duración de cada clase es de 30 a 60 minutos dependiendo del tema, la cantidad de participantes y el nivel de intervenciones conseguido.

Los grupos de participantes son reducidos y de varios países hispanoparlantes. Lo que aporta diferentes visiones y la posibilidad de networking internacional.

Soporte docente por Grupo de WhatsApp, email y foro.

El entrenamiento tiene un componente teórico de los conocimientos para que comprendas el por qué se hace lo que se hace.

El estudiante tiene actividad complementaria con material de soporte de las clases, material teórico para estudiar, ejercicios resueltos y para resolver. Se realiza corrección de ejercicios y autoevaluaciones.

Pre-requisitos del curso

El nivel de programación con el que el estudiante cuente no es un impedimento en el momento de considerar el curso.

La idea es comenzar desde lo más básico e ir acompañándolos con ejemplos prácticos para que puedan ir avanzando a su ritmo y llegar al final con los conocimientos buscados.

Programa analítico del Certificado en Experto en Minería de Textos con Python

Unidad 1: Introducción a la minería de textos y al Procesamiento de Lenguaje Natural (PLN) 

  • ¿Por qué Python?. 
  • Minería de Textos y PLN. 
  • Recursos y herramientas del Text Mining para textos en español. 
  • Ejemplos de aplicación de Text Mining en el ámbito empresarial y académico.
  • Librerías para el manejo de textos en Python. 
  • Funciones básicas de procesamiento de texto en Python. 

Unidad 2: Creación de un corpus

  • El concepto del corpus en PLN. 
  • Consolidación de un corpus a partir de archivos locales. 
  • Conceptos de HTML y CSS. 
  • Librerías de Web Scraping en Python. 
  • Ejemplo de aplicación de Web Scraping en Python. 
  • Conexión a APIs.
  • Ejemplo de aplicación de armado de corpus desde API de Twitter.

Unidad 3: Limpieza y preparación del corpus

  • Importancia del preprocesamiento del texto. 
  • Tokenizadores, N-Gramas y Stop Words. 
  • Etiquetadores de partes de la oración (POS taggers). 
  • Corpus Lingüísticos. 
  • Lematización y stemming.
  • Ejemplos de aplicación en Python.

Unidad 4: Expresiones regulares

  •  Definición y uso de las Expresiones Regulares. 
  • Componentes de las Expresiones Regulares. 
  • Expresiones Regulares en Python. 
  • Práctica de aplicación en casos reales. 

Unidad 5: Clasificación automática de textos

  •  Vectorización de textos. 
  • Algoritmo Tf-idf. 
  • Algoritmo de clasificación Bayesiano.
  • Implementación en Python.
  • Ejemplo de aplicación: clasificación de sentimiento de opiniones de usuarios.

Unidad 6: Identificación automática de tópicos

  • Nociones de clasificación no supervisada. 
  • Modelado de tópicos. 
  • Algoritmo BoW y creación de Nube de Palabras. 
  • Implementación del algoritmo LDA para textos en español.
  • Ejemplo de aplicación: identificación de tópicos en críticas de películas.

Recursos ofrecidos

  • Clases teóricas en vivo: 1 x semana
  • Clases prácticas en vivo: 1 x semana
  • Material teórico para estudiar
  • Ejercicios resueltos
  • Corrección de ejercicios
  • Autoevaluaciones

Cronograma de la cursada

Lunes y Miércoles 20.00 Horas

Bibliografía

Bird, Steven, Ewan Klein y Edward Loper (2009). Natural language processing with Python: analyzing text with the natural language toolkit. California: O’Reilly Media.

Clark, Alexander (2003, March). Pre-processing very noisy text. In Proc. of Workshop on Shallow Processing of Large Corpora (pp. 12-22).

Clark, Eleanor y Kenji Araki (2011). Text normalization in social media: progress, problems and applications for a pre-processing system of casual English. Procedia-Social and Behavioral Sciences, 27, 2-11.

Downey, Allen (2012). Think Python. Massachusetts: Green Tea Press.

Jurafsky, Daniel y Christopher Martin (2000) Capítulo 2 “Regular expressions and automata”. Speech and language processing. New Jersey: Prentice-Hall, 21-56.

Manning, Christopher y Hinrich Schütze (1999). Foundations of Statistical Natural Language Processing. Cambridge/Massachusetts: The MIT Press.

Moreno Sandoval, Antonio (1998). Introducción a la lingüística computacional. Introducción a los modelos simbólicos, estadísticos y biológicos. Madrid: Síntesis.

Russell, Stuart J. y Peter Norvig (1995). Capítulo 23: “Practical Natural Language Processing”. Artificial Intelligence: a modern approach. New Jersey: Prentice Hall.

Watt, Andrew (2005). Beginning Regular Expressions. Indianapolis: Wiley Publishing.


Equipo docente del Certificado Experto en Minería de Textos con Python

Jerónimo Pardo docente Instituto Data Science Argentina
JERÓNIMO PARDO

Item added to cart.
0 items - $0,00
Abrir chat
¿Necesitas asesoramiento?
¿Dudas? Consulta por WhatsApp