🔥 ¡Potencia tu carrera! | En Noviembre con tu inscripción te incluimos GRATIS el Curso Experto en Power BI 🔥

Experto en Minería de Textos

La minería de texto es una habilidad valiosa en la era digital actual, donde se generan y almacenan grandes cantidades de datos no estructurados, como comentarios en redes sociales, correos electrónicos, artículos de noticias y mensajes de chat.

Aprender minería de texto te permite extraer información valiosa de estos datos y utilizarla para tomar decisiones informadas en una variedad de campos, como el marketing, los negocios, la investigación y la atención al cliente.

En el curso Experto en Minería de Texto con Python aprenderás los conocimientos y herramientas necesarias para poder aplicar efectivamente esta disciplina en el mundo real.

Modalidad: Online

Clases interactivas en vivo

Duración: 4 semanas

2 clases en vivo por semana

La calidad académica de nuestro curso Experto en Minería de texto ha sido avalada por la Universidad Tecnológica Nacional UTN FRRq.

Consultar a info@institutodatascience.org por capacitaciones InCompany

Fechas de Inicio – Plan de Estudio – Equipo Docente

Las posibilidades que ofrece esta disciplina son realmente amplias por ejemplo te mencionaremos algunos de los trabajos en la siguiente lista: Traducción Asistida/Automática, Reconocimiento de habla, Corrección ortográfica, Detección de tópicos, Generación automática de resúmenes, Extracción de información, Sentiment Analysis, Chatbots, Etc

 Clases en vivo

Todas las clases en vivo quedan grabadas a disposición de los estudiantes y no se exige asistencia. También dispones de clases de ediciones anteriores.

 Aprende haciendo

Un fuerte componente práctico orientado a proyectos para que aprendas haciendo. Al final de la cursada presentas tu propio proyecto.

Consultas online

Participa en el grupo de WhatsApp para realizar tus consultas fuera del horario de clases. Se coordinan videollamadas para atender consultas especificas.


Plan de estudios del certificado Experto en Minería de Textos con Python

La duración de cada clase es de 30 a 60 minutos dependiendo del tema, la cantidad de participantes y el nivel de intervenciones conseguido.

Los grupos de participantes son reducidos y de varios países hispanoparlantes. Lo que aporta diferentes visiones y la posibilidad de networking internacional.

Soporte docente por Grupo de Telegram, email y foro.

El entrenamiento tiene un componente teórico de los conocimientos para que comprendas el por qué se hace lo que se hace.

El estudiante tiene actividad complementaria con material de soporte de las clases, material teórico para estudiar, ejercicios resueltos y para resolver. Se realiza corrección de ejercicios y autoevaluaciones.

Pre-requisitos del curso

El nivel de programación con el que el estudiante cuente no es un impedimento en el momento de considerar el curso.

La idea es comenzar desde lo más básico e ir acompañándolos con ejemplos prácticos para que puedan ir avanzando a su ritmo y llegar al final con los conocimientos buscados.

Programa analítico del Certificado en Experto en Minería de Textos con Python

Unidad 1: Introducción a la minería de textos y al Procesamiento de Lenguaje Natural (PLN) 

  • ¿Por qué Python?. 
  • Minería de Textos y PLN. 
  • Recursos y herramientas del Text Mining para textos en español. 
  • Ejemplos de aplicación de Text Mining en el ámbito empresarial y académico.
  • Librerías para el manejo de textos en Python. 
  • Funciones básicas de procesamiento de texto en Python. 

Unidad 2: Creación de un corpus

  • El concepto del corpus en PLN. 
  • Consolidación de un corpus a partir de archivos locales. 
  • Conceptos de HTML y CSS. 
  • Librerías de Web Scraping en Python. 
  • Ejemplo de aplicación de Web Scraping en Python. 
  • Conexión a APIs.
  • Ejemplo de aplicación de armado de corpus desde API de Twitter.

Unidad 3: Limpieza y preparación del corpus

  • Importancia del preprocesamiento del texto. 
  • Tokenizadores, N-Gramas y Stop Words. 
  • Etiquetadores de partes de la oración (POS taggers). 
  • Corpus Lingüísticos. 
  • Lematización y stemming.
  • Ejemplos de aplicación en Python.

Unidad 4: Expresiones regulares

  •  Definición y uso de las Expresiones Regulares. 
  • Componentes de las Expresiones Regulares. 
  • Expresiones Regulares en Python. 
  • Práctica de aplicación en casos reales. 

Unidad 5: Clasificación automática de textos

  •  Vectorización de textos. 
  • Algoritmo Tf-idf. 
  • Algoritmo de clasificación Bayesiano.
  • Implementación en Python.
  • Ejemplo de aplicación: clasificación de sentimiento de opiniones de usuarios.

Unidad 6: Identificación automática de tópicos

  • Nociones de clasificación no supervisada. 
  • Modelado de tópicos. 
  • Algoritmo BoW y creación de Nube de Palabras. 
  • Implementación del algoritmo LDA para textos en español.
  • Ejemplo de aplicación: identificación de tópicos en críticas de películas.

Recursos ofrecidos

  • Clases teóricas en vivo: 1 x semana
  • Clases prácticas en vivo: 1 x semana
  • Material teórico para estudiar
  • Ejercicios resueltos
  • Corrección de ejercicios
  • Autoevaluaciones

Horarios de cursada

Lunes y Viernes 19 horas (GTM-3)

Bibliografía

Bird, Steven, Ewan Klein y Edward Loper (2009). Natural language processing with Python: analyzing text with the natural language toolkit. California: O’Reilly Media.

Clark, Alexander (2003, March). Pre-processing very noisy text. In Proc. of Workshop on Shallow Processing of Large Corpora (pp. 12-22).

Clark, Eleanor y Kenji Araki (2011). Text normalization in social media: progress, problems and applications for a pre-processing system of casual English. Procedia-Social and Behavioral Sciences, 27, 2-11.

Downey, Allen (2012). Think Python. Massachusetts: Green Tea Press.

Jurafsky, Daniel y Christopher Martin (2000) Capítulo 2 «Regular expressions and automata». Speech and language processing. New Jersey: Prentice-Hall, 21-56.

Manning, Christopher y Hinrich Schütze (1999). Foundations of Statistical Natural Language Processing. Cambridge/Massachusetts: The MIT Press.

Moreno Sandoval, Antonio (1998). Introducción a la lingüística computacional. Introducción a los modelos simbólicos, estadísticos y biológicos. Madrid: Síntesis.

Russell, Stuart J. y Peter Norvig (1995). Capítulo 23: “Practical Natural Language Processing”. Artificial Intelligence: a modern approach. New Jersey: Prentice Hall.

Watt, Andrew (2005). Beginning Regular Expressions. Indianapolis: Wiley Publishing.


Equipo docente del Certificado Experto en Minería de Textos con Python

Jerónimo Pardo docente Instituto Data Science Argentina
JERÓNIMO PARDO

Artículo añadido al carrito.
0 artículos - $0,00
Abrir chat
1
¿Alguna consulta? Estamos online.
Escanea el código
¿Dudas? Consulta por WhatsApp