Experto en Minería de Textos con R

Duración: 4 semanas

Carga horaria: 40 horas

Plan de Estudios de Experto en Minería de Texto con R

Objetivos:

La minería de textos es el proceso de analizar información que por medio de la identificación de patrones o correlaciones entre los términos. Lo que permite encontrar información que no está explícita dentro del texto.
La minería de textos tiene muchas aplicaciones. Se usa para obtener información que de otro modo sería muy difícil encontrar y tomar decisiones. Por ejemplo responder a consultas de los clientes, prevenir delitos que se hacen en línea y contra el fraude virtual, indexación de banco de datos, filtrar información no importante, filtrar spam, etc.

Modalidad:

  • Clases teóricas en vivo: 1 x semana
  • Clases prácticas en vivo: 1 x semana
  • Material teórico para estudiar
  • Ejercicios resueltos
  • Corrección de ejercicios
  • Autoevaluaciones

Programa analítico

Unidad 1: Construcción de un Corpus

  • Carga de documentos desde una carpeta
  • Carga de documentos desde un archivo csv
  • Carga de documentos desde la web

Unidad 2: Limpieza de datos

  • Eliminación de la puntuación
  • Eliminación de caracteres especiales
  • Eliminación de números
  • Eliminación de palabras vacías (StopWords)

Unidad 3: Análisis no supervisado

  • Construcción de la matriz de palabras por documentos
  • Construcción de la matriz de frecuencias por documentos
  • Dibujo de la nube de palabras
  • Aplicación de k-means a la clasificación de documentos
  • Optimización de la cantidad de clusters

Unidad 4: Análisis supervisado

  • Aplicación de árboles de decisión a la clasificación de documentos
  • Aplicación de Bayes ingenuo a la clasificación de documentos
  • Aplicación de regresión logística a la clasificación de documentos
  • Aplicación de máquinas de soporte vectorial a la clasificación de documentos
  • Análisis de sentimientos

Equipo Docente