Predicción de Precios de Inmuebles en Plataforma Inmobiliaria | Instituto Data Science Argentina

🔥 Cyber Week: 12 cuotas sin interés con todos los medios de pago | 20% de descuento en 1 pago por transferencia. Con tu inscripción te incluimos GRATIS el Curso Experto en Power BI 🔥

Proyecto Final de Guillermo Herrera
Diplomatura en Ciencia de Datos con R y Python

En el contexto actual del mercado inmobiliario, la tecnología aplicada a los datos se ha convertido en una poderosa aliada para tomar decisiones más precisas. En este artículo exploramos el proyecto “Predicción de Precios de Inmuebles en Plataforma Inmobiliaria”, desarrollado por Guillermo Herrera como parte de la Diplomatura en Ciencia de Datos del Instituto Data Science Argentina.

El objetivo principal fue predecir el precio de mercado de propiedades publicadas en plataformas de bienes raíces, aplicando diferentes modelos de Machine Learning y evaluando su desempeño para identificar oportunidades de inversión rentables.

Objetivo del Proyecto

El propósito del modelo fue predecir con precisión el precio real de una propiedad en base a sus características —como superficie cubierta, número de baños, estado, antigüedad y ubicación geográfica—.
Con esta información, la plataforma inmobiliaria puede comparar el precio predicho con el publicado y así determinar si existe una posible oportunidad de negocio para los inversores o clientes suscriptos al servicio.

Preparación y Análisis de Datos

El proyecto comenzó con un proceso exhaustivo de limpieza y transformación de datos, eliminando columnas redundantes y valores nulos. Además, se transformaron variables categóricas en valores numéricos para facilitar el procesamiento de los modelos de Machine Learning.

Durante el análisis exploratorio de datos (EDA) se identificaron las variables más relevantes, destacándose la superficie cubierta y el número de baños como las características con mayor correlación con el precio.

Un histograma de precios permitió visualizar la distribución de valores promedio en la ciudad de San Juan, observando que la mayoría de las propiedades se concentraban entre USD 50.000 y USD 155.000.

Modelos de Machine Learning Aplicados

Para lograr una predicción precisa, Guillermo implementó tres modelos distintos:

  1. Regresión Lineal (Scikit-Learn):
    Modelo base que permitió comprender la relación directa entre las variables y el precio.
  2. Regresión Lineal (StatsModels):
    Aportó métricas estadísticas adicionales, como los p-values, que confirmaron las variables más influyentes en el precio de mercado.
  3. Árbol de Decisión y Random Forest:
    Modelos más complejos que buscaron mejorar la precisión y reducir el error, aunque en este caso la Regresión Lineal se destacó como la mejor alternativa.

Comparativa de Resultados

Los modelos fueron evaluados mediante métricas de rendimiento y gráficos comparativos.
Los resultados mostraron que el modelo de Regresión Lineal obtuvo el mejor desempeño, con un coeficiente de determinación (R²) de 0,86, lo que significa que explica el 85% de la variabilidad de los precios de las propiedades analizadas.

Esto se traduce en un 75% de predicciones confiables o aceptables, cumpliendo y superando el requisito del cliente, quien esperaba una precisión del 70%.

Aplicación en Escenarios de Negocio

Una de las partes más innovadoras del proyecto fue la simulación de escenarios de inversión.
Guillermo diseñó variables de negocio como el umbral de oportunidad (margen de diferencia entre precio publicado y predicho) y la rentabilidad esperada, para estimar el retorno potencial de cada propiedad.

Incluso desarrolló una aplicación interactiva en Python, que permite al usuario ingresar las características del inmueble y obtener una recomendación automática sobre si “conviene invertir” o no, en función de los resultados del modelo.

Conclusiones y Oportunidades de Mejora

El modelo de predicción de precios de inmuebles en plataforma inmobiliaria demostró un alto nivel de confiabilidad, logrando identificar propiedades con rentabilidades promedio del 10 al 12%.
Además, sentó las bases para automatizar la detección de oportunidades de compra y optimizar recursos financieros en el sector.

Como oportunidad de mejora, se destacó la necesidad de refinar las variables de ubicación, que no tuvieron el peso esperado en la predicción. Esta observación abre la puerta a futuras versiones del modelo con mayor precisión geográfica.

Reflexión Final

La combinación entre Ciencia de Datos y el mercado inmobiliario está transformando la forma en que se analizan y valoran los inmuebles.
Gracias a proyectos como el de Guillermo Herrera, la predicción de precios de inmuebles en plataformas inmobiliarias se posiciona como una herramienta clave para los inversores que buscan maximizar rentabilidad y minimizar riesgos.

Si te interesa aprender más sobre Ciencia de Datos y proyectos aplicados con Python y R 👇👇

Artículo añadido al carrito.
0 artículos - $0,00