Uso de cookies

Este sitio web solo utiliza cookies técnicas propias obligatorias con la finalidad de hacer que su navegación sea segura.
Asimismo, utiliza cookies de terceros opcionales para hacer análisis estadístico de las visitas a la web y conocer su usabilidad.
Si desea más información o cambiar la configuración de su navegador, puede visitar nuestra Política de Cookies.
Pulse el botón "Rechazar cookies opcionales" o "Aceptar todas las cookies" para confirmar que ha leído y aceptado la información aquí presentada.

Volver
La influencia de la zona en el precio de una casa
Analizando datos de portales inmobiliarios y redes sociales de localización es posible estudiar el impacto de la oferta comercial y de servicios de una zona en el precio de las viviendas situadas allí. En siete ciudades españolas, el precio por metro cuadrado de una zona depende fuertemente de la oferta de restaurantes, oficinas, tiendas y posibilidades de ocio. Y menos del acceso a transporte, colegios o parques.

"¿A qué distancia está el supermercado? ¿y el metro/autobús?" son preguntas frecuentes a la hora de buscar una casa. Evidentemente el precio de una vivienda depende fundamentalmente de las características de la vivienda, pero ¿cuánto y cómo influyen los servicios (ocio, educación, transporte, salud, etc.) alrededor de la vivienda en el precio? La respuesta a esta pregunta no solo tiene aplicaciones en el sector inmobiliario, sino también para entender cómo se organizan nuestras ciudades y qué factores contribuyen a un mejor desarrollo social y económico de los barrios.

El uso de grandes bases de datos (big data) de ofertas, ventas y de la estructura comercial y de servicios de las ciudades ha permitido conocer mejor este efecto de la zona en el precio de la vivienda. Por ejemplo, en el Reino Unido el precio de una vivienda puede variar 45.000£ (unos 60.000¿) dependiendo del tipo de supermercado que tengamos más cerca o hasta 35.000$ más si tiene un Starbucks cerca en Estados Unidos.

En Afi Analytics, hemos explotado fuentes abiertas de datos y nuestra experiencia en modelización estadística para responder de manera analítica y cuantitativa a estas cuestiones. Para ello hemos estudiado la relación entre el precio por m2 en diferentes zonas (celdas cuadradas de 500×500 metros) de 7 ciudades en España y la composición comercial y de servicios de dichas zonas. Los datos se han recogido respectivamente de las APIs públicas del portal inmobiliario Idealista.com y de la red social de localización Foursquare.com. A partir de las categorías definidas por Foursquare hemos construido una clasificación propia para extraer la oferta de ocio, tiendas, restaurantes, instalaciones, lugares, etc. que hay en dichas zonas. La siguiente figura muestra la disposición de dichas celdas en Madrid y Barcelona y la oferta absoluta (y relativa) de cada una de las categorías de servicios [pincha en cada celdas para conocer la oferta de esa celda].





Para conocer la influencia de los diferentes servicios en una zona, hemos construido un modelo (con técnicas de aprendizaje automático) que predice el precio medio por m2 en dicha zona en función del número de lugares que existen en cada categoría de servicios. Nuestro modelo tiene un poder predictivo del 60% lo que nos indica que el efecto de la zona en el precio de la casa es muy fuerte, si bien hay un alto porcentaje del precio que depende de otros factores, probablemente de la tipología y estado de las propiedades, antigüedad de las mismas, u otros factores.

En términos generales, el precio por m2 en las ciudades depende fuertemente de la oferta de tiendas (con una importancia en nuestro modelo del 23% de media), restauración (19%), lugares de trabajo (oficinas, 11%) y de las posibilidades de ocio (15%). En menor medida el precio depende también del transporte (un 6%), de las instalaciones educativas (5%), de las áreas al aire libre (4%) y de las cafeterías (4%). Este patrón es básicamente el mismo para todas las ciudades analizadas (véase la figura), con pequeñas diferencias sobre todo en la influencia de centros espirituales en Sevilla (1%) y Málaga (1%) o la proximidad a el puerto o la playa en Barcelona, Valencia o Málaga (con un 0.3% de peso). Por ejemplo, en Madrid vemos que en aquellas zonas con más de 23 tiendas (la media en Madrid) el precio por m2 promedio es de 3.200¿ mientras que si hay menos de 23 tiendas el precio baja hasta 2.400¿ (en media) lo cual puede suponer una diferencia de 80.000¿ en el precio de una vivienda tipo de 100m2.


Importancia relativa de la diferente oferta de servicios, lugares, restauración y ocio en el modelo de precio por m2.


Es interesante que lo que más define una zona de viviendas caras en las 7 ciudades analizadas sea lo mismo: la mayor oferta de tiendas, restaurantes, oficinas y ocio. Mientras que ciertas características de la zona como el acceso al transporte, a colegios o parques (aire libre) tengan menos importancia en determinar el precio por m2 en una zona. Quizás porque estos últimos son servicios presentes en todas las zonas de las ciudades estudiadas.

Más allá de los resultados, nuestro estudio demuestra cómo es posible combinar fuentes de datos abiertas (y no convencionales) para comprender mejor problemas financieros con aplicaciones no solo en el sector inmobiliario, de geomarketing o inversor. Sino también por ejemplo para entender cómo la actividad económica se organiza en nuestras ciudades y planificar mejor el desarrollo de nuevas áreas y recuperación de antiguas zonas de una ciudad.

Nota técnica del estudio:


El estudio se ha realizado en 7 ciudades españolas: Madrid, Barcelona, Sevilla, Valencia, Málaga, Palma de Mallorca y Zaragoza. Para ello se ha accedido a la información de 233.000 "venues" en Foursquare y 95.000 ofertas de venta en Idealista en dichas ciudades durante los meses de Mayo y Junio de 2015 (respectivamente). Debido a la heterogeneidad de la clasificación de "venues" de Foursquare, hemos agrupado las categorías de Foursquare en 23 categorías (Afi) correspondientes a 4 conceptos generales:

  • Servicios: Tiendas, Transporte, Educación, Salud, Bancos, Hoteles, Oficina de Correos, Aparcamiento, Gasolineras.
  • Ocio: Ocio general, Lugar al aire libre y Arte.
  • Restauración: Restaurante, Cafetería, Panadería y Pastelería.
  • Lugares: Lugar de negocios (Oficinas), Centro espiritual, Fabrica, Cementerio, Playa y Puerto.

El modelo utilizado es un random forest que ha sido entrenado con el precio por m2 en una zona utilizando el número de "venues" de cada una de las 23 categorías en esa zona. Para el entrenamiento se han utilizado el 80% de las ofertas de venta de cada una de las zonas en una ciudad y el resto se han utilizado para validar el modelo. La precisión del modelo (calculada como el R-cuadrado ajustado) es en media del 60.41% pero hay diferencias entre las ciudades: mientras que en Madrid sube hasta el 73% en Zaragoza es tan solo del 43%. La importancia de cada una de las categorías en el modelo se estima a partir del porcentaje relativo en el que aumenta el error del modelo si se excluye dicha categoría (variable importance).
Comparte esta entrada