Mass appraisal of land values using random forest with spatial restriction

Autores
Córdoba, Mariano Augusto; Monzani, Federico; Carranza, Juan Pablo; Piumetto, Mario Andrés; Balzarini, Mónica Graciela
Año de publicación
2020
Idioma
inglés
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
Ponencia presentada en 30th International Biometric Conference (IBC 2020). Modalidad Virtual, 6 de Julio al 30 de Agosto 2020
Fil: Córdoba, Mariano Augusto. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina.
Fil: Córdoba, Mariano Augusto. Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET). Centro Científico Tecnológico (CCT Córdoba). Unidad de Fitopatología y Modelización Agrícola; Argentina.
Fil: Córdoba, Mariano Augusto. Instituto Nacional de Tecnología Agropecuaria (INTA). Unidad de Fitopatología y Modelización Agrícola; Argentina.
Fil: Monzani, Federico. Gobierno de la Provincia de Córdoba. Ministerio de Finanzas. Secretaría de Ingresos Públicos. Infraestructura de Datos Espaciales de la Provincia de Córdoba (IDECOR); Argentina.
Fil: Carranza, Juan Pablo. Universidad Nacional de Córdoba. Facultad de Ciencias Sociales. Instituto de Investigación y Formación en Administración Pública (IIFAP); Argentina.
Fil: Carranza, Juan Pablo. Gobierno de la Provincia de Córdoba. Ministerio de Finanzas. Secretaría de Ingresos Públicos. Infraestructura de Datos Espaciales de la Provincia de Córdoba (IDECOR); Argentina.
Fil: Piumetto, Mario Andrés. Universidad Nacional de Córdoba. Facultad de Ciencias Exactas, Físicas y Naturales. Centro de Estudios Territoriales (CET); Argentina.
Fil: Piumetto, Mario Andrés. Gobierno de la Provincia de Córdoba. Ministerio de Finanzas. Secretaría de Ingresos Públicos. Infraestructura de Datos Espaciales de la Provincia de Córdoba (IDECOR); Argentina.
Fil: Balzarini, Mónica Graciela. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina.
Fil: Balzarini, Mónica Graciela. Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET). Centro Científico Tecnológico (CCT Córdoba); Argentina.
The advancement of computational software and machine learning practice has facilitated enhanced uptake of mass appraisal methodologies for price modelling and prediction of land value. Since the characteristics of properties are geographically distributed, spatial autocorrelation computing could improve models to explain property prices. Different types of Random Forest models (RF), the classical one and quantile RF (QRF), were recognized as machine learning technique for real estate mass appraisal. However, a major drawback of this method is that they ignore influences of neighboring observed data when predicting the price properties. In order to overcome the disadvantage, random forest plus kriging of residuals (RFKO) method can be used. Initially, a RF of land values using predictive ancillary variables is carried out in order to model the trend component. In the second step, ordinary kriging is applied to the residuals of RF and a spatial prediction of the residuals is created. The final prediction is an additive combination of both model steps. The aim of this study was to compare performances of RF and quantile QRF both with and without spatial restriction in the prediction of rural and urban land values. We use two datasets of 3718 and 264 market data, released between 2017 and 2018. The first contains data of rural land value for the whole Province of Córdoba, Argentina, and the second one involves data coming from a village (Villa María) in the Province of Córdoba. A 10-fold cross validation was used to estimate prediction errors for each model. The root mean square prediction error was expressed as percentage of the mean yield (RMSE). Additionally, we fit an empirical a theoretical semivariogram to characterize the Relative Structured Variability (RSV, ratio of nugget and sill variance) of the residual from the compared methods. The results showed that only in the urban land the methods that incorporate spatial information performed better, RMSE of 30% vs. 34% for RF and 33% vs. 34% for QRF with and without kriging of the residuals, respectively.
Fil: Córdoba, Mariano Augusto. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina.
Fil: Córdoba, Mariano Augusto. Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET). Centro Científico Tecnológico (CCT Córdoba). Unidad de Fitopatología y Modelización Agrícola; Argentina.
Fil: Córdoba, Mariano Augusto. Instituto Nacional de Tecnología Agropecuaria (INTA). Unidad de Fitopatología y Modelización Agrícola; Argentina.
Fil: Monzani, Federico. Gobierno de la Provincia de Córdoba. Ministerio de Finanzas. Secretaría de Ingresos Públicos. Infraestructura de Datos Espaciales de la Provincia de Córdoba (IDECOR); Argentina.
Fil: Carranza, Juan Pablo. Universidad Nacional de Córdoba. Facultad de Ciencias Sociales. Instituto de Investigación y Formación en Administración Pública (IIFAP); Argentina.
Fil: Carranza, Juan Pablo. Gobierno de la Provincia de Córdoba. Ministerio de Finanzas. Secretaría de Ingresos Públicos. Infraestructura de Datos Espaciales de la Provincia de Córdoba (IDECOR); Argentina.
Fil: Piumetto, Mario Andrés. Universidad Nacional de Córdoba. Facultad de Ciencias Exactas, Físicas y Naturales. Centro de Estudios Territoriales (CET); Argentina.
Fil: Piumetto, Mario Andrés. Gobierno de la Provincia de Córdoba. Ministerio de Finanzas. Secretaría de Ingresos Públicos. Infraestructura de Datos Espaciales de la Provincia de Córdoba (IDECOR); Argentina.
Fil: Balzarini, Mónica Graciela. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina.
Fil: Balzarini, Mónica Graciela. Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET). Centro Científico Tecnológico (CCT Córdoba); Argentina.
Fuente
IBC 2020 Poster Session Abstracts
https://higherlogicdownload.s3.amazonaws.com/BIOMETRICSOCIETY/713ac962-588b-42d5-940f-47ae32f0b28c/UploadedImages/Accepted_Poster_Abstracts.pdf
Materia
Valuación de la tierra
Propiedad
Nivel de accesibilidad
acceso abierto
Condiciones de uso
Repositorio
Repositorio Digital Universitario (UNC)
Institución
Universidad Nacional de Córdoba
OAI Identificador
oai:rdu.unc.edu.ar:11086/28950

id RDUUNC_0fb4c3727e9d2a7450ad5796ae3913ea
oai_identifier_str oai:rdu.unc.edu.ar:11086/28950
network_acronym_str RDUUNC
repository_id_str 2572
network_name_str Repositorio Digital Universitario (UNC)
spelling Mass appraisal of land values using random forest with spatial restrictionCórdoba, Mariano AugustoMonzani, FedericoCarranza, Juan PabloPiumetto, Mario AndrésBalzarini, Mónica GracielaValuación de la tierraPropiedadPonencia presentada en 30th International Biometric Conference (IBC 2020). Modalidad Virtual, 6 de Julio al 30 de Agosto 2020Fil: Córdoba, Mariano Augusto. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina.Fil: Córdoba, Mariano Augusto. Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET). Centro Científico Tecnológico (CCT Córdoba). Unidad de Fitopatología y Modelización Agrícola; Argentina.Fil: Córdoba, Mariano Augusto. Instituto Nacional de Tecnología Agropecuaria (INTA). Unidad de Fitopatología y Modelización Agrícola; Argentina.Fil: Monzani, Federico. Gobierno de la Provincia de Córdoba. Ministerio de Finanzas. Secretaría de Ingresos Públicos. Infraestructura de Datos Espaciales de la Provincia de Córdoba (IDECOR); Argentina.Fil: Carranza, Juan Pablo. Universidad Nacional de Córdoba. Facultad de Ciencias Sociales. Instituto de Investigación y Formación en Administración Pública (IIFAP); Argentina.Fil: Carranza, Juan Pablo. Gobierno de la Provincia de Córdoba. Ministerio de Finanzas. Secretaría de Ingresos Públicos. Infraestructura de Datos Espaciales de la Provincia de Córdoba (IDECOR); Argentina.Fil: Piumetto, Mario Andrés. Universidad Nacional de Córdoba. Facultad de Ciencias Exactas, Físicas y Naturales. Centro de Estudios Territoriales (CET); Argentina.Fil: Piumetto, Mario Andrés. Gobierno de la Provincia de Córdoba. Ministerio de Finanzas. Secretaría de Ingresos Públicos. Infraestructura de Datos Espaciales de la Provincia de Córdoba (IDECOR); Argentina.Fil: Balzarini, Mónica Graciela. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina.Fil: Balzarini, Mónica Graciela. Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET). Centro Científico Tecnológico (CCT Córdoba); Argentina.The advancement of computational software and machine learning practice has facilitated enhanced uptake of mass appraisal methodologies for price modelling and prediction of land value. Since the characteristics of properties are geographically distributed, spatial autocorrelation computing could improve models to explain property prices. Different types of Random Forest models (RF), the classical one and quantile RF (QRF), were recognized as machine learning technique for real estate mass appraisal. However, a major drawback of this method is that they ignore influences of neighboring observed data when predicting the price properties. In order to overcome the disadvantage, random forest plus kriging of residuals (RFKO) method can be used. Initially, a RF of land values using predictive ancillary variables is carried out in order to model the trend component. In the second step, ordinary kriging is applied to the residuals of RF and a spatial prediction of the residuals is created. The final prediction is an additive combination of both model steps. The aim of this study was to compare performances of RF and quantile QRF both with and without spatial restriction in the prediction of rural and urban land values. We use two datasets of 3718 and 264 market data, released between 2017 and 2018. The first contains data of rural land value for the whole Province of Córdoba, Argentina, and the second one involves data coming from a village (Villa María) in the Province of Córdoba. A 10-fold cross validation was used to estimate prediction errors for each model. The root mean square prediction error was expressed as percentage of the mean yield (RMSE). Additionally, we fit an empirical a theoretical semivariogram to characterize the Relative Structured Variability (RSV, ratio of nugget and sill variance) of the residual from the compared methods. The results showed that only in the urban land the methods that incorporate spatial information performed better, RMSE of 30% vs. 34% for RF and 33% vs. 34% for QRF with and without kriging of the residuals, respectively.Fil: Córdoba, Mariano Augusto. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina.Fil: Córdoba, Mariano Augusto. Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET). Centro Científico Tecnológico (CCT Córdoba). Unidad de Fitopatología y Modelización Agrícola; Argentina.Fil: Córdoba, Mariano Augusto. Instituto Nacional de Tecnología Agropecuaria (INTA). Unidad de Fitopatología y Modelización Agrícola; Argentina.Fil: Monzani, Federico. Gobierno de la Provincia de Córdoba. Ministerio de Finanzas. Secretaría de Ingresos Públicos. Infraestructura de Datos Espaciales de la Provincia de Córdoba (IDECOR); Argentina.Fil: Carranza, Juan Pablo. Universidad Nacional de Córdoba. Facultad de Ciencias Sociales. Instituto de Investigación y Formación en Administración Pública (IIFAP); Argentina.Fil: Carranza, Juan Pablo. Gobierno de la Provincia de Córdoba. Ministerio de Finanzas. Secretaría de Ingresos Públicos. Infraestructura de Datos Espaciales de la Provincia de Córdoba (IDECOR); Argentina.Fil: Piumetto, Mario Andrés. Universidad Nacional de Córdoba. Facultad de Ciencias Exactas, Físicas y Naturales. Centro de Estudios Territoriales (CET); Argentina.Fil: Piumetto, Mario Andrés. Gobierno de la Provincia de Córdoba. Ministerio de Finanzas. Secretaría de Ingresos Públicos. Infraestructura de Datos Espaciales de la Provincia de Córdoba (IDECOR); Argentina.Fil: Balzarini, Mónica Graciela. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina.Fil: Balzarini, Mónica Graciela. Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET). Centro Científico Tecnológico (CCT Córdoba); Argentina.2020info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdfhttp://hdl.handle.net/11086/28950IBC 2020 Poster Session Abstractshttps://higherlogicdownload.s3.amazonaws.com/BIOMETRICSOCIETY/713ac962-588b-42d5-940f-47ae32f0b28c/UploadedImages/Accepted_Poster_Abstracts.pdfreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNCenginfo:eu-repo/semantics/openAccess2025-09-29T13:41:41Zoai:rdu.unc.edu.ar:11086/28950Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722025-09-29 13:41:41.416Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse
dc.title.none.fl_str_mv Mass appraisal of land values using random forest with spatial restriction
title Mass appraisal of land values using random forest with spatial restriction
spellingShingle Mass appraisal of land values using random forest with spatial restriction
Córdoba, Mariano Augusto
Valuación de la tierra
Propiedad
title_short Mass appraisal of land values using random forest with spatial restriction
title_full Mass appraisal of land values using random forest with spatial restriction
title_fullStr Mass appraisal of land values using random forest with spatial restriction
title_full_unstemmed Mass appraisal of land values using random forest with spatial restriction
title_sort Mass appraisal of land values using random forest with spatial restriction
dc.creator.none.fl_str_mv Córdoba, Mariano Augusto
Monzani, Federico
Carranza, Juan Pablo
Piumetto, Mario Andrés
Balzarini, Mónica Graciela
author Córdoba, Mariano Augusto
author_facet Córdoba, Mariano Augusto
Monzani, Federico
Carranza, Juan Pablo
Piumetto, Mario Andrés
Balzarini, Mónica Graciela
author_role author
author2 Monzani, Federico
Carranza, Juan Pablo
Piumetto, Mario Andrés
Balzarini, Mónica Graciela
author2_role author
author
author
author
dc.subject.none.fl_str_mv Valuación de la tierra
Propiedad
topic Valuación de la tierra
Propiedad
dc.description.none.fl_txt_mv Ponencia presentada en 30th International Biometric Conference (IBC 2020). Modalidad Virtual, 6 de Julio al 30 de Agosto 2020
Fil: Córdoba, Mariano Augusto. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina.
Fil: Córdoba, Mariano Augusto. Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET). Centro Científico Tecnológico (CCT Córdoba). Unidad de Fitopatología y Modelización Agrícola; Argentina.
Fil: Córdoba, Mariano Augusto. Instituto Nacional de Tecnología Agropecuaria (INTA). Unidad de Fitopatología y Modelización Agrícola; Argentina.
Fil: Monzani, Federico. Gobierno de la Provincia de Córdoba. Ministerio de Finanzas. Secretaría de Ingresos Públicos. Infraestructura de Datos Espaciales de la Provincia de Córdoba (IDECOR); Argentina.
Fil: Carranza, Juan Pablo. Universidad Nacional de Córdoba. Facultad de Ciencias Sociales. Instituto de Investigación y Formación en Administración Pública (IIFAP); Argentina.
Fil: Carranza, Juan Pablo. Gobierno de la Provincia de Córdoba. Ministerio de Finanzas. Secretaría de Ingresos Públicos. Infraestructura de Datos Espaciales de la Provincia de Córdoba (IDECOR); Argentina.
Fil: Piumetto, Mario Andrés. Universidad Nacional de Córdoba. Facultad de Ciencias Exactas, Físicas y Naturales. Centro de Estudios Territoriales (CET); Argentina.
Fil: Piumetto, Mario Andrés. Gobierno de la Provincia de Córdoba. Ministerio de Finanzas. Secretaría de Ingresos Públicos. Infraestructura de Datos Espaciales de la Provincia de Córdoba (IDECOR); Argentina.
Fil: Balzarini, Mónica Graciela. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina.
Fil: Balzarini, Mónica Graciela. Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET). Centro Científico Tecnológico (CCT Córdoba); Argentina.
The advancement of computational software and machine learning practice has facilitated enhanced uptake of mass appraisal methodologies for price modelling and prediction of land value. Since the characteristics of properties are geographically distributed, spatial autocorrelation computing could improve models to explain property prices. Different types of Random Forest models (RF), the classical one and quantile RF (QRF), were recognized as machine learning technique for real estate mass appraisal. However, a major drawback of this method is that they ignore influences of neighboring observed data when predicting the price properties. In order to overcome the disadvantage, random forest plus kriging of residuals (RFKO) method can be used. Initially, a RF of land values using predictive ancillary variables is carried out in order to model the trend component. In the second step, ordinary kriging is applied to the residuals of RF and a spatial prediction of the residuals is created. The final prediction is an additive combination of both model steps. The aim of this study was to compare performances of RF and quantile QRF both with and without spatial restriction in the prediction of rural and urban land values. We use two datasets of 3718 and 264 market data, released between 2017 and 2018. The first contains data of rural land value for the whole Province of Córdoba, Argentina, and the second one involves data coming from a village (Villa María) in the Province of Córdoba. A 10-fold cross validation was used to estimate prediction errors for each model. The root mean square prediction error was expressed as percentage of the mean yield (RMSE). Additionally, we fit an empirical a theoretical semivariogram to characterize the Relative Structured Variability (RSV, ratio of nugget and sill variance) of the residual from the compared methods. The results showed that only in the urban land the methods that incorporate spatial information performed better, RMSE of 30% vs. 34% for RF and 33% vs. 34% for QRF with and without kriging of the residuals, respectively.
Fil: Córdoba, Mariano Augusto. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina.
Fil: Córdoba, Mariano Augusto. Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET). Centro Científico Tecnológico (CCT Córdoba). Unidad de Fitopatología y Modelización Agrícola; Argentina.
Fil: Córdoba, Mariano Augusto. Instituto Nacional de Tecnología Agropecuaria (INTA). Unidad de Fitopatología y Modelización Agrícola; Argentina.
Fil: Monzani, Federico. Gobierno de la Provincia de Córdoba. Ministerio de Finanzas. Secretaría de Ingresos Públicos. Infraestructura de Datos Espaciales de la Provincia de Córdoba (IDECOR); Argentina.
Fil: Carranza, Juan Pablo. Universidad Nacional de Córdoba. Facultad de Ciencias Sociales. Instituto de Investigación y Formación en Administración Pública (IIFAP); Argentina.
Fil: Carranza, Juan Pablo. Gobierno de la Provincia de Córdoba. Ministerio de Finanzas. Secretaría de Ingresos Públicos. Infraestructura de Datos Espaciales de la Provincia de Córdoba (IDECOR); Argentina.
Fil: Piumetto, Mario Andrés. Universidad Nacional de Córdoba. Facultad de Ciencias Exactas, Físicas y Naturales. Centro de Estudios Territoriales (CET); Argentina.
Fil: Piumetto, Mario Andrés. Gobierno de la Provincia de Córdoba. Ministerio de Finanzas. Secretaría de Ingresos Públicos. Infraestructura de Datos Espaciales de la Provincia de Córdoba (IDECOR); Argentina.
Fil: Balzarini, Mónica Graciela. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina.
Fil: Balzarini, Mónica Graciela. Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET). Centro Científico Tecnológico (CCT Córdoba); Argentina.
description Ponencia presentada en 30th International Biometric Conference (IBC 2020). Modalidad Virtual, 6 de Julio al 30 de Agosto 2020
publishDate 2020
dc.date.none.fl_str_mv 2020
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11086/28950
url http://hdl.handle.net/11086/28950
dc.language.none.fl_str_mv eng
language eng
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv IBC 2020 Poster Session Abstracts
https://higherlogicdownload.s3.amazonaws.com/BIOMETRICSOCIETY/713ac962-588b-42d5-940f-47ae32f0b28c/UploadedImages/Accepted_Poster_Abstracts.pdf
reponame:Repositorio Digital Universitario (UNC)
instname:Universidad Nacional de Córdoba
instacron:UNC
reponame_str Repositorio Digital Universitario (UNC)
collection Repositorio Digital Universitario (UNC)
instname_str Universidad Nacional de Córdoba
instacron_str UNC
institution UNC
repository.name.fl_str_mv Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba
repository.mail.fl_str_mv oca.unc@gmail.com
_version_ 1844618908297854976
score 13.070432