Inferencia en modelos aditivos

Autores
Martínez, Alejandra Mercedes
Año de publicación
2014
Idioma
español castellano
Tipo de recurso
tesis doctoral
Estado
versión publicada
Colaborador/a o director/a de tesis
Boente Boente, Graciela Lina
Salibián-Barrera, Matías
Descripción
La inferencia estadística comúnmente utiliza modelos paramétricos y el supuesto es que lasobservaciones de la muestra pertenecen a una familia paramétrica conocida. En este caso, el problemaconsiste en estimar o hacer inferencia sobre los parámetros desconocidos, permitiendo llegara conclusiones precisas cuando el modelo supuesto es cierto pero llevando posiblemente a conclusionesequivocadas cuando se aplica a un modelo ligeramente perturbado. Por esta razón, se handesarrollado modelos noparamétricos y semiparamétricos para analizar los datos. Recientemente,los modelos noparamétricos han ganado una importante atención en el estudio de fenómenos naturalescon comportamiento de complejidad no lineal. Si bien estos modelos tienen menor precisión,están asociados con una alta estabilidad. En esta tesis nos enfocaremos en los modelos de regresiónnoparamétricos. Para los modelos de regresión noparamétricos multivariados, los estimadores de la función deregresión multivariada, tales como el estimador de Nadaraya–Watson, sufren de la bien conocidamaldición de la dimensión, debido a que en entornos de radio fijo la cantidad de observacionesdisminuye exponencialmente. Para evitar este problema, se introdujeron los modelos aditivos, quegeneralizan los modelos lineales, son de fácil interpretación y además resuelven la maldición de ladimensión. La mayoría de los procedimientos para estimar las componentes de un modelo aditivose basan en promedios o polinomios locales usando ajustes por mínimos cuadrados. Por esta raz´on,tienen la desventaja de ser muy sensibles a la presencia de datos atípicos. Por otro lado, en muchassituaciones, sobre todo en estudios biomédicos, puede haber un conjunto de puntos del dise˜no conrespuestas faltantes. En esta tesis, introducimos estimadores robustos basados en polinomios locales para resolvertanto la maldición de la dimensión, como la presencia de datos atípicos y así como también laexistencia de respuestas faltantes. Estos estimadores están basados en un procedimiento de integración marginal adaptado a la situación de datos faltantes. Dichas propuestas resultaron serconsistentes y asintóticamente normalmente distribuidas bajo condiciones de regularidad. Además,se consideró una familia de estimadores robustos basados en el procedimiento de backfitting cuandono hay observaciones faltantes. Finalmente, se realizó un estudio de simulación para comparar elprocedimiento de las propuestas bajo diferentes escenarios.
Most commonly used models in statistical inference are parametric and the assumption isthat the observations in the sample belong to a known parametric family. In this case, theproblem consists in estimating or making inference on the unkown parameters, leading toaccurate conclusions when the model is correct, but they can lead to wrong conclusions when theyare applied to a slightly disturbed models. For this reason, nonparametric and semiparametricmodels have been developed for data analysis. Recently, nonparametric regression models havegain importance when studying natural phenomenons with non lineal complexity behaviour. Eventhough these models are less accurate, they are associated with high stability. In this thesis, wewill focus on nonparametric regression models. For the nonparamatric multivariate regression models, estimators of the multivariate regressionfunction, such as the Nadaraya–Watson estimator, suffer from the well–known curse of dimensionality,due to in fixed-radius neiborhoods the amount of observations decreases exponentially. Toovercome this drawback, additive regression models have been introduced. They generalize linearmodels, are easily interpretable, and they also solve the problem of the curse of the dimensionality. Most methods to estimate the components under an additive model are based on local averagesor local polynomials, being sensitive to outliers. On the other hand, in many applied statisticalanalysis, for example in many biological experiments, it can be part of the design points on whichthe responses are missing. In this thesis, we introduce robust estimators based on local polynomials to solve either thecurse of dimensionality, the sensitivity to atypical observations and also the existence of missingresponses. The estimators are based on marginal integration adapted to the missing situation. Theproposed estimators turn out to be consistent and asymptotically normally distributed under mildassumptions. Besides, a family of robust estimators based on backfitting is also considered for thesituation where no missing responses arise. A simulation study allows to compare the behaviour ofour procedures, under different scenarios.
Fil: Martínez, Alejandra Mercedes. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
BACKFITTING
DATOS FALTANTES
INTEGRACION MARGINAL
MODELOS ADITIVOS
PESOS BASADOS EN NUCLEOS
POLINOMIOS LOCALES
REGRESION NOPARAMETRICA
ROBUSTEZ
ADDITIVE MODELS
BACKFITTING
KERNEL WEIGHTS
LOCAL POLYNOMIALS
NONPARAMETRIC REGRESSION
MARGINAL INTEGRATION
MISSING DATA
ROBUSTNESS DATA
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
tesis:tesis_n5604_Martinez

id BDUBAFCEN_4b2a04b35c7c8dad86490720c734e2e2
oai_identifier_str tesis:tesis_n5604_Martinez
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Inferencia en modelos aditivosInference in additive modelsMartínez, Alejandra MercedesBACKFITTINGDATOS FALTANTESINTEGRACION MARGINALMODELOS ADITIVOSPESOS BASADOS EN NUCLEOSPOLINOMIOS LOCALESREGRESION NOPARAMETRICAROBUSTEZADDITIVE MODELSBACKFITTINGKERNEL WEIGHTSLOCAL POLYNOMIALSNONPARAMETRIC REGRESSIONMARGINAL INTEGRATIONMISSING DATAROBUSTNESS DATALa inferencia estadística comúnmente utiliza modelos paramétricos y el supuesto es que lasobservaciones de la muestra pertenecen a una familia paramétrica conocida. En este caso, el problemaconsiste en estimar o hacer inferencia sobre los parámetros desconocidos, permitiendo llegara conclusiones precisas cuando el modelo supuesto es cierto pero llevando posiblemente a conclusionesequivocadas cuando se aplica a un modelo ligeramente perturbado. Por esta razón, se handesarrollado modelos noparamétricos y semiparamétricos para analizar los datos. Recientemente,los modelos noparamétricos han ganado una importante atención en el estudio de fenómenos naturalescon comportamiento de complejidad no lineal. Si bien estos modelos tienen menor precisión,están asociados con una alta estabilidad. En esta tesis nos enfocaremos en los modelos de regresiónnoparamétricos. Para los modelos de regresión noparamétricos multivariados, los estimadores de la función deregresión multivariada, tales como el estimador de Nadaraya–Watson, sufren de la bien conocidamaldición de la dimensión, debido a que en entornos de radio fijo la cantidad de observacionesdisminuye exponencialmente. Para evitar este problema, se introdujeron los modelos aditivos, quegeneralizan los modelos lineales, son de fácil interpretación y además resuelven la maldición de ladimensión. La mayoría de los procedimientos para estimar las componentes de un modelo aditivose basan en promedios o polinomios locales usando ajustes por mínimos cuadrados. Por esta raz´on,tienen la desventaja de ser muy sensibles a la presencia de datos atípicos. Por otro lado, en muchassituaciones, sobre todo en estudios biomédicos, puede haber un conjunto de puntos del dise˜no conrespuestas faltantes. En esta tesis, introducimos estimadores robustos basados en polinomios locales para resolvertanto la maldición de la dimensión, como la presencia de datos atípicos y así como también laexistencia de respuestas faltantes. Estos estimadores están basados en un procedimiento de integración marginal adaptado a la situación de datos faltantes. Dichas propuestas resultaron serconsistentes y asintóticamente normalmente distribuidas bajo condiciones de regularidad. Además,se consideró una familia de estimadores robustos basados en el procedimiento de backfitting cuandono hay observaciones faltantes. Finalmente, se realizó un estudio de simulación para comparar elprocedimiento de las propuestas bajo diferentes escenarios.Most commonly used models in statistical inference are parametric and the assumption isthat the observations in the sample belong to a known parametric family. In this case, theproblem consists in estimating or making inference on the unkown parameters, leading toaccurate conclusions when the model is correct, but they can lead to wrong conclusions when theyare applied to a slightly disturbed models. For this reason, nonparametric and semiparametricmodels have been developed for data analysis. Recently, nonparametric regression models havegain importance when studying natural phenomenons with non lineal complexity behaviour. Eventhough these models are less accurate, they are associated with high stability. In this thesis, wewill focus on nonparametric regression models. For the nonparamatric multivariate regression models, estimators of the multivariate regressionfunction, such as the Nadaraya–Watson estimator, suffer from the well–known curse of dimensionality,due to in fixed-radius neiborhoods the amount of observations decreases exponentially. Toovercome this drawback, additive regression models have been introduced. They generalize linearmodels, are easily interpretable, and they also solve the problem of the curse of the dimensionality. Most methods to estimate the components under an additive model are based on local averagesor local polynomials, being sensitive to outliers. On the other hand, in many applied statisticalanalysis, for example in many biological experiments, it can be part of the design points on whichthe responses are missing. In this thesis, we introduce robust estimators based on local polynomials to solve either thecurse of dimensionality, the sensitivity to atypical observations and also the existence of missingresponses. The estimators are based on marginal integration adapted to the missing situation. Theproposed estimators turn out to be consistent and asymptotically normally distributed under mildassumptions. Besides, a family of robust estimators based on backfitting is also considered for thesituation where no missing responses arise. A simulation study allows to compare the behaviour ofour procedures, under different scenarios.Fil: Martínez, Alejandra Mercedes. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesBoente Boente, Graciela LinaSalibián-Barrera, Matías2014-03-11info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_db06info:ar-repo/semantics/tesisDoctoralapplication/pdfhttps://hdl.handle.net/20.500.12110/tesis_n5604_Martinezspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2026-05-28T08:44:25Ztesis:tesis_n5604_MartinezInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962026-05-28 08:44:26.319Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Inferencia en modelos aditivos
Inference in additive models
title Inferencia en modelos aditivos
spellingShingle Inferencia en modelos aditivos
Martínez, Alejandra Mercedes
BACKFITTING
DATOS FALTANTES
INTEGRACION MARGINAL
MODELOS ADITIVOS
PESOS BASADOS EN NUCLEOS
POLINOMIOS LOCALES
REGRESION NOPARAMETRICA
ROBUSTEZ
ADDITIVE MODELS
BACKFITTING
KERNEL WEIGHTS
LOCAL POLYNOMIALS
NONPARAMETRIC REGRESSION
MARGINAL INTEGRATION
MISSING DATA
ROBUSTNESS DATA
title_short Inferencia en modelos aditivos
title_full Inferencia en modelos aditivos
title_fullStr Inferencia en modelos aditivos
title_full_unstemmed Inferencia en modelos aditivos
title_sort Inferencia en modelos aditivos
dc.creator.none.fl_str_mv Martínez, Alejandra Mercedes
author Martínez, Alejandra Mercedes
author_facet Martínez, Alejandra Mercedes
author_role author
dc.contributor.none.fl_str_mv Boente Boente, Graciela Lina
Salibián-Barrera, Matías
dc.subject.none.fl_str_mv BACKFITTING
DATOS FALTANTES
INTEGRACION MARGINAL
MODELOS ADITIVOS
PESOS BASADOS EN NUCLEOS
POLINOMIOS LOCALES
REGRESION NOPARAMETRICA
ROBUSTEZ
ADDITIVE MODELS
BACKFITTING
KERNEL WEIGHTS
LOCAL POLYNOMIALS
NONPARAMETRIC REGRESSION
MARGINAL INTEGRATION
MISSING DATA
ROBUSTNESS DATA
topic BACKFITTING
DATOS FALTANTES
INTEGRACION MARGINAL
MODELOS ADITIVOS
PESOS BASADOS EN NUCLEOS
POLINOMIOS LOCALES
REGRESION NOPARAMETRICA
ROBUSTEZ
ADDITIVE MODELS
BACKFITTING
KERNEL WEIGHTS
LOCAL POLYNOMIALS
NONPARAMETRIC REGRESSION
MARGINAL INTEGRATION
MISSING DATA
ROBUSTNESS DATA
dc.description.none.fl_txt_mv La inferencia estadística comúnmente utiliza modelos paramétricos y el supuesto es que lasobservaciones de la muestra pertenecen a una familia paramétrica conocida. En este caso, el problemaconsiste en estimar o hacer inferencia sobre los parámetros desconocidos, permitiendo llegara conclusiones precisas cuando el modelo supuesto es cierto pero llevando posiblemente a conclusionesequivocadas cuando se aplica a un modelo ligeramente perturbado. Por esta razón, se handesarrollado modelos noparamétricos y semiparamétricos para analizar los datos. Recientemente,los modelos noparamétricos han ganado una importante atención en el estudio de fenómenos naturalescon comportamiento de complejidad no lineal. Si bien estos modelos tienen menor precisión,están asociados con una alta estabilidad. En esta tesis nos enfocaremos en los modelos de regresiónnoparamétricos. Para los modelos de regresión noparamétricos multivariados, los estimadores de la función deregresión multivariada, tales como el estimador de Nadaraya–Watson, sufren de la bien conocidamaldición de la dimensión, debido a que en entornos de radio fijo la cantidad de observacionesdisminuye exponencialmente. Para evitar este problema, se introdujeron los modelos aditivos, quegeneralizan los modelos lineales, son de fácil interpretación y además resuelven la maldición de ladimensión. La mayoría de los procedimientos para estimar las componentes de un modelo aditivose basan en promedios o polinomios locales usando ajustes por mínimos cuadrados. Por esta raz´on,tienen la desventaja de ser muy sensibles a la presencia de datos atípicos. Por otro lado, en muchassituaciones, sobre todo en estudios biomédicos, puede haber un conjunto de puntos del dise˜no conrespuestas faltantes. En esta tesis, introducimos estimadores robustos basados en polinomios locales para resolvertanto la maldición de la dimensión, como la presencia de datos atípicos y así como también laexistencia de respuestas faltantes. Estos estimadores están basados en un procedimiento de integración marginal adaptado a la situación de datos faltantes. Dichas propuestas resultaron serconsistentes y asintóticamente normalmente distribuidas bajo condiciones de regularidad. Además,se consideró una familia de estimadores robustos basados en el procedimiento de backfitting cuandono hay observaciones faltantes. Finalmente, se realizó un estudio de simulación para comparar elprocedimiento de las propuestas bajo diferentes escenarios.
Most commonly used models in statistical inference are parametric and the assumption isthat the observations in the sample belong to a known parametric family. In this case, theproblem consists in estimating or making inference on the unkown parameters, leading toaccurate conclusions when the model is correct, but they can lead to wrong conclusions when theyare applied to a slightly disturbed models. For this reason, nonparametric and semiparametricmodels have been developed for data analysis. Recently, nonparametric regression models havegain importance when studying natural phenomenons with non lineal complexity behaviour. Eventhough these models are less accurate, they are associated with high stability. In this thesis, wewill focus on nonparametric regression models. For the nonparamatric multivariate regression models, estimators of the multivariate regressionfunction, such as the Nadaraya–Watson estimator, suffer from the well–known curse of dimensionality,due to in fixed-radius neiborhoods the amount of observations decreases exponentially. Toovercome this drawback, additive regression models have been introduced. They generalize linearmodels, are easily interpretable, and they also solve the problem of the curse of the dimensionality. Most methods to estimate the components under an additive model are based on local averagesor local polynomials, being sensitive to outliers. On the other hand, in many applied statisticalanalysis, for example in many biological experiments, it can be part of the design points on whichthe responses are missing. In this thesis, we introduce robust estimators based on local polynomials to solve either thecurse of dimensionality, the sensitivity to atypical observations and also the existence of missingresponses. The estimators are based on marginal integration adapted to the missing situation. Theproposed estimators turn out to be consistent and asymptotically normally distributed under mildassumptions. Besides, a family of robust estimators based on backfitting is also considered for thesituation where no missing responses arise. A simulation study allows to compare the behaviour ofour procedures, under different scenarios.
Fil: Martínez, Alejandra Mercedes. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description La inferencia estadística comúnmente utiliza modelos paramétricos y el supuesto es que lasobservaciones de la muestra pertenecen a una familia paramétrica conocida. En este caso, el problemaconsiste en estimar o hacer inferencia sobre los parámetros desconocidos, permitiendo llegara conclusiones precisas cuando el modelo supuesto es cierto pero llevando posiblemente a conclusionesequivocadas cuando se aplica a un modelo ligeramente perturbado. Por esta razón, se handesarrollado modelos noparamétricos y semiparamétricos para analizar los datos. Recientemente,los modelos noparamétricos han ganado una importante atención en el estudio de fenómenos naturalescon comportamiento de complejidad no lineal. Si bien estos modelos tienen menor precisión,están asociados con una alta estabilidad. En esta tesis nos enfocaremos en los modelos de regresiónnoparamétricos. Para los modelos de regresión noparamétricos multivariados, los estimadores de la función deregresión multivariada, tales como el estimador de Nadaraya–Watson, sufren de la bien conocidamaldición de la dimensión, debido a que en entornos de radio fijo la cantidad de observacionesdisminuye exponencialmente. Para evitar este problema, se introdujeron los modelos aditivos, quegeneralizan los modelos lineales, son de fácil interpretación y además resuelven la maldición de ladimensión. La mayoría de los procedimientos para estimar las componentes de un modelo aditivose basan en promedios o polinomios locales usando ajustes por mínimos cuadrados. Por esta raz´on,tienen la desventaja de ser muy sensibles a la presencia de datos atípicos. Por otro lado, en muchassituaciones, sobre todo en estudios biomédicos, puede haber un conjunto de puntos del dise˜no conrespuestas faltantes. En esta tesis, introducimos estimadores robustos basados en polinomios locales para resolvertanto la maldición de la dimensión, como la presencia de datos atípicos y así como también laexistencia de respuestas faltantes. Estos estimadores están basados en un procedimiento de integración marginal adaptado a la situación de datos faltantes. Dichas propuestas resultaron serconsistentes y asintóticamente normalmente distribuidas bajo condiciones de regularidad. Además,se consideró una familia de estimadores robustos basados en el procedimiento de backfitting cuandono hay observaciones faltantes. Finalmente, se realizó un estudio de simulación para comparar elprocedimiento de las propuestas bajo diferentes escenarios.
publishDate 2014
dc.date.none.fl_str_mv 2014-03-11
dc.type.none.fl_str_mv info:eu-repo/semantics/doctoralThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_db06
info:ar-repo/semantics/tesisDoctoral
format doctoralThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/tesis_n5604_Martinez
url https://hdl.handle.net/20.500.12110/tesis_n5604_Martinez
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1866437340311846912
score 12.753429