Estimación robusta en modelos de regresión funcional

Autores
Parada, Daniela Laura
Año de publicación
2023
Idioma
español castellano
Tipo de recurso
tesis de maestría
Estado
versión publicada
Colaborador/a o director/a de tesis
Boente Boente, Graciela Lina
Descripción
La mayoría de los procedimientos estadísticos clásicos están basados en modelos con hipótesis rígidas, tales como errores normales u observaciones equidistribuídas, entre otros. Bajo estas hipótesis, se deducen procedimientos óptimos. Sin embargo, estos métodos son muy sensibles al incumplimiento de las hipótesis que los generaron. Los métodos estadísticos robustos tienen como objetivo permitir inferencias válidas cuando el modelo no se cumple exactamente y, al mismo tiempo, ser altamente eficientes bajo el modelo central. Por otra parte y en muchas aplicaciones, los datos observados provienen de fenómenos que son continuos en el tiempo o en el espacio y que pueden ser supuestos como curvas o funciones suaves más que como vectores de dimensión finita. El análisis de datos funcionales ha recibido considerable atención por su versatilidad en estos contextos. Cabe mencionar que el análisis de este tipo de datos requiere herramientas propias ya que, en muchas ocasiones, las extensiones naturales de las técnicas estadísticas multivariadas usuales no son adecuadas. El objetivo de esta tesis de maestría es hacer una revisión bibliográfica del tema, en particular, de los procedimientos existentes para estimar los parámetros en un modelo regresión funcional cuando las covariables son funcionales y cumplen un modelo lineal o cuadrático, a la vez que proponer estimadores robustos de los parámetros involucrados. En particular, se considera el modelo cuadrático dado en Yao y Müller (2010) y en Horváth y Reeder (2013), así como sus propuestas de estimación. Como la presencia de valores atípicos en las covariables funcionales puede afectar el procedimiento de estimación cuando se utilizan las componentes principales muestrales para reducir la dimensión y estimar los parámetros de la regresión, se definen estimadores robustos para el modelo cuadrático utilizando estimadores de las direcciones principales esféricas (Locantore et al., 1999; Gervini, 2008). Más específicamente, proponemos usar estimadores robustos de las direcciones principales para generar los espacios de dimensión finita que constituyen los posibles candidatos tanto para el parámetro de regresión funcional como el operador cuadrático, para luego usar MM−estimadores de regresión (Yohai, 1987). Se analiza la sensibilidad de estos estimadores ante la presencia de distintos porcentajes de datos atípicos, tanto en los residuos como en las covariables emulando las propuestas de simulación de Yao y Müller (2010) y Boente et al. (2020). Por último, se aplican estas técnicas a dos conjuntos de datos espectrales diferentes, ambos conocidos por presentar observaciones atípicas.
Most classical statistical procedures rely on models with rigid assumptions, such as normal distributed errors or equidistributed observations, among others. Under these hypotheses, optimal procedures are obtained. However, these methods are very sensitive to non–compliance with the hypotheses that generated them. Robust statistical methods aim to allow benchmarks when the model does not hold exactly being, at the same time, highly efficient under the central model. On the other hand, in many applications the observed data come from phenomena that are continuous in time or space and can be assumed to be curves or smooth functions rather than fine–dimensional vectors. Functional data analysis has received considerable attention for its versatility in these contexts. In most situations, the analysis of these type of data requires proper tools since the natural extension of the usual multivariate statistical procedures fail. The purpose of this master’s thesis is to review the existing procedures to estimate the parameters under a functional regression model, that is, when the covariates are functional. We focus our attention on the linear and quadratic models and we propose robust estimators for the parameters involved. In particular, we consider the extension of the quadratic case as in Yao y Müller (2010) and in Horváth y Reeder (2013), as well as their estimation proposals. Since the presence of outliers in the functional covariates may affect the estimation procedure when the sample principal components are used to reduce dimensionality when estimating the regression parameters, we define robust estimators for the quadratic model using the spherical principal component basis (Locantore et al., 1999; Gervini, 2008). More specifically, we consider robust estimators for the principal directions to define a basis of possible candidates for the estimators of both the functional regression parameter and the quadratic operator, and then we use MM−regression estimators (Yohai, 1987). We analyze the sensitivity and performance of these estimators in the presence of atypical data, both in the residuals and in the covariates, emulating the simulation proposals of Yao y Müller (2010) and Boente et al. (2020). Finally, we apply these procedures on two datasets of different spectral data, both known to have outliers.
Fil: Parada, Daniela Laura. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
DATOS FUNCIONALES
MODELO DE REGRESION FUNCIONAL
ESTIMACION ROBUSTA
DIRECCIONES PRINCIPALES ESFERICAS
MM-ESTIMADORES
FUNCTIONAL DATA
FUNCTIONAL REGRESSION MODEL
ROBUST ESTIMATION
SPHERICAL PRINCIPALCOMPONENTS
MM-ESTIMATORS
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
tesis:tesis_n7298_Parada

id BDUBAFCEN_eb14d3d32246d246e139f2d9d0aa49bc
oai_identifier_str tesis:tesis_n7298_Parada
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Estimación robusta en modelos de regresión funcionalRobust estimators for functional quadratic regression modelsParada, Daniela LauraDATOS FUNCIONALESMODELO DE REGRESION FUNCIONALESTIMACION ROBUSTADIRECCIONES PRINCIPALES ESFERICASMM-ESTIMADORESFUNCTIONAL DATAFUNCTIONAL REGRESSION MODELROBUST ESTIMATIONSPHERICAL PRINCIPALCOMPONENTSMM-ESTIMATORSLa mayoría de los procedimientos estadísticos clásicos están basados en modelos con hipótesis rígidas, tales como errores normales u observaciones equidistribuídas, entre otros. Bajo estas hipótesis, se deducen procedimientos óptimos. Sin embargo, estos métodos son muy sensibles al incumplimiento de las hipótesis que los generaron. Los métodos estadísticos robustos tienen como objetivo permitir inferencias válidas cuando el modelo no se cumple exactamente y, al mismo tiempo, ser altamente eficientes bajo el modelo central. Por otra parte y en muchas aplicaciones, los datos observados provienen de fenómenos que son continuos en el tiempo o en el espacio y que pueden ser supuestos como curvas o funciones suaves más que como vectores de dimensión finita. El análisis de datos funcionales ha recibido considerable atención por su versatilidad en estos contextos. Cabe mencionar que el análisis de este tipo de datos requiere herramientas propias ya que, en muchas ocasiones, las extensiones naturales de las técnicas estadísticas multivariadas usuales no son adecuadas. El objetivo de esta tesis de maestría es hacer una revisión bibliográfica del tema, en particular, de los procedimientos existentes para estimar los parámetros en un modelo regresión funcional cuando las covariables son funcionales y cumplen un modelo lineal o cuadrático, a la vez que proponer estimadores robustos de los parámetros involucrados. En particular, se considera el modelo cuadrático dado en Yao y Müller (2010) y en Horváth y Reeder (2013), así como sus propuestas de estimación. Como la presencia de valores atípicos en las covariables funcionales puede afectar el procedimiento de estimación cuando se utilizan las componentes principales muestrales para reducir la dimensión y estimar los parámetros de la regresión, se definen estimadores robustos para el modelo cuadrático utilizando estimadores de las direcciones principales esféricas (Locantore et al., 1999; Gervini, 2008). Más específicamente, proponemos usar estimadores robustos de las direcciones principales para generar los espacios de dimensión finita que constituyen los posibles candidatos tanto para el parámetro de regresión funcional como el operador cuadrático, para luego usar MM−estimadores de regresión (Yohai, 1987). Se analiza la sensibilidad de estos estimadores ante la presencia de distintos porcentajes de datos atípicos, tanto en los residuos como en las covariables emulando las propuestas de simulación de Yao y Müller (2010) y Boente et al. (2020). Por último, se aplican estas técnicas a dos conjuntos de datos espectrales diferentes, ambos conocidos por presentar observaciones atípicas.Most classical statistical procedures rely on models with rigid assumptions, such as normal distributed errors or equidistributed observations, among others. Under these hypotheses, optimal procedures are obtained. However, these methods are very sensitive to non–compliance with the hypotheses that generated them. Robust statistical methods aim to allow benchmarks when the model does not hold exactly being, at the same time, highly efficient under the central model. On the other hand, in many applications the observed data come from phenomena that are continuous in time or space and can be assumed to be curves or smooth functions rather than fine–dimensional vectors. Functional data analysis has received considerable attention for its versatility in these contexts. In most situations, the analysis of these type of data requires proper tools since the natural extension of the usual multivariate statistical procedures fail. The purpose of this master’s thesis is to review the existing procedures to estimate the parameters under a functional regression model, that is, when the covariates are functional. We focus our attention on the linear and quadratic models and we propose robust estimators for the parameters involved. In particular, we consider the extension of the quadratic case as in Yao y Müller (2010) and in Horváth y Reeder (2013), as well as their estimation proposals. Since the presence of outliers in the functional covariates may affect the estimation procedure when the sample principal components are used to reduce dimensionality when estimating the regression parameters, we define robust estimators for the quadratic model using the spherical principal component basis (Locantore et al., 1999; Gervini, 2008). More specifically, we consider robust estimators for the principal directions to define a basis of possible candidates for the estimators of both the functional regression parameter and the quadratic operator, and then we use MM−regression estimators (Yohai, 1987). We analyze the sensitivity and performance of these estimators in the presence of atypical data, both in the residuals and in the covariates, emulating the simulation proposals of Yao y Müller (2010) and Boente et al. (2020). Finally, we apply these procedures on two datasets of different spectral data, both known to have outliers.Fil: Parada, Daniela Laura. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesBoente Boente, Graciela Lina2023-04-04info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_bdccinfo:ar-repo/semantics/tesisDeMaestriaapplication/pdfhttps://hdl.handle.net/20.500.12110/tesis_n7298_Paradaspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-29T13:41:48Ztesis:tesis_n7298_ParadaInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-29 13:41:50.113Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Estimación robusta en modelos de regresión funcional
Robust estimators for functional quadratic regression models
title Estimación robusta en modelos de regresión funcional
spellingShingle Estimación robusta en modelos de regresión funcional
Parada, Daniela Laura
DATOS FUNCIONALES
MODELO DE REGRESION FUNCIONAL
ESTIMACION ROBUSTA
DIRECCIONES PRINCIPALES ESFERICAS
MM-ESTIMADORES
FUNCTIONAL DATA
FUNCTIONAL REGRESSION MODEL
ROBUST ESTIMATION
SPHERICAL PRINCIPALCOMPONENTS
MM-ESTIMATORS
title_short Estimación robusta en modelos de regresión funcional
title_full Estimación robusta en modelos de regresión funcional
title_fullStr Estimación robusta en modelos de regresión funcional
title_full_unstemmed Estimación robusta en modelos de regresión funcional
title_sort Estimación robusta en modelos de regresión funcional
dc.creator.none.fl_str_mv Parada, Daniela Laura
author Parada, Daniela Laura
author_facet Parada, Daniela Laura
author_role author
dc.contributor.none.fl_str_mv Boente Boente, Graciela Lina
dc.subject.none.fl_str_mv DATOS FUNCIONALES
MODELO DE REGRESION FUNCIONAL
ESTIMACION ROBUSTA
DIRECCIONES PRINCIPALES ESFERICAS
MM-ESTIMADORES
FUNCTIONAL DATA
FUNCTIONAL REGRESSION MODEL
ROBUST ESTIMATION
SPHERICAL PRINCIPALCOMPONENTS
MM-ESTIMATORS
topic DATOS FUNCIONALES
MODELO DE REGRESION FUNCIONAL
ESTIMACION ROBUSTA
DIRECCIONES PRINCIPALES ESFERICAS
MM-ESTIMADORES
FUNCTIONAL DATA
FUNCTIONAL REGRESSION MODEL
ROBUST ESTIMATION
SPHERICAL PRINCIPALCOMPONENTS
MM-ESTIMATORS
dc.description.none.fl_txt_mv La mayoría de los procedimientos estadísticos clásicos están basados en modelos con hipótesis rígidas, tales como errores normales u observaciones equidistribuídas, entre otros. Bajo estas hipótesis, se deducen procedimientos óptimos. Sin embargo, estos métodos son muy sensibles al incumplimiento de las hipótesis que los generaron. Los métodos estadísticos robustos tienen como objetivo permitir inferencias válidas cuando el modelo no se cumple exactamente y, al mismo tiempo, ser altamente eficientes bajo el modelo central. Por otra parte y en muchas aplicaciones, los datos observados provienen de fenómenos que son continuos en el tiempo o en el espacio y que pueden ser supuestos como curvas o funciones suaves más que como vectores de dimensión finita. El análisis de datos funcionales ha recibido considerable atención por su versatilidad en estos contextos. Cabe mencionar que el análisis de este tipo de datos requiere herramientas propias ya que, en muchas ocasiones, las extensiones naturales de las técnicas estadísticas multivariadas usuales no son adecuadas. El objetivo de esta tesis de maestría es hacer una revisión bibliográfica del tema, en particular, de los procedimientos existentes para estimar los parámetros en un modelo regresión funcional cuando las covariables son funcionales y cumplen un modelo lineal o cuadrático, a la vez que proponer estimadores robustos de los parámetros involucrados. En particular, se considera el modelo cuadrático dado en Yao y Müller (2010) y en Horváth y Reeder (2013), así como sus propuestas de estimación. Como la presencia de valores atípicos en las covariables funcionales puede afectar el procedimiento de estimación cuando se utilizan las componentes principales muestrales para reducir la dimensión y estimar los parámetros de la regresión, se definen estimadores robustos para el modelo cuadrático utilizando estimadores de las direcciones principales esféricas (Locantore et al., 1999; Gervini, 2008). Más específicamente, proponemos usar estimadores robustos de las direcciones principales para generar los espacios de dimensión finita que constituyen los posibles candidatos tanto para el parámetro de regresión funcional como el operador cuadrático, para luego usar MM−estimadores de regresión (Yohai, 1987). Se analiza la sensibilidad de estos estimadores ante la presencia de distintos porcentajes de datos atípicos, tanto en los residuos como en las covariables emulando las propuestas de simulación de Yao y Müller (2010) y Boente et al. (2020). Por último, se aplican estas técnicas a dos conjuntos de datos espectrales diferentes, ambos conocidos por presentar observaciones atípicas.
Most classical statistical procedures rely on models with rigid assumptions, such as normal distributed errors or equidistributed observations, among others. Under these hypotheses, optimal procedures are obtained. However, these methods are very sensitive to non–compliance with the hypotheses that generated them. Robust statistical methods aim to allow benchmarks when the model does not hold exactly being, at the same time, highly efficient under the central model. On the other hand, in many applications the observed data come from phenomena that are continuous in time or space and can be assumed to be curves or smooth functions rather than fine–dimensional vectors. Functional data analysis has received considerable attention for its versatility in these contexts. In most situations, the analysis of these type of data requires proper tools since the natural extension of the usual multivariate statistical procedures fail. The purpose of this master’s thesis is to review the existing procedures to estimate the parameters under a functional regression model, that is, when the covariates are functional. We focus our attention on the linear and quadratic models and we propose robust estimators for the parameters involved. In particular, we consider the extension of the quadratic case as in Yao y Müller (2010) and in Horváth y Reeder (2013), as well as their estimation proposals. Since the presence of outliers in the functional covariates may affect the estimation procedure when the sample principal components are used to reduce dimensionality when estimating the regression parameters, we define robust estimators for the quadratic model using the spherical principal component basis (Locantore et al., 1999; Gervini, 2008). More specifically, we consider robust estimators for the principal directions to define a basis of possible candidates for the estimators of both the functional regression parameter and the quadratic operator, and then we use MM−regression estimators (Yohai, 1987). We analyze the sensitivity and performance of these estimators in the presence of atypical data, both in the residuals and in the covariates, emulating the simulation proposals of Yao y Müller (2010) and Boente et al. (2020). Finally, we apply these procedures on two datasets of different spectral data, both known to have outliers.
Fil: Parada, Daniela Laura. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description La mayoría de los procedimientos estadísticos clásicos están basados en modelos con hipótesis rígidas, tales como errores normales u observaciones equidistribuídas, entre otros. Bajo estas hipótesis, se deducen procedimientos óptimos. Sin embargo, estos métodos son muy sensibles al incumplimiento de las hipótesis que los generaron. Los métodos estadísticos robustos tienen como objetivo permitir inferencias válidas cuando el modelo no se cumple exactamente y, al mismo tiempo, ser altamente eficientes bajo el modelo central. Por otra parte y en muchas aplicaciones, los datos observados provienen de fenómenos que son continuos en el tiempo o en el espacio y que pueden ser supuestos como curvas o funciones suaves más que como vectores de dimensión finita. El análisis de datos funcionales ha recibido considerable atención por su versatilidad en estos contextos. Cabe mencionar que el análisis de este tipo de datos requiere herramientas propias ya que, en muchas ocasiones, las extensiones naturales de las técnicas estadísticas multivariadas usuales no son adecuadas. El objetivo de esta tesis de maestría es hacer una revisión bibliográfica del tema, en particular, de los procedimientos existentes para estimar los parámetros en un modelo regresión funcional cuando las covariables son funcionales y cumplen un modelo lineal o cuadrático, a la vez que proponer estimadores robustos de los parámetros involucrados. En particular, se considera el modelo cuadrático dado en Yao y Müller (2010) y en Horváth y Reeder (2013), así como sus propuestas de estimación. Como la presencia de valores atípicos en las covariables funcionales puede afectar el procedimiento de estimación cuando se utilizan las componentes principales muestrales para reducir la dimensión y estimar los parámetros de la regresión, se definen estimadores robustos para el modelo cuadrático utilizando estimadores de las direcciones principales esféricas (Locantore et al., 1999; Gervini, 2008). Más específicamente, proponemos usar estimadores robustos de las direcciones principales para generar los espacios de dimensión finita que constituyen los posibles candidatos tanto para el parámetro de regresión funcional como el operador cuadrático, para luego usar MM−estimadores de regresión (Yohai, 1987). Se analiza la sensibilidad de estos estimadores ante la presencia de distintos porcentajes de datos atípicos, tanto en los residuos como en las covariables emulando las propuestas de simulación de Yao y Müller (2010) y Boente et al. (2020). Por último, se aplican estas técnicas a dos conjuntos de datos espectrales diferentes, ambos conocidos por presentar observaciones atípicas.
publishDate 2023
dc.date.none.fl_str_mv 2023-04-04
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_bdcc
info:ar-repo/semantics/tesisDeMaestria
format masterThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/tesis_n7298_Parada
url https://hdl.handle.net/20.500.12110/tesis_n7298_Parada
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1844618713544785920
score 13.070432