Inferencia robusta para modelos parcialmente lineales de índice simple con escala desconocida

Autores
Statti, María Florencia
Año de publicación
2023
Idioma
español castellano
Tipo de recurso
tesis doctoral
Estado
versión publicada
Colaborador/a o director/a de tesis
Bianco, Ana María
Descripción
En el problema de regresión, un clásico en Estadística, se desea encontrar una relación funcional entre una variable de respuesta y un conjunto de covariables o variables explicativas. Uno de los modelos paramétricos más difundidos es el modelo lineal y una alternativa muy conocida es la de los modelos no paramétricos. Ambos representan dos ramas muy importantes del análisis de regresión. Lo mejor de los dos mundos puede encontrarse en opciones semiparamétricas, tal es el caso del Modelo Parcialmente Lineal de Índice Simple en el que se combinan ambos enfoques. Por un lado, este modelo asume que la variable de respuesta y se relaciona con dos vectores de covariables x ∈ Rp y t ∈ Rq satisfaciendo la ecuación y = β t ₀x + η ₀(θt ₀t) + σ ₀ε , donde la función η0 : I → R, I intervalo real acotado, el vector de parámetros (β ₀,θ ₀) ∈R p × R q y el parámetro nuisance σ ₀ son desconocidos. Asumimos que ∥θ₀∥ = 1 y que su primera componente es positiva, a los fines de identificabilidad. Este tipo de modelos tienen un gran potencial en las aplicaciones cuando se piensa en ajustar una regresión no paramétrica múltiple, ya que a través del índice simple logran reducir a uno la dimensionalidad de la componente no paramétrica y permite, al mismo tiempo, capturar una posible relación no lineal entre y y t a través de la función η ₀. Por otro lado, es bien sabido que los métodos de estimación clásica suelen ser altamente sensibles a la presencia de datos atípicos y por este motivo son necesarios procedimientos alternativas robustos. El principal objetivo de esta Tesis es estudiar métodos de inferencia robustos para el Modelo Parcialmente Lineal de Índice Simple. Para ello proponemos una familia de estimadores robustos obtenidos con un procedimiento de dos pasos y un estimador inicial a fin de poder comenzar el procedimiento con estimadores preliminares resistentes a datos atípicos. Para el estimador propuesto estudiamos su comportamiento asintótico, deduciendo la consistencia y la distribución asintótica. Estos resultados teóricos se completan con un estudio de simulación con el objetivo de evaluar el comportamiento de la propuesta robusta frente a distintas contaminaciones y en muestras finitas. Por otro lado, introducimos una familia de tests robustos para chequear hipótesis que involucren al parámetro de la componente lineal β ₀ utilizando un estadístico de tipo Wald basado en el estimador propuesto. Deducimos su distribución asintótica bajo la hipótesis nula y realizamos un estudio de simulación preliminar para evaluar el comportamiento de los tests propuestos. [fórmula aproximada, revisar la misma en el original]
In regression analysis, a classic topic in Statistics, it is desired to find a functional relationship between a response variable and a set of covariates or explanatory variables. One of the most widespread parametric models is the linear one, while non–parametric models are a very wellknown alternative. They both represent two very important branches of regression analysis. The best of both worlds can be found among semiparametric models, as it is the case of Single Index Partially Linear Model, where both approaches are combined. In this model it is assumed that the response variable y is related to two covariate vectors x ∈ Rp and t ∈ Rq through the equation y = β t ₀x + η ₀(θt ₀t) + σ ₀ε , where the univariate real function η0 : I → R, with I a bounded real interval, the vector of parameters (β₀, θ₀) ∈ Rp × Rq and the nuisance parameter σ₀ are unknown. We assume that ∥θ₀∥ = 1 and that its first component is positive, for identifiability purposes. These models have great potential in the case of multiple non–parametric regression, since they manage to reduce the dimensionality of the non–parametric component to 1 through the single index and at the same time, capture a possible non–linear relationship between y and t through the function η0. It is known that classical estimation methods are usually highly sensitive to the presence of outliers and robust procedures are welcome in this scenario. The main objective of this thesis is to study robust inference methods for the Partially Linear Single Index Model. For this, we propose a family of robust estimators obtained through a two–step procedure and an initial estimator in order to be able to start the procedure with preliminary estimators resistant to outliers. For the proposed estimator we study its asymptotic behaviour, deriving consistency and their asymptotic distribution. These theoretical results are completed with a simulation study in order to evaluate the behaviour of our robust proposal under different contamination schemes and in finite samples. On the other hand, we introduce a family of robust tests to check hypotheses involving the linear component parameter β₀ using a Wald–type statistic based on the proposed estimator. We derive its asymptotic distribution under the null hypothesis and we carried out a preliminary simulation study to evaluate the behaviour of the proposed test. [fórmula aproximada, revisar la misma en el original]
Fil: Statti, María Florencia. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
MODELO PARCIALMENTE LINEAL DE INDICE SIMPLE
ESTIMACION ROBUSTA
COMPORTAMIENTO ASINTOTICO
TESTS DE HIPOTESIS ROBUSTOS
PARTIALLY LINEAR SINGLE INDEX MODEL
ROBUST ESTIMATION
ASYMPTOTIC BEHAVIOUR
ROBUST HYPOTHESES TESTING
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
tesis:tesis_n7296_Statti

id BDUBAFCEN_94a72353e062dd49a7b323ffba479075
oai_identifier_str tesis:tesis_n7296_Statti
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Inferencia robusta para modelos parcialmente lineales de índice simple con escala desconocidaRobust inference for partially linear single index models with unknown scaleStatti, María FlorenciaMODELO PARCIALMENTE LINEAL DE INDICE SIMPLEESTIMACION ROBUSTACOMPORTAMIENTO ASINTOTICOTESTS DE HIPOTESIS ROBUSTOSPARTIALLY LINEAR SINGLE INDEX MODELROBUST ESTIMATIONASYMPTOTIC BEHAVIOURROBUST HYPOTHESES TESTINGEn el problema de regresión, un clásico en Estadística, se desea encontrar una relación funcional entre una variable de respuesta y un conjunto de covariables o variables explicativas. Uno de los modelos paramétricos más difundidos es el modelo lineal y una alternativa muy conocida es la de los modelos no paramétricos. Ambos representan dos ramas muy importantes del análisis de regresión. Lo mejor de los dos mundos puede encontrarse en opciones semiparamétricas, tal es el caso del Modelo Parcialmente Lineal de Índice Simple en el que se combinan ambos enfoques. Por un lado, este modelo asume que la variable de respuesta y se relaciona con dos vectores de covariables x ∈ Rp y t ∈ Rq satisfaciendo la ecuación y = β t ₀x + η ₀(θt ₀t) + σ ₀ε , donde la función η0 : I → R, I intervalo real acotado, el vector de parámetros (β ₀,θ ₀) ∈R p × R q y el parámetro nuisance σ ₀ son desconocidos. Asumimos que ∥θ₀∥ = 1 y que su primera componente es positiva, a los fines de identificabilidad. Este tipo de modelos tienen un gran potencial en las aplicaciones cuando se piensa en ajustar una regresión no paramétrica múltiple, ya que a través del índice simple logran reducir a uno la dimensionalidad de la componente no paramétrica y permite, al mismo tiempo, capturar una posible relación no lineal entre y y t a través de la función η ₀. Por otro lado, es bien sabido que los métodos de estimación clásica suelen ser altamente sensibles a la presencia de datos atípicos y por este motivo son necesarios procedimientos alternativas robustos. El principal objetivo de esta Tesis es estudiar métodos de inferencia robustos para el Modelo Parcialmente Lineal de Índice Simple. Para ello proponemos una familia de estimadores robustos obtenidos con un procedimiento de dos pasos y un estimador inicial a fin de poder comenzar el procedimiento con estimadores preliminares resistentes a datos atípicos. Para el estimador propuesto estudiamos su comportamiento asintótico, deduciendo la consistencia y la distribución asintótica. Estos resultados teóricos se completan con un estudio de simulación con el objetivo de evaluar el comportamiento de la propuesta robusta frente a distintas contaminaciones y en muestras finitas. Por otro lado, introducimos una familia de tests robustos para chequear hipótesis que involucren al parámetro de la componente lineal β ₀ utilizando un estadístico de tipo Wald basado en el estimador propuesto. Deducimos su distribución asintótica bajo la hipótesis nula y realizamos un estudio de simulación preliminar para evaluar el comportamiento de los tests propuestos. [fórmula aproximada, revisar la misma en el original]In regression analysis, a classic topic in Statistics, it is desired to find a functional relationship between a response variable and a set of covariates or explanatory variables. One of the most widespread parametric models is the linear one, while non–parametric models are a very wellknown alternative. They both represent two very important branches of regression analysis. The best of both worlds can be found among semiparametric models, as it is the case of Single Index Partially Linear Model, where both approaches are combined. In this model it is assumed that the response variable y is related to two covariate vectors x ∈ Rp and t ∈ Rq through the equation y = β t ₀x + η ₀(θt ₀t) + σ ₀ε , where the univariate real function η0 : I → R, with I a bounded real interval, the vector of parameters (β₀, θ₀) ∈ Rp × Rq and the nuisance parameter σ₀ are unknown. We assume that ∥θ₀∥ = 1 and that its first component is positive, for identifiability purposes. These models have great potential in the case of multiple non–parametric regression, since they manage to reduce the dimensionality of the non–parametric component to 1 through the single index and at the same time, capture a possible non–linear relationship between y and t through the function η0. It is known that classical estimation methods are usually highly sensitive to the presence of outliers and robust procedures are welcome in this scenario. The main objective of this thesis is to study robust inference methods for the Partially Linear Single Index Model. For this, we propose a family of robust estimators obtained through a two–step procedure and an initial estimator in order to be able to start the procedure with preliminary estimators resistant to outliers. For the proposed estimator we study its asymptotic behaviour, deriving consistency and their asymptotic distribution. These theoretical results are completed with a simulation study in order to evaluate the behaviour of our robust proposal under different contamination schemes and in finite samples. On the other hand, we introduce a family of robust tests to check hypotheses involving the linear component parameter β₀ using a Wald–type statistic based on the proposed estimator. We derive its asymptotic distribution under the null hypothesis and we carried out a preliminary simulation study to evaluate the behaviour of the proposed test. [fórmula aproximada, revisar la misma en el original]Fil: Statti, María Florencia. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesBianco, Ana María2023-04-14info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_db06info:ar-repo/semantics/tesisDoctoralapplication/pdfhttps://hdl.handle.net/20.500.12110/tesis_n7296_Stattispainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-29T13:42:09Ztesis:tesis_n7296_StattiInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-29 13:42:10.988Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Inferencia robusta para modelos parcialmente lineales de índice simple con escala desconocida
Robust inference for partially linear single index models with unknown scale
title Inferencia robusta para modelos parcialmente lineales de índice simple con escala desconocida
spellingShingle Inferencia robusta para modelos parcialmente lineales de índice simple con escala desconocida
Statti, María Florencia
MODELO PARCIALMENTE LINEAL DE INDICE SIMPLE
ESTIMACION ROBUSTA
COMPORTAMIENTO ASINTOTICO
TESTS DE HIPOTESIS ROBUSTOS
PARTIALLY LINEAR SINGLE INDEX MODEL
ROBUST ESTIMATION
ASYMPTOTIC BEHAVIOUR
ROBUST HYPOTHESES TESTING
title_short Inferencia robusta para modelos parcialmente lineales de índice simple con escala desconocida
title_full Inferencia robusta para modelos parcialmente lineales de índice simple con escala desconocida
title_fullStr Inferencia robusta para modelos parcialmente lineales de índice simple con escala desconocida
title_full_unstemmed Inferencia robusta para modelos parcialmente lineales de índice simple con escala desconocida
title_sort Inferencia robusta para modelos parcialmente lineales de índice simple con escala desconocida
dc.creator.none.fl_str_mv Statti, María Florencia
author Statti, María Florencia
author_facet Statti, María Florencia
author_role author
dc.contributor.none.fl_str_mv Bianco, Ana María
dc.subject.none.fl_str_mv MODELO PARCIALMENTE LINEAL DE INDICE SIMPLE
ESTIMACION ROBUSTA
COMPORTAMIENTO ASINTOTICO
TESTS DE HIPOTESIS ROBUSTOS
PARTIALLY LINEAR SINGLE INDEX MODEL
ROBUST ESTIMATION
ASYMPTOTIC BEHAVIOUR
ROBUST HYPOTHESES TESTING
topic MODELO PARCIALMENTE LINEAL DE INDICE SIMPLE
ESTIMACION ROBUSTA
COMPORTAMIENTO ASINTOTICO
TESTS DE HIPOTESIS ROBUSTOS
PARTIALLY LINEAR SINGLE INDEX MODEL
ROBUST ESTIMATION
ASYMPTOTIC BEHAVIOUR
ROBUST HYPOTHESES TESTING
dc.description.none.fl_txt_mv En el problema de regresión, un clásico en Estadística, se desea encontrar una relación funcional entre una variable de respuesta y un conjunto de covariables o variables explicativas. Uno de los modelos paramétricos más difundidos es el modelo lineal y una alternativa muy conocida es la de los modelos no paramétricos. Ambos representan dos ramas muy importantes del análisis de regresión. Lo mejor de los dos mundos puede encontrarse en opciones semiparamétricas, tal es el caso del Modelo Parcialmente Lineal de Índice Simple en el que se combinan ambos enfoques. Por un lado, este modelo asume que la variable de respuesta y se relaciona con dos vectores de covariables x ∈ Rp y t ∈ Rq satisfaciendo la ecuación y = β t ₀x + η ₀(θt ₀t) + σ ₀ε , donde la función η0 : I → R, I intervalo real acotado, el vector de parámetros (β ₀,θ ₀) ∈R p × R q y el parámetro nuisance σ ₀ son desconocidos. Asumimos que ∥θ₀∥ = 1 y que su primera componente es positiva, a los fines de identificabilidad. Este tipo de modelos tienen un gran potencial en las aplicaciones cuando se piensa en ajustar una regresión no paramétrica múltiple, ya que a través del índice simple logran reducir a uno la dimensionalidad de la componente no paramétrica y permite, al mismo tiempo, capturar una posible relación no lineal entre y y t a través de la función η ₀. Por otro lado, es bien sabido que los métodos de estimación clásica suelen ser altamente sensibles a la presencia de datos atípicos y por este motivo son necesarios procedimientos alternativas robustos. El principal objetivo de esta Tesis es estudiar métodos de inferencia robustos para el Modelo Parcialmente Lineal de Índice Simple. Para ello proponemos una familia de estimadores robustos obtenidos con un procedimiento de dos pasos y un estimador inicial a fin de poder comenzar el procedimiento con estimadores preliminares resistentes a datos atípicos. Para el estimador propuesto estudiamos su comportamiento asintótico, deduciendo la consistencia y la distribución asintótica. Estos resultados teóricos se completan con un estudio de simulación con el objetivo de evaluar el comportamiento de la propuesta robusta frente a distintas contaminaciones y en muestras finitas. Por otro lado, introducimos una familia de tests robustos para chequear hipótesis que involucren al parámetro de la componente lineal β ₀ utilizando un estadístico de tipo Wald basado en el estimador propuesto. Deducimos su distribución asintótica bajo la hipótesis nula y realizamos un estudio de simulación preliminar para evaluar el comportamiento de los tests propuestos. [fórmula aproximada, revisar la misma en el original]
In regression analysis, a classic topic in Statistics, it is desired to find a functional relationship between a response variable and a set of covariates or explanatory variables. One of the most widespread parametric models is the linear one, while non–parametric models are a very wellknown alternative. They both represent two very important branches of regression analysis. The best of both worlds can be found among semiparametric models, as it is the case of Single Index Partially Linear Model, where both approaches are combined. In this model it is assumed that the response variable y is related to two covariate vectors x ∈ Rp and t ∈ Rq through the equation y = β t ₀x + η ₀(θt ₀t) + σ ₀ε , where the univariate real function η0 : I → R, with I a bounded real interval, the vector of parameters (β₀, θ₀) ∈ Rp × Rq and the nuisance parameter σ₀ are unknown. We assume that ∥θ₀∥ = 1 and that its first component is positive, for identifiability purposes. These models have great potential in the case of multiple non–parametric regression, since they manage to reduce the dimensionality of the non–parametric component to 1 through the single index and at the same time, capture a possible non–linear relationship between y and t through the function η0. It is known that classical estimation methods are usually highly sensitive to the presence of outliers and robust procedures are welcome in this scenario. The main objective of this thesis is to study robust inference methods for the Partially Linear Single Index Model. For this, we propose a family of robust estimators obtained through a two–step procedure and an initial estimator in order to be able to start the procedure with preliminary estimators resistant to outliers. For the proposed estimator we study its asymptotic behaviour, deriving consistency and their asymptotic distribution. These theoretical results are completed with a simulation study in order to evaluate the behaviour of our robust proposal under different contamination schemes and in finite samples. On the other hand, we introduce a family of robust tests to check hypotheses involving the linear component parameter β₀ using a Wald–type statistic based on the proposed estimator. We derive its asymptotic distribution under the null hypothesis and we carried out a preliminary simulation study to evaluate the behaviour of the proposed test. [fórmula aproximada, revisar la misma en el original]
Fil: Statti, María Florencia. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description En el problema de regresión, un clásico en Estadística, se desea encontrar una relación funcional entre una variable de respuesta y un conjunto de covariables o variables explicativas. Uno de los modelos paramétricos más difundidos es el modelo lineal y una alternativa muy conocida es la de los modelos no paramétricos. Ambos representan dos ramas muy importantes del análisis de regresión. Lo mejor de los dos mundos puede encontrarse en opciones semiparamétricas, tal es el caso del Modelo Parcialmente Lineal de Índice Simple en el que se combinan ambos enfoques. Por un lado, este modelo asume que la variable de respuesta y se relaciona con dos vectores de covariables x ∈ Rp y t ∈ Rq satisfaciendo la ecuación y = β t ₀x + η ₀(θt ₀t) + σ ₀ε , donde la función η0 : I → R, I intervalo real acotado, el vector de parámetros (β ₀,θ ₀) ∈R p × R q y el parámetro nuisance σ ₀ son desconocidos. Asumimos que ∥θ₀∥ = 1 y que su primera componente es positiva, a los fines de identificabilidad. Este tipo de modelos tienen un gran potencial en las aplicaciones cuando se piensa en ajustar una regresión no paramétrica múltiple, ya que a través del índice simple logran reducir a uno la dimensionalidad de la componente no paramétrica y permite, al mismo tiempo, capturar una posible relación no lineal entre y y t a través de la función η ₀. Por otro lado, es bien sabido que los métodos de estimación clásica suelen ser altamente sensibles a la presencia de datos atípicos y por este motivo son necesarios procedimientos alternativas robustos. El principal objetivo de esta Tesis es estudiar métodos de inferencia robustos para el Modelo Parcialmente Lineal de Índice Simple. Para ello proponemos una familia de estimadores robustos obtenidos con un procedimiento de dos pasos y un estimador inicial a fin de poder comenzar el procedimiento con estimadores preliminares resistentes a datos atípicos. Para el estimador propuesto estudiamos su comportamiento asintótico, deduciendo la consistencia y la distribución asintótica. Estos resultados teóricos se completan con un estudio de simulación con el objetivo de evaluar el comportamiento de la propuesta robusta frente a distintas contaminaciones y en muestras finitas. Por otro lado, introducimos una familia de tests robustos para chequear hipótesis que involucren al parámetro de la componente lineal β ₀ utilizando un estadístico de tipo Wald basado en el estimador propuesto. Deducimos su distribución asintótica bajo la hipótesis nula y realizamos un estudio de simulación preliminar para evaluar el comportamiento de los tests propuestos. [fórmula aproximada, revisar la misma en el original]
publishDate 2023
dc.date.none.fl_str_mv 2023-04-14
dc.type.none.fl_str_mv info:eu-repo/semantics/doctoralThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_db06
info:ar-repo/semantics/tesisDoctoral
format doctoralThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/tesis_n7296_Statti
url https://hdl.handle.net/20.500.12110/tesis_n7296_Statti
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1844618719610798080
score 13.070432