Evaluación de la calidad de las aguas superficiales mediante técnicas de estadística multivariante: un estudio de caso en la cuenca del río Paute, al sur de Ecuador

Autores
Sotomayor, Gonzalo
Año de publicación
2016
Idioma
español castellano
Tipo de recurso
tesis de maestría
Estado
versión aceptada
Colaborador/a o director/a de tesis
Hampel, Henrietta
Romanazzi, Pablo Gustavo
Descripción
Diferentes técnicas de estadística multivariante como el método de clasificación del vecino más cercano (k – NN) a través de algoritmos genéticos (GAs), un análisis de componentes principales (PCA) y regresiones múltiples (MR), se llevaron a cabo para evaluar e interpretar bajo el marco conceptual de la Ecohidrología una gran y compleja matriz de datos de calidad de agua. Los datos se obtuvieron durante cinco años (2008, 2010-2013) de muestreo en la cuenca del Río Paute al sur de Ecuador. Treinta y cuatro variables físico-químicas, microbiológicas, geomorfológicas y biológicas (macroinvertebrados bentónicos) fueron monitoreadas en 64 sitios (10234 observaciones). El análisis k-NN a través de GAs se utilizó para conocer cuál de 6 índices bióticos dados por los macrozoobentos es, en términos de ajuste matemático para un modelo de clasificación, el óptimo. Se obtuvo como resultado que una combinación de puntajes del Andean Biotic Index (ABI; zonas > 2000 m.s.n.m.) y el Biological Monitoring Working Party calibrado para Colombia (BMWP/Col; zonas < 2000 m.s.n.m.) es la variable de respuesta biológica más adecuada. Una redistribución de las clases de los índices bióticos mostró que matemáticamente estas se optimizan si son tres (dadas por los percentiles 33,33 % y 66,66 % del índice biótico) y no cinco. Se aplicó un PCA sobre tres grupos de calidad de agua establecidos por los percentiles 33,33 % y 66,66 % del índice biótico seleccionado (combinación ABI + BMWP/Col), siendo las variables que mayoritariamente explican a las mejores clases y su estado de buena integridad ecológica (clase 1) la presencia de vegetación de bosque de ribera y la alta heterogeneidad del lecho. Por el contrario, elevados niveles de coliformes fecales, demanda bioquímica de oxígeno (DBO), amonio, turbiedad, pH y temperatura del agua, más bajas valoraciones de calidad de hábitat; son condiciones que se asocian con clases de aguas contaminadas (clase 3). Finalmente, un método de validación para los resultados del PCA basado en Regresiones Múltiples se probó con éxito enfatizando así la fiabilidad científica del estudio.
Multivariate statistics techniques such as k - Nearest Neighbor Method (k - NN) with genetic algorithms (GAs), principal component analysis (PCA) and multiple regressions (MR), were applied in order to evaluate and interpret, from an Ecohydrological viewpoint, a large complex matrix of water quality data collected during five years (2008, 2010-2013) at the Paute river basin (southern part of Ecuador). Thirty four physical, chemical, microbiological, geomorphological and biological (benthic macroinvertebrates) variables at 64 different sites (10234 observations) were assessed. A first approach was carried out to identify which of the six biotic indices obtained through benthic macroinvertebrates is the optimum for a mathematical adjustment in a classification model (k-NN by GAs). As a result, the combination of the Andean Biotic Index scores (ABI; elevation > 2000 meters above the sea level – m.a.s.l) and the Biological Monitoring Working Party calibrated for Colombia (BMWP / Col, elevations < 2000 m.a.s.l) was regarded as being the most appropriate biotic index (biological response variable). A redistribution of the classes of biotic indexes showed that, mathematically, these are optimized when the classification system has three rather than five classes, expressed by percentiles (33,33 % and 66,66 %). PCA was applied at three groups of water quality data defined by percentiles of the most appropriate biotic index (ABI + BMWP / Col). The variables that explain the status of good ecological integrity (class 1) are the presence of riparian vegetation and the high heterogeneity of streambed. Contaminated water was related to levels of fecal coliform, biochemical oxygen demand, ammonium, turbidity, pH and temperature, and was classified (bioassessed) as bad habitat (class 3). Finally, an independent method based on multiple regressions for validation of results of the PCA was successfully tested, emphasising the scientific reliability of the study.
Magister en Ecohidrología
Universidad Nacional de La Plata
Facultad de Ciencias Naturales y Museo
Materia
Ciencias Naturales
Ingeniería
Ecuador
estadística multivariante
Cuencas Hidrográficas
Aguas Superficiales
cuenca del río Paute
respuesta biológica
multivariate statistics
Paute river basin
biological response variable
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-nd/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/53959

id SEDICI_7e95ad8d5e6bb77d3c0008b3451830cd
oai_identifier_str oai:sedici.unlp.edu.ar:10915/53959
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Evaluación de la calidad de las aguas superficiales mediante técnicas de estadística multivariante: un estudio de caso en la cuenca del río Paute, al sur de EcuadorSotomayor, GonzaloCiencias NaturalesIngenieríaEcuadorestadística multivarianteCuencas HidrográficasAguas Superficialescuenca del río Pauterespuesta biológicamultivariate statisticsPaute river basinbiological response variableDiferentes técnicas de estadística multivariante como el método de clasificación del vecino más cercano (k – NN) a través de algoritmos genéticos (GAs), un análisis de componentes principales (PCA) y regresiones múltiples (MR), se llevaron a cabo para evaluar e interpretar bajo el marco conceptual de la Ecohidrología una gran y compleja matriz de datos de calidad de agua. Los datos se obtuvieron durante cinco años (2008, 2010-2013) de muestreo en la cuenca del Río Paute al sur de Ecuador. Treinta y cuatro variables físico-químicas, microbiológicas, geomorfológicas y biológicas (macroinvertebrados bentónicos) fueron monitoreadas en 64 sitios (10234 observaciones). El análisis k-NN a través de GAs se utilizó para conocer cuál de 6 índices bióticos dados por los macrozoobentos es, en términos de ajuste matemático para un modelo de clasificación, el óptimo. Se obtuvo como resultado que una combinación de puntajes del Andean Biotic Index (ABI; zonas > 2000 m.s.n.m.) y el Biological Monitoring Working Party calibrado para Colombia (BMWP/Col; zonas < 2000 m.s.n.m.) es la variable de respuesta biológica más adecuada. Una redistribución de las clases de los índices bióticos mostró que matemáticamente estas se optimizan si son tres (dadas por los percentiles 33,33 % y 66,66 % del índice biótico) y no cinco. Se aplicó un PCA sobre tres grupos de calidad de agua establecidos por los percentiles 33,33 % y 66,66 % del índice biótico seleccionado (combinación ABI + BMWP/Col), siendo las variables que mayoritariamente explican a las mejores clases y su estado de buena integridad ecológica (clase 1) la presencia de vegetación de bosque de ribera y la alta heterogeneidad del lecho. Por el contrario, elevados niveles de coliformes fecales, demanda bioquímica de oxígeno (DBO), amonio, turbiedad, pH y temperatura del agua, más bajas valoraciones de calidad de hábitat; son condiciones que se asocian con clases de aguas contaminadas (clase 3). Finalmente, un método de validación para los resultados del PCA basado en Regresiones Múltiples se probó con éxito enfatizando así la fiabilidad científica del estudio.Multivariate statistics techniques such as k - Nearest Neighbor Method (k - NN) with genetic algorithms (GAs), principal component analysis (PCA) and multiple regressions (MR), were applied in order to evaluate and interpret, from an Ecohydrological viewpoint, a large complex matrix of water quality data collected during five years (2008, 2010-2013) at the Paute river basin (southern part of Ecuador). Thirty four physical, chemical, microbiological, geomorphological and biological (benthic macroinvertebrates) variables at 64 different sites (10234 observations) were assessed. A first approach was carried out to identify which of the six biotic indices obtained through benthic macroinvertebrates is the optimum for a mathematical adjustment in a classification model (k-NN by GAs). As a result, the combination of the Andean Biotic Index scores (ABI; elevation > 2000 meters above the sea level – m.a.s.l) and the Biological Monitoring Working Party calibrated for Colombia (BMWP / Col, elevations < 2000 m.a.s.l) was regarded as being the most appropriate biotic index (biological response variable). A redistribution of the classes of biotic indexes showed that, mathematically, these are optimized when the classification system has three rather than five classes, expressed by percentiles (33,33 % and 66,66 %). PCA was applied at three groups of water quality data defined by percentiles of the most appropriate biotic index (ABI + BMWP / Col). The variables that explain the status of good ecological integrity (class 1) are the presence of riparian vegetation and the high heterogeneity of streambed. Contaminated water was related to levels of fecal coliform, biochemical oxygen demand, ammonium, turbidity, pH and temperature, and was classified (bioassessed) as bad habitat (class 3). Finally, an independent method based on multiple regressions for validation of results of the PCA was successfully tested, emphasising the scientific reliability of the study.Magister en EcohidrologíaUniversidad Nacional de La PlataFacultad de Ciencias Naturales y MuseoHampel, HenriettaRomanazzi, Pablo Gustavo2016-08-05info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTesis de maestriahttp://purl.org/coar/resource_type/c_bdccinfo:ar-repo/semantics/tesisDeMaestriaapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/53959https://doi.org/10.35537/10915/53959spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International (CC BY-NC-ND 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-29T11:05:13Zoai:sedici.unlp.edu.ar:10915/53959Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-29 11:05:14.054SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Evaluación de la calidad de las aguas superficiales mediante técnicas de estadística multivariante: un estudio de caso en la cuenca del río Paute, al sur de Ecuador
title Evaluación de la calidad de las aguas superficiales mediante técnicas de estadística multivariante: un estudio de caso en la cuenca del río Paute, al sur de Ecuador
spellingShingle Evaluación de la calidad de las aguas superficiales mediante técnicas de estadística multivariante: un estudio de caso en la cuenca del río Paute, al sur de Ecuador
Sotomayor, Gonzalo
Ciencias Naturales
Ingeniería
Ecuador
estadística multivariante
Cuencas Hidrográficas
Aguas Superficiales
cuenca del río Paute
respuesta biológica
multivariate statistics
Paute river basin
biological response variable
title_short Evaluación de la calidad de las aguas superficiales mediante técnicas de estadística multivariante: un estudio de caso en la cuenca del río Paute, al sur de Ecuador
title_full Evaluación de la calidad de las aguas superficiales mediante técnicas de estadística multivariante: un estudio de caso en la cuenca del río Paute, al sur de Ecuador
title_fullStr Evaluación de la calidad de las aguas superficiales mediante técnicas de estadística multivariante: un estudio de caso en la cuenca del río Paute, al sur de Ecuador
title_full_unstemmed Evaluación de la calidad de las aguas superficiales mediante técnicas de estadística multivariante: un estudio de caso en la cuenca del río Paute, al sur de Ecuador
title_sort Evaluación de la calidad de las aguas superficiales mediante técnicas de estadística multivariante: un estudio de caso en la cuenca del río Paute, al sur de Ecuador
dc.creator.none.fl_str_mv Sotomayor, Gonzalo
author Sotomayor, Gonzalo
author_facet Sotomayor, Gonzalo
author_role author
dc.contributor.none.fl_str_mv Hampel, Henrietta
Romanazzi, Pablo Gustavo
dc.subject.none.fl_str_mv Ciencias Naturales
Ingeniería
Ecuador
estadística multivariante
Cuencas Hidrográficas
Aguas Superficiales
cuenca del río Paute
respuesta biológica
multivariate statistics
Paute river basin
biological response variable
topic Ciencias Naturales
Ingeniería
Ecuador
estadística multivariante
Cuencas Hidrográficas
Aguas Superficiales
cuenca del río Paute
respuesta biológica
multivariate statistics
Paute river basin
biological response variable
dc.description.none.fl_txt_mv Diferentes técnicas de estadística multivariante como el método de clasificación del vecino más cercano (k – NN) a través de algoritmos genéticos (GAs), un análisis de componentes principales (PCA) y regresiones múltiples (MR), se llevaron a cabo para evaluar e interpretar bajo el marco conceptual de la Ecohidrología una gran y compleja matriz de datos de calidad de agua. Los datos se obtuvieron durante cinco años (2008, 2010-2013) de muestreo en la cuenca del Río Paute al sur de Ecuador. Treinta y cuatro variables físico-químicas, microbiológicas, geomorfológicas y biológicas (macroinvertebrados bentónicos) fueron monitoreadas en 64 sitios (10234 observaciones). El análisis k-NN a través de GAs se utilizó para conocer cuál de 6 índices bióticos dados por los macrozoobentos es, en términos de ajuste matemático para un modelo de clasificación, el óptimo. Se obtuvo como resultado que una combinación de puntajes del Andean Biotic Index (ABI; zonas > 2000 m.s.n.m.) y el Biological Monitoring Working Party calibrado para Colombia (BMWP/Col; zonas < 2000 m.s.n.m.) es la variable de respuesta biológica más adecuada. Una redistribución de las clases de los índices bióticos mostró que matemáticamente estas se optimizan si son tres (dadas por los percentiles 33,33 % y 66,66 % del índice biótico) y no cinco. Se aplicó un PCA sobre tres grupos de calidad de agua establecidos por los percentiles 33,33 % y 66,66 % del índice biótico seleccionado (combinación ABI + BMWP/Col), siendo las variables que mayoritariamente explican a las mejores clases y su estado de buena integridad ecológica (clase 1) la presencia de vegetación de bosque de ribera y la alta heterogeneidad del lecho. Por el contrario, elevados niveles de coliformes fecales, demanda bioquímica de oxígeno (DBO), amonio, turbiedad, pH y temperatura del agua, más bajas valoraciones de calidad de hábitat; son condiciones que se asocian con clases de aguas contaminadas (clase 3). Finalmente, un método de validación para los resultados del PCA basado en Regresiones Múltiples se probó con éxito enfatizando así la fiabilidad científica del estudio.
Multivariate statistics techniques such as k - Nearest Neighbor Method (k - NN) with genetic algorithms (GAs), principal component analysis (PCA) and multiple regressions (MR), were applied in order to evaluate and interpret, from an Ecohydrological viewpoint, a large complex matrix of water quality data collected during five years (2008, 2010-2013) at the Paute river basin (southern part of Ecuador). Thirty four physical, chemical, microbiological, geomorphological and biological (benthic macroinvertebrates) variables at 64 different sites (10234 observations) were assessed. A first approach was carried out to identify which of the six biotic indices obtained through benthic macroinvertebrates is the optimum for a mathematical adjustment in a classification model (k-NN by GAs). As a result, the combination of the Andean Biotic Index scores (ABI; elevation > 2000 meters above the sea level – m.a.s.l) and the Biological Monitoring Working Party calibrated for Colombia (BMWP / Col, elevations < 2000 m.a.s.l) was regarded as being the most appropriate biotic index (biological response variable). A redistribution of the classes of biotic indexes showed that, mathematically, these are optimized when the classification system has three rather than five classes, expressed by percentiles (33,33 % and 66,66 %). PCA was applied at three groups of water quality data defined by percentiles of the most appropriate biotic index (ABI + BMWP / Col). The variables that explain the status of good ecological integrity (class 1) are the presence of riparian vegetation and the high heterogeneity of streambed. Contaminated water was related to levels of fecal coliform, biochemical oxygen demand, ammonium, turbidity, pH and temperature, and was classified (bioassessed) as bad habitat (class 3). Finally, an independent method based on multiple regressions for validation of results of the PCA was successfully tested, emphasising the scientific reliability of the study.
Magister en Ecohidrología
Universidad Nacional de La Plata
Facultad de Ciencias Naturales y Museo
description Diferentes técnicas de estadística multivariante como el método de clasificación del vecino más cercano (k – NN) a través de algoritmos genéticos (GAs), un análisis de componentes principales (PCA) y regresiones múltiples (MR), se llevaron a cabo para evaluar e interpretar bajo el marco conceptual de la Ecohidrología una gran y compleja matriz de datos de calidad de agua. Los datos se obtuvieron durante cinco años (2008, 2010-2013) de muestreo en la cuenca del Río Paute al sur de Ecuador. Treinta y cuatro variables físico-químicas, microbiológicas, geomorfológicas y biológicas (macroinvertebrados bentónicos) fueron monitoreadas en 64 sitios (10234 observaciones). El análisis k-NN a través de GAs se utilizó para conocer cuál de 6 índices bióticos dados por los macrozoobentos es, en términos de ajuste matemático para un modelo de clasificación, el óptimo. Se obtuvo como resultado que una combinación de puntajes del Andean Biotic Index (ABI; zonas > 2000 m.s.n.m.) y el Biological Monitoring Working Party calibrado para Colombia (BMWP/Col; zonas < 2000 m.s.n.m.) es la variable de respuesta biológica más adecuada. Una redistribución de las clases de los índices bióticos mostró que matemáticamente estas se optimizan si son tres (dadas por los percentiles 33,33 % y 66,66 % del índice biótico) y no cinco. Se aplicó un PCA sobre tres grupos de calidad de agua establecidos por los percentiles 33,33 % y 66,66 % del índice biótico seleccionado (combinación ABI + BMWP/Col), siendo las variables que mayoritariamente explican a las mejores clases y su estado de buena integridad ecológica (clase 1) la presencia de vegetación de bosque de ribera y la alta heterogeneidad del lecho. Por el contrario, elevados niveles de coliformes fecales, demanda bioquímica de oxígeno (DBO), amonio, turbiedad, pH y temperatura del agua, más bajas valoraciones de calidad de hábitat; son condiciones que se asocian con clases de aguas contaminadas (clase 3). Finalmente, un método de validación para los resultados del PCA basado en Regresiones Múltiples se probó con éxito enfatizando así la fiabilidad científica del estudio.
publishDate 2016
dc.date.none.fl_str_mv 2016-08-05
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
info:eu-repo/semantics/acceptedVersion
Tesis de maestria
http://purl.org/coar/resource_type/c_bdcc
info:ar-repo/semantics/tesisDeMaestria
format masterThesis
status_str acceptedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/53959
https://doi.org/10.35537/10915/53959
url http://sedici.unlp.edu.ar/handle/10915/53959
https://doi.org/10.35537/10915/53959
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-nd/4.0/
Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International (CC BY-NC-ND 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International (CC BY-NC-ND 4.0)
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1844615921808703489
score 13.070432