Data mining y simulación en evaluaciones de biodiversidad

Autores
Santa María, Cristóbal Raúl; Soria, Marcelo Abel; López, Luis; Martínez, Pablo Witold; Cacho Mendoza, Ariel
Año de publicación
2014
Idioma
español castellano
Tipo de recurso
informe técnico
Estado
versión aceptada
Descripción
La investigación realizada se refiere a mediciones de biodiversidad en relevamientos metagenómicos. La secuenciación de ADN permite contar con información procedente de una comunidad microbiológica en cantidad suficiente como para intentar establecer parámetros de riqueza y diversidad de taxones de la población. A partir de una muestra de secuencias de ADN de un gen marcado es posible inferir la cantidad de especies, o en general taxones, presentes en la comunidad y su distribución. Esta inferencia ofrece dificultades que el trabajo ha intentado superar. Es usual que la inferencia estadística de la riqueza biológica por técnicas no paramétricas subestime los valores reales que presenta la población. Se propone entonces un algoritmo de recuento de especies (ARE) que mejora sensiblemente la estimación Ante la imposibilidad fáctica, tecnológica y económica, de contar con secuencias correspondientes al total de una población, el testeo de los resultados obtenidos se realizó construyendo una población simulada basada en una distribución de Fischer de las especies. También se tomaron submuestras de una muestra de gran tamaño cuya riqueza real era conocida y se testeo la eficiencia del algoritmo bajo tal situación. Finalmente el proyecto abordó la programación y paralelización del procedimiento ARE en lenguaje C lo que abrevió los tiempos de ejecución requeridos por los programas prototipo que habían sido realizados con software R. Se considera haber obtenido un procedimiento que constituye una forma sustancialmente mejorada de evaluación de riqueza para las comunidades microbiológicas, a la vez eficiente también en su cálculo computacional y con sensible impacto en el ámbito de los estudios de biodiversidad referida a microorganismos presentes en suelos, atmósfera o en el medio interno humano y animal.
Fil: Santa María, Cristóbal Raúl. Universidad Nacional de La Matanza; Argentina.
Fil: Soria, Marcelo Abel. Universidad de Buenos Aires. Facultad de Agronomía. Cátedra de Microbiología Agrícola; Argentina.
Fil: López, Luis. Universidad Nacional de La Matanza; Argentina.
Fil: Martínez, Pablo Witold. Universidad Nacional de La Matanza; Argentina.
Fil: Cacho Mendoza, Ariel. Universidad Nacional de La Matanza; Argentina.
Materia
BIODIVERSIDAD
ALGORITMOS
MINERIA DE DATOS
GENOMICA
SOFTWARE
006.312
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
Repositorio Digital UNLaM
Institución
Universidad Nacional de La Matanza
OAI Identificador
oai:repositoriocyt.unlam.edu.ar:123456789/308

id RDUNLAM_a3d9b3d1045532f71338f5d6deee890b
oai_identifier_str oai:repositoriocyt.unlam.edu.ar:123456789/308
network_acronym_str RDUNLAM
repository_id_str a
network_name_str Repositorio Digital UNLaM
spelling Data mining y simulación en evaluaciones de biodiversidadSanta María, Cristóbal RaúlSoria, Marcelo AbelLópez, LuisMartínez, Pablo WitoldCacho Mendoza, ArielBIODIVERSIDADALGORITMOSMINERIA DE DATOSGENOMICASOFTWARE006.312La investigación realizada se refiere a mediciones de biodiversidad en relevamientos metagenómicos. La secuenciación de ADN permite contar con información procedente de una comunidad microbiológica en cantidad suficiente como para intentar establecer parámetros de riqueza y diversidad de taxones de la población. A partir de una muestra de secuencias de ADN de un gen marcado es posible inferir la cantidad de especies, o en general taxones, presentes en la comunidad y su distribución. Esta inferencia ofrece dificultades que el trabajo ha intentado superar. Es usual que la inferencia estadística de la riqueza biológica por técnicas no paramétricas subestime los valores reales que presenta la población. Se propone entonces un algoritmo de recuento de especies (ARE) que mejora sensiblemente la estimación Ante la imposibilidad fáctica, tecnológica y económica, de contar con secuencias correspondientes al total de una población, el testeo de los resultados obtenidos se realizó construyendo una población simulada basada en una distribución de Fischer de las especies. También se tomaron submuestras de una muestra de gran tamaño cuya riqueza real era conocida y se testeo la eficiencia del algoritmo bajo tal situación. Finalmente el proyecto abordó la programación y paralelización del procedimiento ARE en lenguaje C lo que abrevió los tiempos de ejecución requeridos por los programas prototipo que habían sido realizados con software R. Se considera haber obtenido un procedimiento que constituye una forma sustancialmente mejorada de evaluación de riqueza para las comunidades microbiológicas, a la vez eficiente también en su cálculo computacional y con sensible impacto en el ámbito de los estudios de biodiversidad referida a microorganismos presentes en suelos, atmósfera o en el medio interno humano y animal.Fil: Santa María, Cristóbal Raúl. Universidad Nacional de La Matanza; Argentina.Fil: Soria, Marcelo Abel. Universidad de Buenos Aires. Facultad de Agronomía. Cátedra de Microbiología Agrícola; Argentina.Fil: López, Luis. Universidad Nacional de La Matanza; Argentina.Fil: Martínez, Pablo Witold. Universidad Nacional de La Matanza; Argentina.Fil: Cacho Mendoza, Ariel. Universidad Nacional de La Matanza; Argentina.Universidad Nacional de La MatanzaSanta María, Cristóbal Raúl2014-12-312019-07-15T16:56:46Z2019-07-15T16:56:46Zinfo:eu-repo/semantics/reportinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_18ghinfo:ar-repo/semantics/informeTecnicoapplication/pdfapplication/pdfSanta María, C. R., Soria, M. A., López, L., Martínez, P. W., y Cacho Mendoza, A. (2014). Data mining y simulación en evaluaciones de biodiversidad [archivo PDF]. San Justo: Universidad Nacional de La Matanza. Recuperado de http://repositoriocyt.unlam.edu.ar/handle/123456789/308http://repositoriocyt.unlam.edu.ar/handle/123456789/308spainfo:eu-repo/grantAgreement/SPU/PROINCE/C141/AR. Buenos Aires. San Justo/Data mining y simulación en evaluaciones de biodiversidadinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/Licencia Creative Commons Atribución-NoComercial-CompartirIgual 2.5 Argentina (CC BY-NC-SA 2.5 AR)reponame:Repositorio Digital UNLaMinstname:Universidad Nacional de La Matanza2025-09-04T11:12:33Zoai:repositoriocyt.unlam.edu.ar:123456789/308instacron:UNLaMInstitucionalhttps://repositoriocyt.unlam.edu.ar/Universidad públicaNo correspondehttps://repositoriocyt.unlam.edu.ar/oaicytunlam@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:a2025-09-04 11:12:33.591Repositorio Digital UNLaM - Universidad Nacional de La Matanzafalse
dc.title.none.fl_str_mv Data mining y simulación en evaluaciones de biodiversidad
title Data mining y simulación en evaluaciones de biodiversidad
spellingShingle Data mining y simulación en evaluaciones de biodiversidad
Santa María, Cristóbal Raúl
BIODIVERSIDAD
ALGORITMOS
MINERIA DE DATOS
GENOMICA
SOFTWARE
006.312
title_short Data mining y simulación en evaluaciones de biodiversidad
title_full Data mining y simulación en evaluaciones de biodiversidad
title_fullStr Data mining y simulación en evaluaciones de biodiversidad
title_full_unstemmed Data mining y simulación en evaluaciones de biodiversidad
title_sort Data mining y simulación en evaluaciones de biodiversidad
dc.creator.none.fl_str_mv Santa María, Cristóbal Raúl
Soria, Marcelo Abel
López, Luis
Martínez, Pablo Witold
Cacho Mendoza, Ariel
author Santa María, Cristóbal Raúl
author_facet Santa María, Cristóbal Raúl
Soria, Marcelo Abel
López, Luis
Martínez, Pablo Witold
Cacho Mendoza, Ariel
author_role author
author2 Soria, Marcelo Abel
López, Luis
Martínez, Pablo Witold
Cacho Mendoza, Ariel
author2_role author
author
author
author
dc.contributor.none.fl_str_mv Santa María, Cristóbal Raúl
dc.subject.none.fl_str_mv BIODIVERSIDAD
ALGORITMOS
MINERIA DE DATOS
GENOMICA
SOFTWARE
006.312
topic BIODIVERSIDAD
ALGORITMOS
MINERIA DE DATOS
GENOMICA
SOFTWARE
006.312
dc.description.none.fl_txt_mv La investigación realizada se refiere a mediciones de biodiversidad en relevamientos metagenómicos. La secuenciación de ADN permite contar con información procedente de una comunidad microbiológica en cantidad suficiente como para intentar establecer parámetros de riqueza y diversidad de taxones de la población. A partir de una muestra de secuencias de ADN de un gen marcado es posible inferir la cantidad de especies, o en general taxones, presentes en la comunidad y su distribución. Esta inferencia ofrece dificultades que el trabajo ha intentado superar. Es usual que la inferencia estadística de la riqueza biológica por técnicas no paramétricas subestime los valores reales que presenta la población. Se propone entonces un algoritmo de recuento de especies (ARE) que mejora sensiblemente la estimación Ante la imposibilidad fáctica, tecnológica y económica, de contar con secuencias correspondientes al total de una población, el testeo de los resultados obtenidos se realizó construyendo una población simulada basada en una distribución de Fischer de las especies. También se tomaron submuestras de una muestra de gran tamaño cuya riqueza real era conocida y se testeo la eficiencia del algoritmo bajo tal situación. Finalmente el proyecto abordó la programación y paralelización del procedimiento ARE en lenguaje C lo que abrevió los tiempos de ejecución requeridos por los programas prototipo que habían sido realizados con software R. Se considera haber obtenido un procedimiento que constituye una forma sustancialmente mejorada de evaluación de riqueza para las comunidades microbiológicas, a la vez eficiente también en su cálculo computacional y con sensible impacto en el ámbito de los estudios de biodiversidad referida a microorganismos presentes en suelos, atmósfera o en el medio interno humano y animal.
Fil: Santa María, Cristóbal Raúl. Universidad Nacional de La Matanza; Argentina.
Fil: Soria, Marcelo Abel. Universidad de Buenos Aires. Facultad de Agronomía. Cátedra de Microbiología Agrícola; Argentina.
Fil: López, Luis. Universidad Nacional de La Matanza; Argentina.
Fil: Martínez, Pablo Witold. Universidad Nacional de La Matanza; Argentina.
Fil: Cacho Mendoza, Ariel. Universidad Nacional de La Matanza; Argentina.
description La investigación realizada se refiere a mediciones de biodiversidad en relevamientos metagenómicos. La secuenciación de ADN permite contar con información procedente de una comunidad microbiológica en cantidad suficiente como para intentar establecer parámetros de riqueza y diversidad de taxones de la población. A partir de una muestra de secuencias de ADN de un gen marcado es posible inferir la cantidad de especies, o en general taxones, presentes en la comunidad y su distribución. Esta inferencia ofrece dificultades que el trabajo ha intentado superar. Es usual que la inferencia estadística de la riqueza biológica por técnicas no paramétricas subestime los valores reales que presenta la población. Se propone entonces un algoritmo de recuento de especies (ARE) que mejora sensiblemente la estimación Ante la imposibilidad fáctica, tecnológica y económica, de contar con secuencias correspondientes al total de una población, el testeo de los resultados obtenidos se realizó construyendo una población simulada basada en una distribución de Fischer de las especies. También se tomaron submuestras de una muestra de gran tamaño cuya riqueza real era conocida y se testeo la eficiencia del algoritmo bajo tal situación. Finalmente el proyecto abordó la programación y paralelización del procedimiento ARE en lenguaje C lo que abrevió los tiempos de ejecución requeridos por los programas prototipo que habían sido realizados con software R. Se considera haber obtenido un procedimiento que constituye una forma sustancialmente mejorada de evaluación de riqueza para las comunidades microbiológicas, a la vez eficiente también en su cálculo computacional y con sensible impacto en el ámbito de los estudios de biodiversidad referida a microorganismos presentes en suelos, atmósfera o en el medio interno humano y animal.
publishDate 2014
dc.date.none.fl_str_mv 2014-12-31
2019-07-15T16:56:46Z
2019-07-15T16:56:46Z
dc.type.none.fl_str_mv info:eu-repo/semantics/report
info:eu-repo/semantics/acceptedVersion
http://purl.org/coar/resource_type/c_18gh
info:ar-repo/semantics/informeTecnico
format report
status_str acceptedVersion
dc.identifier.none.fl_str_mv Santa María, C. R., Soria, M. A., López, L., Martínez, P. W., y Cacho Mendoza, A. (2014). Data mining y simulación en evaluaciones de biodiversidad [archivo PDF]. San Justo: Universidad Nacional de La Matanza. Recuperado de http://repositoriocyt.unlam.edu.ar/handle/123456789/308
http://repositoriocyt.unlam.edu.ar/handle/123456789/308
identifier_str_mv Santa María, C. R., Soria, M. A., López, L., Martínez, P. W., y Cacho Mendoza, A. (2014). Data mining y simulación en evaluaciones de biodiversidad [archivo PDF]. San Justo: Universidad Nacional de La Matanza. Recuperado de http://repositoriocyt.unlam.edu.ar/handle/123456789/308
url http://repositoriocyt.unlam.edu.ar/handle/123456789/308
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/grantAgreement/SPU/PROINCE/C141/AR. Buenos Aires. San Justo/Data mining y simulación en evaluaciones de biodiversidad
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Licencia Creative Commons Atribución-NoComercial-CompartirIgual 2.5 Argentina (CC BY-NC-SA 2.5 AR)
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Licencia Creative Commons Atribución-NoComercial-CompartirIgual 2.5 Argentina (CC BY-NC-SA 2.5 AR)
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Universidad Nacional de La Matanza
publisher.none.fl_str_mv Universidad Nacional de La Matanza
dc.source.none.fl_str_mv reponame:Repositorio Digital UNLaM
instname:Universidad Nacional de La Matanza
reponame_str Repositorio Digital UNLaM
collection Repositorio Digital UNLaM
instname_str Universidad Nacional de La Matanza
repository.name.fl_str_mv Repositorio Digital UNLaM - Universidad Nacional de La Matanza
repository.mail.fl_str_mv cytunlam@gmail.com
_version_ 1842344025203408896
score 12.623145