Assessing fungal endophyte diversity: a comparative study of three automated metabarcoding pipelines

Autores
Molina, Lucia; Rajchenberg, Mario; Aime, M. Catherine; Pildain, María Belén
Año de publicación
2023
Idioma
inglés
Tipo de recurso
artículo
Estado
versión publicada
Descripción
High-throughput sequencing approaches have become frequent in the study of endophyte communities allowing the cumulative description of fungal diversity in the last decade. However, they brought new challenges to researchers in terms of programming and developing of informatics tools. Currently, there is no consensus concerning the appropriate bioinformatics to process such sequence data. The aim of this study was to compare the performance of three pipelines of two cost-free toolkits designed to be friendly to non-programmer users, and specifically developed for fungal data: AMPtk and PIPITS. The sapwood-inhabiting fungal assemblages of two Nothofagus species from the Patagonian Forests were assessed through metabarcoding of the internal transcribed spacer (ITS) and compared with an extant sequence dataset obtained from culture prospection in the same study sites and trees. The AMPtk toolkit has performed better concerning community description in terms of precision of taxa clustering, mainly due to the DADA2 algorithm; PIPITS evidenced a higher sensitivity in detecting taxa known to be present, hence it is potentially useful for future specific taxa detection surveys. Because of a current lack of information of the reference databases, both bioinformatic toolkits performed poorly as to taxonomy assignment. It is imperative to continue studying these ecosystems to, concomitantly, improve databases and the explanatory potential of the new technologies.
La utilización de la secuenciación de alto rendimiento se ha vuelto frecuente en el estudio de comunidades endófitas. Estas tecnologías han permitido la descripción acumulativa de diversidad fúngica a lo largo de la última década. No obstante, también han implicado nuevos desafíos para los investigadores de las áreas involucradas en términos de la necesidad de contar con herramientas de programación y habilidades desarrolladoras. Hoy en día no existe un consenso sobre las herramientas bioinformáticas más adecuadas para procesar los datos crudos de secuencias que estas tecnologías arrojan. El objetivo de este trabajo fue comparar el rendimiento de tres flujos de trabajo realizados en dos plataformas gratuitas diseñadas para ser amigables con usuarios que no son programadores y desarrolladas específicamente para estudios de hongos: AMPtk y PIPITS. Evaluamos los ensambles de hongos que habitan en la albura de dos especies de Nothofagus de los bosques patagónicos y comparamos el conjunto de datos de metabarcoding del espaciador transcrito interno (ITS) con un conjunto de datos de secuencias existente, obtenido de la prospección de cultivos de los mismos árboles y sitios de estudio. La plataforma AMPtk se desempeñó mejor con respecto a la descripción de la comunidad, en términos de precisión del agrupamiento de taxones, principalmente debido al algoritmo DADA2. El flujo de trabajo PIPITS evidenció una mayor sensibilidad en la detección de taxones conocidos presentes, por lo que es potencialmente útil para futuros estudios que persigan la detección de taxones específicos. Debido a la falta de información que exhiben las bases de datos de referencia sobre el ecosistema en estudio, ambas plataformas tuvieron un desempeño deficiente en cuanto a la asignación de taxonomías. Es imperativo seguir estudiando estos ecosistemas y mejorar las bases de datos para aumentar el potencial explicativo de las nuevas tecnologías.
Fil: Molina, Lucia. Centro de Investigación y Extensión Forestal Andino Patagónico; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina
Fil: Rajchenberg, Mario. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Centro de Investigación y Extensión Forestal Andino Patagónico; Argentina
Fil: Aime, M. Catherine. Purdue University; Estados Unidos
Fil: Pildain, María Belén. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Centro de Investigación y Extensión Forestal Andino Patagónico; Argentina. Universidad Nacional de la Patagonia "San Juan Bosco". Facultad de Ciencias Naturales - Sede Esquel; Argentina
Materia
AMPTK
ENVIRONMENTAL DNA
FUNGAL ENDOPHYTES
NOTHOFAGUS FORESTS
PIPITS
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
CONICET Digital (CONICET)
Institución
Consejo Nacional de Investigaciones Científicas y Técnicas
OAI Identificador
oai:ri.conicet.gov.ar:11336/220355

id CONICETDig_4188f51e2ea42dfb76b25743cf43aac2
oai_identifier_str oai:ri.conicet.gov.ar:11336/220355
network_acronym_str CONICETDig
repository_id_str 3498
network_name_str CONICET Digital (CONICET)
spelling Assessing fungal endophyte diversity: a comparative study of three automated metabarcoding pipelinesEvaluación de la diversidad de endófitos fúngicos: un estudio comparativo de tres flujos de trabajo automatizados de metabarcodingMolina, LuciaRajchenberg, MarioAime, M. CatherinePildain, María BelénAMPTKENVIRONMENTAL DNAFUNGAL ENDOPHYTESNOTHOFAGUS FORESTSPIPITShttps://purl.org/becyt/ford/1.6https://purl.org/becyt/ford/1High-throughput sequencing approaches have become frequent in the study of endophyte communities allowing the cumulative description of fungal diversity in the last decade. However, they brought new challenges to researchers in terms of programming and developing of informatics tools. Currently, there is no consensus concerning the appropriate bioinformatics to process such sequence data. The aim of this study was to compare the performance of three pipelines of two cost-free toolkits designed to be friendly to non-programmer users, and specifically developed for fungal data: AMPtk and PIPITS. The sapwood-inhabiting fungal assemblages of two Nothofagus species from the Patagonian Forests were assessed through metabarcoding of the internal transcribed spacer (ITS) and compared with an extant sequence dataset obtained from culture prospection in the same study sites and trees. The AMPtk toolkit has performed better concerning community description in terms of precision of taxa clustering, mainly due to the DADA2 algorithm; PIPITS evidenced a higher sensitivity in detecting taxa known to be present, hence it is potentially useful for future specific taxa detection surveys. Because of a current lack of information of the reference databases, both bioinformatic toolkits performed poorly as to taxonomy assignment. It is imperative to continue studying these ecosystems to, concomitantly, improve databases and the explanatory potential of the new technologies.La utilización de la secuenciación de alto rendimiento se ha vuelto frecuente en el estudio de comunidades endófitas. Estas tecnologías han permitido la descripción acumulativa de diversidad fúngica a lo largo de la última década. No obstante, también han implicado nuevos desafíos para los investigadores de las áreas involucradas en términos de la necesidad de contar con herramientas de programación y habilidades desarrolladoras. Hoy en día no existe un consenso sobre las herramientas bioinformáticas más adecuadas para procesar los datos crudos de secuencias que estas tecnologías arrojan. El objetivo de este trabajo fue comparar el rendimiento de tres flujos de trabajo realizados en dos plataformas gratuitas diseñadas para ser amigables con usuarios que no son programadores y desarrolladas específicamente para estudios de hongos: AMPtk y PIPITS. Evaluamos los ensambles de hongos que habitan en la albura de dos especies de Nothofagus de los bosques patagónicos y comparamos el conjunto de datos de metabarcoding del espaciador transcrito interno (ITS) con un conjunto de datos de secuencias existente, obtenido de la prospección de cultivos de los mismos árboles y sitios de estudio. La plataforma AMPtk se desempeñó mejor con respecto a la descripción de la comunidad, en términos de precisión del agrupamiento de taxones, principalmente debido al algoritmo DADA2. El flujo de trabajo PIPITS evidenció una mayor sensibilidad en la detección de taxones conocidos presentes, por lo que es potencialmente útil para futuros estudios que persigan la detección de taxones específicos. Debido a la falta de información que exhiben las bases de datos de referencia sobre el ecosistema en estudio, ambas plataformas tuvieron un desempeño deficiente en cuanto a la asignación de taxonomías. Es imperativo seguir estudiando estos ecosistemas y mejorar las bases de datos para aumentar el potencial explicativo de las nuevas tecnologías.Fil: Molina, Lucia. Centro de Investigación y Extensión Forestal Andino Patagónico; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; ArgentinaFil: Rajchenberg, Mario. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Centro de Investigación y Extensión Forestal Andino Patagónico; ArgentinaFil: Aime, M. Catherine. Purdue University; Estados UnidosFil: Pildain, María Belén. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Centro de Investigación y Extensión Forestal Andino Patagónico; Argentina. Universidad Nacional de la Patagonia "San Juan Bosco". Facultad de Ciencias Naturales - Sede Esquel; ArgentinaInstituto de Botánica Darwinion2023-08info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfapplication/pdfhttp://hdl.handle.net/11336/220355Molina, Lucia; Rajchenberg, Mario; Aime, M. Catherine; Pildain, María Belén; Assessing fungal endophyte diversity: a comparative study of three automated metabarcoding pipelines; Instituto de Botánica Darwinion; Darwiniana. Nueva serie; 11; 2; 8-2023; 402-4190011-6793CONICET DigitalCONICETenginfo:eu-repo/semantics/altIdentifier/url/http://www.ojs.darwin.edu.ar/index.php/darwiniana/article/view/1127info:eu-repo/semantics/altIdentifier/doi/10.14522/darwiniana.2023.112.1127info:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/reponame:CONICET Digital (CONICET)instname:Consejo Nacional de Investigaciones Científicas y Técnicas2025-09-29T09:45:48Zoai:ri.conicet.gov.ar:11336/220355instacron:CONICETInstitucionalhttp://ri.conicet.gov.ar/Organismo científico-tecnológicoNo correspondehttp://ri.conicet.gov.ar/oai/requestdasensio@conicet.gov.ar; lcarlino@conicet.gov.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:34982025-09-29 09:45:48.891CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicasfalse
dc.title.none.fl_str_mv Assessing fungal endophyte diversity: a comparative study of three automated metabarcoding pipelines
Evaluación de la diversidad de endófitos fúngicos: un estudio comparativo de tres flujos de trabajo automatizados de metabarcoding
title Assessing fungal endophyte diversity: a comparative study of three automated metabarcoding pipelines
spellingShingle Assessing fungal endophyte diversity: a comparative study of three automated metabarcoding pipelines
Molina, Lucia
AMPTK
ENVIRONMENTAL DNA
FUNGAL ENDOPHYTES
NOTHOFAGUS FORESTS
PIPITS
title_short Assessing fungal endophyte diversity: a comparative study of three automated metabarcoding pipelines
title_full Assessing fungal endophyte diversity: a comparative study of three automated metabarcoding pipelines
title_fullStr Assessing fungal endophyte diversity: a comparative study of three automated metabarcoding pipelines
title_full_unstemmed Assessing fungal endophyte diversity: a comparative study of three automated metabarcoding pipelines
title_sort Assessing fungal endophyte diversity: a comparative study of three automated metabarcoding pipelines
dc.creator.none.fl_str_mv Molina, Lucia
Rajchenberg, Mario
Aime, M. Catherine
Pildain, María Belén
author Molina, Lucia
author_facet Molina, Lucia
Rajchenberg, Mario
Aime, M. Catherine
Pildain, María Belén
author_role author
author2 Rajchenberg, Mario
Aime, M. Catherine
Pildain, María Belén
author2_role author
author
author
dc.subject.none.fl_str_mv AMPTK
ENVIRONMENTAL DNA
FUNGAL ENDOPHYTES
NOTHOFAGUS FORESTS
PIPITS
topic AMPTK
ENVIRONMENTAL DNA
FUNGAL ENDOPHYTES
NOTHOFAGUS FORESTS
PIPITS
purl_subject.fl_str_mv https://purl.org/becyt/ford/1.6
https://purl.org/becyt/ford/1
dc.description.none.fl_txt_mv High-throughput sequencing approaches have become frequent in the study of endophyte communities allowing the cumulative description of fungal diversity in the last decade. However, they brought new challenges to researchers in terms of programming and developing of informatics tools. Currently, there is no consensus concerning the appropriate bioinformatics to process such sequence data. The aim of this study was to compare the performance of three pipelines of two cost-free toolkits designed to be friendly to non-programmer users, and specifically developed for fungal data: AMPtk and PIPITS. The sapwood-inhabiting fungal assemblages of two Nothofagus species from the Patagonian Forests were assessed through metabarcoding of the internal transcribed spacer (ITS) and compared with an extant sequence dataset obtained from culture prospection in the same study sites and trees. The AMPtk toolkit has performed better concerning community description in terms of precision of taxa clustering, mainly due to the DADA2 algorithm; PIPITS evidenced a higher sensitivity in detecting taxa known to be present, hence it is potentially useful for future specific taxa detection surveys. Because of a current lack of information of the reference databases, both bioinformatic toolkits performed poorly as to taxonomy assignment. It is imperative to continue studying these ecosystems to, concomitantly, improve databases and the explanatory potential of the new technologies.
La utilización de la secuenciación de alto rendimiento se ha vuelto frecuente en el estudio de comunidades endófitas. Estas tecnologías han permitido la descripción acumulativa de diversidad fúngica a lo largo de la última década. No obstante, también han implicado nuevos desafíos para los investigadores de las áreas involucradas en términos de la necesidad de contar con herramientas de programación y habilidades desarrolladoras. Hoy en día no existe un consenso sobre las herramientas bioinformáticas más adecuadas para procesar los datos crudos de secuencias que estas tecnologías arrojan. El objetivo de este trabajo fue comparar el rendimiento de tres flujos de trabajo realizados en dos plataformas gratuitas diseñadas para ser amigables con usuarios que no son programadores y desarrolladas específicamente para estudios de hongos: AMPtk y PIPITS. Evaluamos los ensambles de hongos que habitan en la albura de dos especies de Nothofagus de los bosques patagónicos y comparamos el conjunto de datos de metabarcoding del espaciador transcrito interno (ITS) con un conjunto de datos de secuencias existente, obtenido de la prospección de cultivos de los mismos árboles y sitios de estudio. La plataforma AMPtk se desempeñó mejor con respecto a la descripción de la comunidad, en términos de precisión del agrupamiento de taxones, principalmente debido al algoritmo DADA2. El flujo de trabajo PIPITS evidenció una mayor sensibilidad en la detección de taxones conocidos presentes, por lo que es potencialmente útil para futuros estudios que persigan la detección de taxones específicos. Debido a la falta de información que exhiben las bases de datos de referencia sobre el ecosistema en estudio, ambas plataformas tuvieron un desempeño deficiente en cuanto a la asignación de taxonomías. Es imperativo seguir estudiando estos ecosistemas y mejorar las bases de datos para aumentar el potencial explicativo de las nuevas tecnologías.
Fil: Molina, Lucia. Centro de Investigación y Extensión Forestal Andino Patagónico; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina
Fil: Rajchenberg, Mario. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Centro de Investigación y Extensión Forestal Andino Patagónico; Argentina
Fil: Aime, M. Catherine. Purdue University; Estados Unidos
Fil: Pildain, María Belén. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Centro de Investigación y Extensión Forestal Andino Patagónico; Argentina. Universidad Nacional de la Patagonia "San Juan Bosco". Facultad de Ciencias Naturales - Sede Esquel; Argentina
description High-throughput sequencing approaches have become frequent in the study of endophyte communities allowing the cumulative description of fungal diversity in the last decade. However, they brought new challenges to researchers in terms of programming and developing of informatics tools. Currently, there is no consensus concerning the appropriate bioinformatics to process such sequence data. The aim of this study was to compare the performance of three pipelines of two cost-free toolkits designed to be friendly to non-programmer users, and specifically developed for fungal data: AMPtk and PIPITS. The sapwood-inhabiting fungal assemblages of two Nothofagus species from the Patagonian Forests were assessed through metabarcoding of the internal transcribed spacer (ITS) and compared with an extant sequence dataset obtained from culture prospection in the same study sites and trees. The AMPtk toolkit has performed better concerning community description in terms of precision of taxa clustering, mainly due to the DADA2 algorithm; PIPITS evidenced a higher sensitivity in detecting taxa known to be present, hence it is potentially useful for future specific taxa detection surveys. Because of a current lack of information of the reference databases, both bioinformatic toolkits performed poorly as to taxonomy assignment. It is imperative to continue studying these ecosystems to, concomitantly, improve databases and the explanatory potential of the new technologies.
publishDate 2023
dc.date.none.fl_str_mv 2023-08
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_6501
info:ar-repo/semantics/articulo
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11336/220355
Molina, Lucia; Rajchenberg, Mario; Aime, M. Catherine; Pildain, María Belén; Assessing fungal endophyte diversity: a comparative study of three automated metabarcoding pipelines; Instituto de Botánica Darwinion; Darwiniana. Nueva serie; 11; 2; 8-2023; 402-419
0011-6793
CONICET Digital
CONICET
url http://hdl.handle.net/11336/220355
identifier_str_mv Molina, Lucia; Rajchenberg, Mario; Aime, M. Catherine; Pildain, María Belén; Assessing fungal endophyte diversity: a comparative study of three automated metabarcoding pipelines; Instituto de Botánica Darwinion; Darwiniana. Nueva serie; 11; 2; 8-2023; 402-419
0011-6793
CONICET Digital
CONICET
dc.language.none.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/http://www.ojs.darwin.edu.ar/index.php/darwiniana/article/view/1127
info:eu-repo/semantics/altIdentifier/doi/10.14522/darwiniana.2023.112.1127
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Instituto de Botánica Darwinion
publisher.none.fl_str_mv Instituto de Botánica Darwinion
dc.source.none.fl_str_mv reponame:CONICET Digital (CONICET)
instname:Consejo Nacional de Investigaciones Científicas y Técnicas
reponame_str CONICET Digital (CONICET)
collection CONICET Digital (CONICET)
instname_str Consejo Nacional de Investigaciones Científicas y Técnicas
repository.name.fl_str_mv CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas
repository.mail.fl_str_mv dasensio@conicet.gov.ar; lcarlino@conicet.gov.ar
_version_ 1844613432143249408
score 13.070432