Evolutionary Strategy for Optimizing Neural Models for Compound Similarity Estimation

Autores
Hermann, Tobías J.; Vignolo, Leandro D.; Gerard, Matias F.
Año de publicación
2025
Idioma
inglés
Tipo de recurso
artículo
Estado
versión publicada
Descripción
Molecular similarity evaluation is a key aspect of bioinfor- matics and poses a significant challenge when dealing with compounds with unknown structures. In this context, graph neural networks have proven effective in generating representations based on the topology of chemical reactions. However, designing these models and selecting their hyperparameters requires exploring a vast range of options. Evolutio- nary algorithms naturally arise as a solution for searching these exten- sive spaces, including the hyperparameter space of neural architectures. This study presents a comparison between a traditional hyperparameter search approach, based on expert knowledge, and a method leveraging evolutionary computation for the same task, specifically in compound similarity estimation. Using a predefined architecture, experiments are conducted to compare both approaches across different datasets. The re- sults indicate that the evolutionary computation-based method success- fully identifies suitable hyperparameters for the evaluated architecture, achieving a performance comparable to the expert-driven approach while eliminating the need for human intervention in the selection process.
La evaluación de similaridad molecular es clave en el ámbito de la bioinformática, y representa un reto significativo cuando se trata de compuestos cuya estructura no se conoce. En este contexto, los modelos neuronales en grafos han demostrado ser efectivos para obtener representaciones a partir de la topología de reacciones químicas. No obstante, el diseño de estos modelos, así como la selección de sus hiperparámetros, requiere la evaluación de un extenso rango de opciones. Los algoritmos evolutivos se presentan como una solución natural para explorar estos amplios espacios de búsqueda, incluyendo el espacio de hiperparámetros de las arquitecturas neuronales. Este estudio propone una comparación entre un enfoque tradicional de búsqueda de hiperparámetros, basado en la experiencia del experto, y un método que utiliza computación evolutiva para la misma tarea, específicamente en la estimación de similaridad entre compuestos. Utilizando una arquitectura predefinida, se llevan a cabo experimentos para comparar ambos enfoques en distintos conjuntos de datos. Los resultados indican que el método basado en computación evolutiva logra identificar hiperparámetros adecuados para la arquitectura evaluada, alcanzando un desempeño comparable al del enfoque experto, pero sin requerir la intervención del conocimiento humano para dicha selección.
Sociedad Argentina de Informática e Investigación Operativa
Materia
Ciencias Informáticas
graph neural networks
evolutionary computation
compound similarity
metabolic pathways
redes neuronales en grafo
computación evolutiva
similaridad entre compuesto
vías metabólicas
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/177971

id SEDICI_a9b20816bfec505449b7cf59765a7a60
oai_identifier_str oai:sedici.unlp.edu.ar:10915/177971
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Evolutionary Strategy for Optimizing Neural Models for Compound Similarity EstimationEstrategia evolutiva para la optimización de modelos neuronales de estimación de similaridad entre compuestosHermann, Tobías J.Vignolo, Leandro D.Gerard, Matias F.Ciencias Informáticasgraph neural networksevolutionary computationcompound similaritymetabolic pathwaysredes neuronales en grafocomputación evolutivasimilaridad entre compuestovías metabólicasMolecular similarity evaluation is a key aspect of bioinfor- matics and poses a significant challenge when dealing with compounds with unknown structures. In this context, graph neural networks have proven effective in generating representations based on the topology of chemical reactions. However, designing these models and selecting their hyperparameters requires exploring a vast range of options. Evolutio- nary algorithms naturally arise as a solution for searching these exten- sive spaces, including the hyperparameter space of neural architectures. This study presents a comparison between a traditional hyperparameter search approach, based on expert knowledge, and a method leveraging evolutionary computation for the same task, specifically in compound similarity estimation. Using a predefined architecture, experiments are conducted to compare both approaches across different datasets. The re- sults indicate that the evolutionary computation-based method success- fully identifies suitable hyperparameters for the evaluated architecture, achieving a performance comparable to the expert-driven approach while eliminating the need for human intervention in the selection process.La evaluación de similaridad molecular es clave en el ámbito de la bioinformática, y representa un reto significativo cuando se trata de compuestos cuya estructura no se conoce. En este contexto, los modelos neuronales en grafos han demostrado ser efectivos para obtener representaciones a partir de la topología de reacciones químicas. No obstante, el diseño de estos modelos, así como la selección de sus hiperparámetros, requiere la evaluación de un extenso rango de opciones. Los algoritmos evolutivos se presentan como una solución natural para explorar estos amplios espacios de búsqueda, incluyendo el espacio de hiperparámetros de las arquitecturas neuronales. Este estudio propone una comparación entre un enfoque tradicional de búsqueda de hiperparámetros, basado en la experiencia del experto, y un método que utiliza computación evolutiva para la misma tarea, específicamente en la estimación de similaridad entre compuestos. Utilizando una arquitectura predefinida, se llevan a cabo experimentos para comparar ambos enfoques en distintos conjuntos de datos. Los resultados indican que el método basado en computación evolutiva logra identificar hiperparámetros adecuados para la arquitectura evaluada, alcanzando un desempeño comparable al del enfoque experto, pero sin requerir la intervención del conocimiento humano para dicha selección.Sociedad Argentina de Informática e Investigación Operativa2025-04info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionArticulohttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/177971enginfo:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/ejs/article/view/18821info:eu-repo/semantics/altIdentifier/issn/1514-6774info:eu-repo/semantics/altIdentifier/doi/10.24215/15146774e066info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-29T11:48:08Zoai:sedici.unlp.edu.ar:10915/177971Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-29 11:48:08.439SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Evolutionary Strategy for Optimizing Neural Models for Compound Similarity Estimation
Estrategia evolutiva para la optimización de modelos neuronales de estimación de similaridad entre compuestos
title Evolutionary Strategy for Optimizing Neural Models for Compound Similarity Estimation
spellingShingle Evolutionary Strategy for Optimizing Neural Models for Compound Similarity Estimation
Hermann, Tobías J.
Ciencias Informáticas
graph neural networks
evolutionary computation
compound similarity
metabolic pathways
redes neuronales en grafo
computación evolutiva
similaridad entre compuesto
vías metabólicas
title_short Evolutionary Strategy for Optimizing Neural Models for Compound Similarity Estimation
title_full Evolutionary Strategy for Optimizing Neural Models for Compound Similarity Estimation
title_fullStr Evolutionary Strategy for Optimizing Neural Models for Compound Similarity Estimation
title_full_unstemmed Evolutionary Strategy for Optimizing Neural Models for Compound Similarity Estimation
title_sort Evolutionary Strategy for Optimizing Neural Models for Compound Similarity Estimation
dc.creator.none.fl_str_mv Hermann, Tobías J.
Vignolo, Leandro D.
Gerard, Matias F.
author Hermann, Tobías J.
author_facet Hermann, Tobías J.
Vignolo, Leandro D.
Gerard, Matias F.
author_role author
author2 Vignolo, Leandro D.
Gerard, Matias F.
author2_role author
author
dc.subject.none.fl_str_mv Ciencias Informáticas
graph neural networks
evolutionary computation
compound similarity
metabolic pathways
redes neuronales en grafo
computación evolutiva
similaridad entre compuesto
vías metabólicas
topic Ciencias Informáticas
graph neural networks
evolutionary computation
compound similarity
metabolic pathways
redes neuronales en grafo
computación evolutiva
similaridad entre compuesto
vías metabólicas
dc.description.none.fl_txt_mv Molecular similarity evaluation is a key aspect of bioinfor- matics and poses a significant challenge when dealing with compounds with unknown structures. In this context, graph neural networks have proven effective in generating representations based on the topology of chemical reactions. However, designing these models and selecting their hyperparameters requires exploring a vast range of options. Evolutio- nary algorithms naturally arise as a solution for searching these exten- sive spaces, including the hyperparameter space of neural architectures. This study presents a comparison between a traditional hyperparameter search approach, based on expert knowledge, and a method leveraging evolutionary computation for the same task, specifically in compound similarity estimation. Using a predefined architecture, experiments are conducted to compare both approaches across different datasets. The re- sults indicate that the evolutionary computation-based method success- fully identifies suitable hyperparameters for the evaluated architecture, achieving a performance comparable to the expert-driven approach while eliminating the need for human intervention in the selection process.
La evaluación de similaridad molecular es clave en el ámbito de la bioinformática, y representa un reto significativo cuando se trata de compuestos cuya estructura no se conoce. En este contexto, los modelos neuronales en grafos han demostrado ser efectivos para obtener representaciones a partir de la topología de reacciones químicas. No obstante, el diseño de estos modelos, así como la selección de sus hiperparámetros, requiere la evaluación de un extenso rango de opciones. Los algoritmos evolutivos se presentan como una solución natural para explorar estos amplios espacios de búsqueda, incluyendo el espacio de hiperparámetros de las arquitecturas neuronales. Este estudio propone una comparación entre un enfoque tradicional de búsqueda de hiperparámetros, basado en la experiencia del experto, y un método que utiliza computación evolutiva para la misma tarea, específicamente en la estimación de similaridad entre compuestos. Utilizando una arquitectura predefinida, se llevan a cabo experimentos para comparar ambos enfoques en distintos conjuntos de datos. Los resultados indican que el método basado en computación evolutiva logra identificar hiperparámetros adecuados para la arquitectura evaluada, alcanzando un desempeño comparable al del enfoque experto, pero sin requerir la intervención del conocimiento humano para dicha selección.
Sociedad Argentina de Informática e Investigación Operativa
description Molecular similarity evaluation is a key aspect of bioinfor- matics and poses a significant challenge when dealing with compounds with unknown structures. In this context, graph neural networks have proven effective in generating representations based on the topology of chemical reactions. However, designing these models and selecting their hyperparameters requires exploring a vast range of options. Evolutio- nary algorithms naturally arise as a solution for searching these exten- sive spaces, including the hyperparameter space of neural architectures. This study presents a comparison between a traditional hyperparameter search approach, based on expert knowledge, and a method leveraging evolutionary computation for the same task, specifically in compound similarity estimation. Using a predefined architecture, experiments are conducted to compare both approaches across different datasets. The re- sults indicate that the evolutionary computation-based method success- fully identifies suitable hyperparameters for the evaluated architecture, achieving a performance comparable to the expert-driven approach while eliminating the need for human intervention in the selection process.
publishDate 2025
dc.date.none.fl_str_mv 2025-04
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
Articulo
http://purl.org/coar/resource_type/c_6501
info:ar-repo/semantics/articulo
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/177971
url http://sedici.unlp.edu.ar/handle/10915/177971
dc.language.none.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/ejs/article/view/18821
info:eu-repo/semantics/altIdentifier/issn/1514-6774
info:eu-repo/semantics/altIdentifier/doi/10.24215/15146774e066
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1844616344082841600
score 13.070432