Player2Vec y otros modelos probabilísticos: framework para evaluar performance en jugadores de fútbol

Autores
Glauberman, Tomás; Pardo, Ignacio; Silvestri, Juan Ignacio
Año de publicación
2025
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
En la última década, el análisis deportivo ha evolucionado hacia una perspectiva cada vez más matemática y sofisticada. Aplicaciones como el uso de análisis espacial en Basketball (Goldsberry, 2012) y la investigación estadística del Brentford con Smartodds son ejemplos claros de la tendencia creciente en este campo. El béisbol, por mucho tiempo el deporte preferido para la analítica, ha experimentado una profunda transformación con la implementación de Sabermetrics (Baumer, 2015). La introducción de herramientas analíticas avanzadas ha producido resultados positivos para muchos equipos, lo que resalta el valor de estudiar métricas específicas dentro de cada deporte. Este desarrollo se centra en el fútbol, un deporte en el cual los análisis previos se han concentrado, en su mayoría, en predecir resultados de partidos y mejorar el rendimiento de los equipos. Sin embargo, este trabajo propone un enfoque diferente al analizar el impacto de los jugadores sobre la posesión de balón y los disparos del equipo desde  na perspectiva probabilística.A partir de la métrica PSL propuesta en el paper en desarrollo Soccer Networks(Huang et al., n.d.) planteamos un proceso para comparar el impacto que tienen los jugadores sobre la performance del equipo. Logramos formular una metodología para estudiar la distribución de la performance de un equipo. Luego, proponemos una serie de métodos y métricas para comparar el rendimiento de dos formaciones de jugadores. Desarrollamos una forma de representación vectorial (Embeddings) de los jugadores, llamada Player2Vec, un modelo de Machine Learning también basado sobre el modelo de redes de jugadores planteado en el mismo paper del PSL. Esto último permite desarrollar modelos predictivos sobre el rendimiento de los jugadores en un equipo. Nuestro modelo final logra predecir la performance de los jugadores un 58.99% mejor que asumir las distribuciones previas como priors.
Over the last decade, sports analysis has evolved into an increasingly mathematical and sophisticated perspective. Applications such as the use of spatial analysis in Basketball and Brentford’s statistical research with Smartodds are clear examples of the growing trend in this field. Baseball, long the sport of choice for analytics, has undergone a profound transformation with the implementation of Sabermetrics. The introduction of advanced analytics tools has produced positive results for many teams, highlighting the value of studying specific metrics within each sport.This development focuses on soccer, a sport in which previous analyses have mostly concentrated on predicting match results and improving team performance as a whole. However, this work proposes a different approach by analyzing the relationship between the player as an individual and the respective player training.Specifically, we explore the impact of players on ball possession and team shots from a probabilistic perspective. Starting from the probability of kicking before losing the ball (PSL) proposed in the developing paper “Soccer Networks”, and its demonstrated positive influence on team results, we propose a process to compare the impact of players on PSL and consequently on team performance.We succeeded in formulating a methodology to study the PSL distribution of a team for which we propose a series of methods and metrics to compare the performance of two formations of players. We developed vector representation of the players (Embeddings), called Player2Vec, based on the player graph proposed in the same paper “Soccer Networks”. The latter allows us to develop predictive models about the performance of players in a team. Our final model is 58.99% better at predicting player performance than assuming previous distributions as priors, thus outperforming simpler Bayesian models.
Sociedad Argentina de Informática e Investigación Operativa
Materia
Ciencias Informáticas
Fútbol
Machine learning
Redes de jugadores
Embeddings
Cadenas de Markov
Soccer
Player networks
Embeddings
Markov chains
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/190581

id SEDICI_b4788ea0fc7c3cffb444c667484667fd
oai_identifier_str oai:sedici.unlp.edu.ar:10915/190581
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Player2Vec y otros modelos probabilísticos: framework para evaluar performance en jugadores de fútbolPlayer2Vec and other Probabilistic Models: Framework for Evaluating Player Performance in SoccerGlauberman, TomásPardo, IgnacioSilvestri, Juan IgnacioCiencias InformáticasFútbolMachine learningRedes de jugadoresEmbeddingsCadenas de MarkovSoccerPlayer networksEmbeddingsMarkov chainsEn la última década, el análisis deportivo ha evolucionado hacia una perspectiva cada vez más matemática y sofisticada. Aplicaciones como el uso de análisis espacial en Basketball (Goldsberry, 2012) y la investigación estadística del Brentford con Smartodds son ejemplos claros de la tendencia creciente en este campo. El béisbol, por mucho tiempo el deporte preferido para la analítica, ha experimentado una profunda transformación con la implementación de Sabermetrics (Baumer, 2015). La introducción de herramientas analíticas avanzadas ha producido resultados positivos para muchos equipos, lo que resalta el valor de estudiar métricas específicas dentro de cada deporte. Este desarrollo se centra en el fútbol, un deporte en el cual los análisis previos se han concentrado, en su mayoría, en predecir resultados de partidos y mejorar el rendimiento de los equipos. Sin embargo, este trabajo propone un enfoque diferente al analizar el impacto de los jugadores sobre la posesión de balón y los disparos del equipo desde  na perspectiva probabilística.A partir de la métrica PSL propuesta en el paper en desarrollo Soccer Networks(Huang et al., n.d.) planteamos un proceso para comparar el impacto que tienen los jugadores sobre la performance del equipo. Logramos formular una metodología para estudiar la distribución de la performance de un equipo. Luego, proponemos una serie de métodos y métricas para comparar el rendimiento de dos formaciones de jugadores. Desarrollamos una forma de representación vectorial (Embeddings) de los jugadores, llamada Player2Vec, un modelo de Machine Learning también basado sobre el modelo de redes de jugadores planteado en el mismo paper del PSL. Esto último permite desarrollar modelos predictivos sobre el rendimiento de los jugadores en un equipo. Nuestro modelo final logra predecir la performance de los jugadores un 58.99% mejor que asumir las distribuciones previas como priors.Over the last decade, sports analysis has evolved into an increasingly mathematical and sophisticated perspective. Applications such as the use of spatial analysis in Basketball and Brentford’s statistical research with Smartodds are clear examples of the growing trend in this field. Baseball, long the sport of choice for analytics, has undergone a profound transformation with the implementation of Sabermetrics. The introduction of advanced analytics tools has produced positive results for many teams, highlighting the value of studying specific metrics within each sport.This development focuses on soccer, a sport in which previous analyses have mostly concentrated on predicting match results and improving team performance as a whole. However, this work proposes a different approach by analyzing the relationship between the player as an individual and the respective player training.Specifically, we explore the impact of players on ball possession and team shots from a probabilistic perspective. Starting from the probability of kicking before losing the ball (PSL) proposed in the developing paper “Soccer Networks”, and its demonstrated positive influence on team results, we propose a process to compare the impact of players on PSL and consequently on team performance.We succeeded in formulating a methodology to study the PSL distribution of a team for which we propose a series of methods and metrics to compare the performance of two formations of players. We developed vector representation of the players (Embeddings), called Player2Vec, based on the player graph proposed in the same paper “Soccer Networks”. The latter allows us to develop predictive models about the performance of players in a team. Our final model is 58.99% better at predicting player performance than assuming previous distributions as priors, thus outperforming simpler Bayesian models.Sociedad Argentina de Informática e Investigación Operativa2025-08info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf64-77http://sedici.unlp.edu.ar/handle/10915/190581spainfo:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/JAIIO/article/view/19881info:eu-repo/semantics/altIdentifier/issn/2451-7496info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2026-02-26T11:39:42Zoai:sedici.unlp.edu.ar:10915/190581Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292026-02-26 11:39:42.746SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Player2Vec y otros modelos probabilísticos: framework para evaluar performance en jugadores de fútbol
Player2Vec and other Probabilistic Models: Framework for Evaluating Player Performance in Soccer
title Player2Vec y otros modelos probabilísticos: framework para evaluar performance en jugadores de fútbol
spellingShingle Player2Vec y otros modelos probabilísticos: framework para evaluar performance en jugadores de fútbol
Glauberman, Tomás
Ciencias Informáticas
Fútbol
Machine learning
Redes de jugadores
Embeddings
Cadenas de Markov
Soccer
Player networks
Embeddings
Markov chains
title_short Player2Vec y otros modelos probabilísticos: framework para evaluar performance en jugadores de fútbol
title_full Player2Vec y otros modelos probabilísticos: framework para evaluar performance en jugadores de fútbol
title_fullStr Player2Vec y otros modelos probabilísticos: framework para evaluar performance en jugadores de fútbol
title_full_unstemmed Player2Vec y otros modelos probabilísticos: framework para evaluar performance en jugadores de fútbol
title_sort Player2Vec y otros modelos probabilísticos: framework para evaluar performance en jugadores de fútbol
dc.creator.none.fl_str_mv Glauberman, Tomás
Pardo, Ignacio
Silvestri, Juan Ignacio
author Glauberman, Tomás
author_facet Glauberman, Tomás
Pardo, Ignacio
Silvestri, Juan Ignacio
author_role author
author2 Pardo, Ignacio
Silvestri, Juan Ignacio
author2_role author
author
dc.subject.none.fl_str_mv Ciencias Informáticas
Fútbol
Machine learning
Redes de jugadores
Embeddings
Cadenas de Markov
Soccer
Player networks
Embeddings
Markov chains
topic Ciencias Informáticas
Fútbol
Machine learning
Redes de jugadores
Embeddings
Cadenas de Markov
Soccer
Player networks
Embeddings
Markov chains
dc.description.none.fl_txt_mv En la última década, el análisis deportivo ha evolucionado hacia una perspectiva cada vez más matemática y sofisticada. Aplicaciones como el uso de análisis espacial en Basketball (Goldsberry, 2012) y la investigación estadística del Brentford con Smartodds son ejemplos claros de la tendencia creciente en este campo. El béisbol, por mucho tiempo el deporte preferido para la analítica, ha experimentado una profunda transformación con la implementación de Sabermetrics (Baumer, 2015). La introducción de herramientas analíticas avanzadas ha producido resultados positivos para muchos equipos, lo que resalta el valor de estudiar métricas específicas dentro de cada deporte. Este desarrollo se centra en el fútbol, un deporte en el cual los análisis previos se han concentrado, en su mayoría, en predecir resultados de partidos y mejorar el rendimiento de los equipos. Sin embargo, este trabajo propone un enfoque diferente al analizar el impacto de los jugadores sobre la posesión de balón y los disparos del equipo desde  na perspectiva probabilística.A partir de la métrica PSL propuesta en el paper en desarrollo Soccer Networks(Huang et al., n.d.) planteamos un proceso para comparar el impacto que tienen los jugadores sobre la performance del equipo. Logramos formular una metodología para estudiar la distribución de la performance de un equipo. Luego, proponemos una serie de métodos y métricas para comparar el rendimiento de dos formaciones de jugadores. Desarrollamos una forma de representación vectorial (Embeddings) de los jugadores, llamada Player2Vec, un modelo de Machine Learning también basado sobre el modelo de redes de jugadores planteado en el mismo paper del PSL. Esto último permite desarrollar modelos predictivos sobre el rendimiento de los jugadores en un equipo. Nuestro modelo final logra predecir la performance de los jugadores un 58.99% mejor que asumir las distribuciones previas como priors.
Over the last decade, sports analysis has evolved into an increasingly mathematical and sophisticated perspective. Applications such as the use of spatial analysis in Basketball and Brentford’s statistical research with Smartodds are clear examples of the growing trend in this field. Baseball, long the sport of choice for analytics, has undergone a profound transformation with the implementation of Sabermetrics. The introduction of advanced analytics tools has produced positive results for many teams, highlighting the value of studying specific metrics within each sport.This development focuses on soccer, a sport in which previous analyses have mostly concentrated on predicting match results and improving team performance as a whole. However, this work proposes a different approach by analyzing the relationship between the player as an individual and the respective player training.Specifically, we explore the impact of players on ball possession and team shots from a probabilistic perspective. Starting from the probability of kicking before losing the ball (PSL) proposed in the developing paper “Soccer Networks”, and its demonstrated positive influence on team results, we propose a process to compare the impact of players on PSL and consequently on team performance.We succeeded in formulating a methodology to study the PSL distribution of a team for which we propose a series of methods and metrics to compare the performance of two formations of players. We developed vector representation of the players (Embeddings), called Player2Vec, based on the player graph proposed in the same paper “Soccer Networks”. The latter allows us to develop predictive models about the performance of players in a team. Our final model is 58.99% better at predicting player performance than assuming previous distributions as priors, thus outperforming simpler Bayesian models.
Sociedad Argentina de Informática e Investigación Operativa
description En la última década, el análisis deportivo ha evolucionado hacia una perspectiva cada vez más matemática y sofisticada. Aplicaciones como el uso de análisis espacial en Basketball (Goldsberry, 2012) y la investigación estadística del Brentford con Smartodds son ejemplos claros de la tendencia creciente en este campo. El béisbol, por mucho tiempo el deporte preferido para la analítica, ha experimentado una profunda transformación con la implementación de Sabermetrics (Baumer, 2015). La introducción de herramientas analíticas avanzadas ha producido resultados positivos para muchos equipos, lo que resalta el valor de estudiar métricas específicas dentro de cada deporte. Este desarrollo se centra en el fútbol, un deporte en el cual los análisis previos se han concentrado, en su mayoría, en predecir resultados de partidos y mejorar el rendimiento de los equipos. Sin embargo, este trabajo propone un enfoque diferente al analizar el impacto de los jugadores sobre la posesión de balón y los disparos del equipo desde  na perspectiva probabilística.A partir de la métrica PSL propuesta en el paper en desarrollo Soccer Networks(Huang et al., n.d.) planteamos un proceso para comparar el impacto que tienen los jugadores sobre la performance del equipo. Logramos formular una metodología para estudiar la distribución de la performance de un equipo. Luego, proponemos una serie de métodos y métricas para comparar el rendimiento de dos formaciones de jugadores. Desarrollamos una forma de representación vectorial (Embeddings) de los jugadores, llamada Player2Vec, un modelo de Machine Learning también basado sobre el modelo de redes de jugadores planteado en el mismo paper del PSL. Esto último permite desarrollar modelos predictivos sobre el rendimiento de los jugadores en un equipo. Nuestro modelo final logra predecir la performance de los jugadores un 58.99% mejor que asumir las distribuciones previas como priors.
publishDate 2025
dc.date.none.fl_str_mv 2025-08
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/190581
url http://sedici.unlp.edu.ar/handle/10915/190581
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/JAIIO/article/view/19881
info:eu-repo/semantics/altIdentifier/issn/2451-7496
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
64-77
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1858282592046940160
score 12.665996