Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional

Autores
Amigo, Martín Ignacio; Carreira Munich, Tobías Agustín
Año de publicación
2022
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Landfried, Gustavo Andrés
Mocskos, Esteban Eduardo
Descripción
El Go es un juego de mesa milenario creado en Asia que, a pesar de tener reglas relativamente sencillas, presenta una enorme complejidad combinatoria en cuanto a las posibles jugadas. Esto deriva en grandes diferencias de habilidad entre distintos jugadores. Es una práctica común que, cuando la diferencia de habilidad entre dos jugadores es muy grande, se ofrezca una ventaja para producir un juego más entretenido. En la tradición del Go existe un sistema de ranking con el que se intenta clasificar a las personas en niveles con la idea de que la diferencia de niveles represente la ventaja que una persona debería otorgarle a la otra. Sin embargo, determinar la ventaja necesaria para alcanzar un buen equilibrio en el juego es un problema de difícil solución ya que depende de la estimación de la habilidad de cada uno de los jugadores. El problema de estimar la probabilidad de ganar comenzó a resolverse a mediados del siglo pasado con el objetivo de evaluar la habilidad de los jugadores profesionales de ajedrez. Desde entonces la mayor´ıa de los modelos utilizan la probabilidad del resultado observado, r, para actualizar las estimaciones de habilidad s, P( r | si , sj ). En el caso del Go, además es importante estimar el efecto que produce la ventaja en la probabilidad de ganar. Actualmente, la Asociación Argentina de Go (AAGo) reúne a las personas aficionadas del juego de Go en nuestro país y utiliza el sistema de ranking de la Asociación Estadounidense de Go. En la práctica, este algoritmo ha mostrado tener serias dificultades según manifiestan los propios miembros de la AAGo. La dificultad particular que tiene la AAGo es el tamaño de su comunidad que además está compuesta por una gran diversidad de habilidades. En esta tesis nos propusimos desarrollar un sistema para la AAGo que mejore sustancialmente las estimaciones de habilidad con las que cuentan en la actualidad haciendo un uso eficiente de los datos. Para ello, decidimos adaptar el modelo estado del arte en la industria del video juego, TrueSkill Through Time (TTT), de modo tal que incorpore los efectos de las ventajas, modelo que llamamos TTT-hreg. En vez de propagar la información en un único sentido, del pasado al futuro, TTT propaga la información a través de todo el sistema ofreciendo así mejores estimaciones de habilidad con menor cantidad de datos. Luego de su publicación original, se implementó un algoritmo similar denominado Whole History Rating (WHR), de referencia en la actualidad en la estimación de habilidad de los jugadores profesionales de Go. Ambos algoritmos que utilizan toda la historia (TTT y WHR) mostraron tener un desempeño altamente superior al algoritmo utilizado actualmente por la AAGo. En particular, el modelo WHR mostró tener predicciones a priori mejores que TTT. Por otro lado, este último tiene la ventaja de permitir agregar nuevos factores respetando las reglas de la probabilidad dentro del marco bayesiano, simplificando su uso y adaptación a nuevos contextos. En la actualidad, no es posible comparar las estimaciones de habilidad obtenidas por las diferentes Asociaciones de Go del mundo, no sólo porque utilizan sistemas diferentes, sino porque en general son bases de datos disconexas. Sin embargo, unos pocos vínculos entre bases de datos le permitirían a nuestra solución propagar la información eficientemente, garantizando la comparabilidad entre las diversas asociaciones internacionales. En este trabajo dejamos sentadas las bases para extender el uso de nuestra solución como medida de referencia internacional utilizando la base de datos completa de KGS con 100 millones de partidas de todas las asociaciones de Go del mundo.
Fil: Amigo, Martín Ignacio. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Fil: Carreira Munich, Tobías Agustín. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
HABILIDAD
GO
HANDICAP
APRENDIZAJE
COMPARABILIDAD
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
seminario:seminario_nCOM000552_AmigoCarreiraMunich

id BDUBAFCEN_b96cc801d42c57523fc9513b57fc6b85
oai_identifier_str seminario:seminario_nCOM000552_AmigoCarreiraMunich
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacionalAmigo, Martín IgnacioCarreira Munich, Tobías AgustínHABILIDADGOHANDICAPAPRENDIZAJECOMPARABILIDADEl Go es un juego de mesa milenario creado en Asia que, a pesar de tener reglas relativamente sencillas, presenta una enorme complejidad combinatoria en cuanto a las posibles jugadas. Esto deriva en grandes diferencias de habilidad entre distintos jugadores. Es una práctica común que, cuando la diferencia de habilidad entre dos jugadores es muy grande, se ofrezca una ventaja para producir un juego más entretenido. En la tradición del Go existe un sistema de ranking con el que se intenta clasificar a las personas en niveles con la idea de que la diferencia de niveles represente la ventaja que una persona debería otorgarle a la otra. Sin embargo, determinar la ventaja necesaria para alcanzar un buen equilibrio en el juego es un problema de difícil solución ya que depende de la estimación de la habilidad de cada uno de los jugadores. El problema de estimar la probabilidad de ganar comenzó a resolverse a mediados del siglo pasado con el objetivo de evaluar la habilidad de los jugadores profesionales de ajedrez. Desde entonces la mayor´ıa de los modelos utilizan la probabilidad del resultado observado, r, para actualizar las estimaciones de habilidad s, P( r | si , sj ). En el caso del Go, además es importante estimar el efecto que produce la ventaja en la probabilidad de ganar. Actualmente, la Asociación Argentina de Go (AAGo) reúne a las personas aficionadas del juego de Go en nuestro país y utiliza el sistema de ranking de la Asociación Estadounidense de Go. En la práctica, este algoritmo ha mostrado tener serias dificultades según manifiestan los propios miembros de la AAGo. La dificultad particular que tiene la AAGo es el tamaño de su comunidad que además está compuesta por una gran diversidad de habilidades. En esta tesis nos propusimos desarrollar un sistema para la AAGo que mejore sustancialmente las estimaciones de habilidad con las que cuentan en la actualidad haciendo un uso eficiente de los datos. Para ello, decidimos adaptar el modelo estado del arte en la industria del video juego, TrueSkill Through Time (TTT), de modo tal que incorpore los efectos de las ventajas, modelo que llamamos TTT-hreg. En vez de propagar la información en un único sentido, del pasado al futuro, TTT propaga la información a través de todo el sistema ofreciendo así mejores estimaciones de habilidad con menor cantidad de datos. Luego de su publicación original, se implementó un algoritmo similar denominado Whole History Rating (WHR), de referencia en la actualidad en la estimación de habilidad de los jugadores profesionales de Go. Ambos algoritmos que utilizan toda la historia (TTT y WHR) mostraron tener un desempeño altamente superior al algoritmo utilizado actualmente por la AAGo. En particular, el modelo WHR mostró tener predicciones a priori mejores que TTT. Por otro lado, este último tiene la ventaja de permitir agregar nuevos factores respetando las reglas de la probabilidad dentro del marco bayesiano, simplificando su uso y adaptación a nuevos contextos. En la actualidad, no es posible comparar las estimaciones de habilidad obtenidas por las diferentes Asociaciones de Go del mundo, no sólo porque utilizan sistemas diferentes, sino porque en general son bases de datos disconexas. Sin embargo, unos pocos vínculos entre bases de datos le permitirían a nuestra solución propagar la información eficientemente, garantizando la comparabilidad entre las diversas asociaciones internacionales. En este trabajo dejamos sentadas las bases para extender el uso de nuestra solución como medida de referencia internacional utilizando la base de datos completa de KGS con 100 millones de partidas de todas las asociaciones de Go del mundo.Fil: Amigo, Martín Ignacio. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Fil: Carreira Munich, Tobías Agustín. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesLandfried, Gustavo AndrésMocskos, Esteban Eduardo2022info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000552_AmigoCarreiraMunichspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-29T13:43:37Zseminario:seminario_nCOM000552_AmigoCarreiraMunichInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-29 13:43:38.105Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional
title Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional
spellingShingle Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional
Amigo, Martín Ignacio
HABILIDAD
GO
HANDICAP
APRENDIZAJE
COMPARABILIDAD
title_short Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional
title_full Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional
title_fullStr Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional
title_full_unstemmed Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional
title_sort Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional
dc.creator.none.fl_str_mv Amigo, Martín Ignacio
Carreira Munich, Tobías Agustín
author Amigo, Martín Ignacio
author_facet Amigo, Martín Ignacio
Carreira Munich, Tobías Agustín
author_role author
author2 Carreira Munich, Tobías Agustín
author2_role author
dc.contributor.none.fl_str_mv Landfried, Gustavo Andrés
Mocskos, Esteban Eduardo
dc.subject.none.fl_str_mv HABILIDAD
GO
HANDICAP
APRENDIZAJE
COMPARABILIDAD
topic HABILIDAD
GO
HANDICAP
APRENDIZAJE
COMPARABILIDAD
dc.description.none.fl_txt_mv El Go es un juego de mesa milenario creado en Asia que, a pesar de tener reglas relativamente sencillas, presenta una enorme complejidad combinatoria en cuanto a las posibles jugadas. Esto deriva en grandes diferencias de habilidad entre distintos jugadores. Es una práctica común que, cuando la diferencia de habilidad entre dos jugadores es muy grande, se ofrezca una ventaja para producir un juego más entretenido. En la tradición del Go existe un sistema de ranking con el que se intenta clasificar a las personas en niveles con la idea de que la diferencia de niveles represente la ventaja que una persona debería otorgarle a la otra. Sin embargo, determinar la ventaja necesaria para alcanzar un buen equilibrio en el juego es un problema de difícil solución ya que depende de la estimación de la habilidad de cada uno de los jugadores. El problema de estimar la probabilidad de ganar comenzó a resolverse a mediados del siglo pasado con el objetivo de evaluar la habilidad de los jugadores profesionales de ajedrez. Desde entonces la mayor´ıa de los modelos utilizan la probabilidad del resultado observado, r, para actualizar las estimaciones de habilidad s, P( r | si , sj ). En el caso del Go, además es importante estimar el efecto que produce la ventaja en la probabilidad de ganar. Actualmente, la Asociación Argentina de Go (AAGo) reúne a las personas aficionadas del juego de Go en nuestro país y utiliza el sistema de ranking de la Asociación Estadounidense de Go. En la práctica, este algoritmo ha mostrado tener serias dificultades según manifiestan los propios miembros de la AAGo. La dificultad particular que tiene la AAGo es el tamaño de su comunidad que además está compuesta por una gran diversidad de habilidades. En esta tesis nos propusimos desarrollar un sistema para la AAGo que mejore sustancialmente las estimaciones de habilidad con las que cuentan en la actualidad haciendo un uso eficiente de los datos. Para ello, decidimos adaptar el modelo estado del arte en la industria del video juego, TrueSkill Through Time (TTT), de modo tal que incorpore los efectos de las ventajas, modelo que llamamos TTT-hreg. En vez de propagar la información en un único sentido, del pasado al futuro, TTT propaga la información a través de todo el sistema ofreciendo así mejores estimaciones de habilidad con menor cantidad de datos. Luego de su publicación original, se implementó un algoritmo similar denominado Whole History Rating (WHR), de referencia en la actualidad en la estimación de habilidad de los jugadores profesionales de Go. Ambos algoritmos que utilizan toda la historia (TTT y WHR) mostraron tener un desempeño altamente superior al algoritmo utilizado actualmente por la AAGo. En particular, el modelo WHR mostró tener predicciones a priori mejores que TTT. Por otro lado, este último tiene la ventaja de permitir agregar nuevos factores respetando las reglas de la probabilidad dentro del marco bayesiano, simplificando su uso y adaptación a nuevos contextos. En la actualidad, no es posible comparar las estimaciones de habilidad obtenidas por las diferentes Asociaciones de Go del mundo, no sólo porque utilizan sistemas diferentes, sino porque en general son bases de datos disconexas. Sin embargo, unos pocos vínculos entre bases de datos le permitirían a nuestra solución propagar la información eficientemente, garantizando la comparabilidad entre las diversas asociaciones internacionales. En este trabajo dejamos sentadas las bases para extender el uso de nuestra solución como medida de referencia internacional utilizando la base de datos completa de KGS con 100 millones de partidas de todas las asociaciones de Go del mundo.
Fil: Amigo, Martín Ignacio. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Fil: Carreira Munich, Tobías Agustín. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description El Go es un juego de mesa milenario creado en Asia que, a pesar de tener reglas relativamente sencillas, presenta una enorme complejidad combinatoria en cuanto a las posibles jugadas. Esto deriva en grandes diferencias de habilidad entre distintos jugadores. Es una práctica común que, cuando la diferencia de habilidad entre dos jugadores es muy grande, se ofrezca una ventaja para producir un juego más entretenido. En la tradición del Go existe un sistema de ranking con el que se intenta clasificar a las personas en niveles con la idea de que la diferencia de niveles represente la ventaja que una persona debería otorgarle a la otra. Sin embargo, determinar la ventaja necesaria para alcanzar un buen equilibrio en el juego es un problema de difícil solución ya que depende de la estimación de la habilidad de cada uno de los jugadores. El problema de estimar la probabilidad de ganar comenzó a resolverse a mediados del siglo pasado con el objetivo de evaluar la habilidad de los jugadores profesionales de ajedrez. Desde entonces la mayor´ıa de los modelos utilizan la probabilidad del resultado observado, r, para actualizar las estimaciones de habilidad s, P( r | si , sj ). En el caso del Go, además es importante estimar el efecto que produce la ventaja en la probabilidad de ganar. Actualmente, la Asociación Argentina de Go (AAGo) reúne a las personas aficionadas del juego de Go en nuestro país y utiliza el sistema de ranking de la Asociación Estadounidense de Go. En la práctica, este algoritmo ha mostrado tener serias dificultades según manifiestan los propios miembros de la AAGo. La dificultad particular que tiene la AAGo es el tamaño de su comunidad que además está compuesta por una gran diversidad de habilidades. En esta tesis nos propusimos desarrollar un sistema para la AAGo que mejore sustancialmente las estimaciones de habilidad con las que cuentan en la actualidad haciendo un uso eficiente de los datos. Para ello, decidimos adaptar el modelo estado del arte en la industria del video juego, TrueSkill Through Time (TTT), de modo tal que incorpore los efectos de las ventajas, modelo que llamamos TTT-hreg. En vez de propagar la información en un único sentido, del pasado al futuro, TTT propaga la información a través de todo el sistema ofreciendo así mejores estimaciones de habilidad con menor cantidad de datos. Luego de su publicación original, se implementó un algoritmo similar denominado Whole History Rating (WHR), de referencia en la actualidad en la estimación de habilidad de los jugadores profesionales de Go. Ambos algoritmos que utilizan toda la historia (TTT y WHR) mostraron tener un desempeño altamente superior al algoritmo utilizado actualmente por la AAGo. En particular, el modelo WHR mostró tener predicciones a priori mejores que TTT. Por otro lado, este último tiene la ventaja de permitir agregar nuevos factores respetando las reglas de la probabilidad dentro del marco bayesiano, simplificando su uso y adaptación a nuevos contextos. En la actualidad, no es posible comparar las estimaciones de habilidad obtenidas por las diferentes Asociaciones de Go del mundo, no sólo porque utilizan sistemas diferentes, sino porque en general son bases de datos disconexas. Sin embargo, unos pocos vínculos entre bases de datos le permitirían a nuestra solución propagar la información eficientemente, garantizando la comparabilidad entre las diversas asociaciones internacionales. En este trabajo dejamos sentadas las bases para extender el uso de nuestra solución como medida de referencia internacional utilizando la base de datos completa de KGS con 100 millones de partidas de todas las asociaciones de Go del mundo.
publishDate 2022
dc.date.none.fl_str_mv 2022
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/seminario_nCOM000552_AmigoCarreiraMunich
url https://hdl.handle.net/20.500.12110/seminario_nCOM000552_AmigoCarreiraMunich
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1844618756006871040
score 13.069144