Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional
- Autores
- Amigo, Martín Ignacio; Carreira Munich, Tobías Agustín
- Año de publicación
- 2022
- Idioma
- español castellano
- Tipo de recurso
- tesis de grado
- Estado
- versión publicada
- Colaborador/a o director/a de tesis
- Landfried, Gustavo Andrés
Mocskos, Esteban Eduardo - Descripción
- El Go es un juego de mesa milenario creado en Asia que, a pesar de tener reglas relativamente sencillas, presenta una enorme complejidad combinatoria en cuanto a las posibles jugadas. Esto deriva en grandes diferencias de habilidad entre distintos jugadores. Es una práctica común que, cuando la diferencia de habilidad entre dos jugadores es muy grande, se ofrezca una ventaja para producir un juego más entretenido. En la tradición del Go existe un sistema de ranking con el que se intenta clasificar a las personas en niveles con la idea de que la diferencia de niveles represente la ventaja que una persona debería otorgarle a la otra. Sin embargo, determinar la ventaja necesaria para alcanzar un buen equilibrio en el juego es un problema de difícil solución ya que depende de la estimación de la habilidad de cada uno de los jugadores. El problema de estimar la probabilidad de ganar comenzó a resolverse a mediados del siglo pasado con el objetivo de evaluar la habilidad de los jugadores profesionales de ajedrez. Desde entonces la mayor´ıa de los modelos utilizan la probabilidad del resultado observado, r, para actualizar las estimaciones de habilidad s, P( r | si , sj ). En el caso del Go, además es importante estimar el efecto que produce la ventaja en la probabilidad de ganar. Actualmente, la Asociación Argentina de Go (AAGo) reúne a las personas aficionadas del juego de Go en nuestro país y utiliza el sistema de ranking de la Asociación Estadounidense de Go. En la práctica, este algoritmo ha mostrado tener serias dificultades según manifiestan los propios miembros de la AAGo. La dificultad particular que tiene la AAGo es el tamaño de su comunidad que además está compuesta por una gran diversidad de habilidades. En esta tesis nos propusimos desarrollar un sistema para la AAGo que mejore sustancialmente las estimaciones de habilidad con las que cuentan en la actualidad haciendo un uso eficiente de los datos. Para ello, decidimos adaptar el modelo estado del arte en la industria del video juego, TrueSkill Through Time (TTT), de modo tal que incorpore los efectos de las ventajas, modelo que llamamos TTT-hreg. En vez de propagar la información en un único sentido, del pasado al futuro, TTT propaga la información a través de todo el sistema ofreciendo así mejores estimaciones de habilidad con menor cantidad de datos. Luego de su publicación original, se implementó un algoritmo similar denominado Whole History Rating (WHR), de referencia en la actualidad en la estimación de habilidad de los jugadores profesionales de Go. Ambos algoritmos que utilizan toda la historia (TTT y WHR) mostraron tener un desempeño altamente superior al algoritmo utilizado actualmente por la AAGo. En particular, el modelo WHR mostró tener predicciones a priori mejores que TTT. Por otro lado, este último tiene la ventaja de permitir agregar nuevos factores respetando las reglas de la probabilidad dentro del marco bayesiano, simplificando su uso y adaptación a nuevos contextos. En la actualidad, no es posible comparar las estimaciones de habilidad obtenidas por las diferentes Asociaciones de Go del mundo, no sólo porque utilizan sistemas diferentes, sino porque en general son bases de datos disconexas. Sin embargo, unos pocos vínculos entre bases de datos le permitirían a nuestra solución propagar la información eficientemente, garantizando la comparabilidad entre las diversas asociaciones internacionales. En este trabajo dejamos sentadas las bases para extender el uso de nuestra solución como medida de referencia internacional utilizando la base de datos completa de KGS con 100 millones de partidas de todas las asociaciones de Go del mundo.
Fil: Amigo, Martín Ignacio. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Fil: Carreira Munich, Tobías Agustín. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. - Materia
-
HABILIDAD
GO
HANDICAP
APRENDIZAJE
COMPARABILIDAD - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- https://creativecommons.org/licenses/by-nc-sa/2.5/ar
- Repositorio
- Institución
- Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
- OAI Identificador
- seminario:seminario_nCOM000552_AmigoCarreiraMunich
Ver los metadatos del registro completo
id |
BDUBAFCEN_b96cc801d42c57523fc9513b57fc6b85 |
---|---|
oai_identifier_str |
seminario:seminario_nCOM000552_AmigoCarreiraMunich |
network_acronym_str |
BDUBAFCEN |
repository_id_str |
1896 |
network_name_str |
Biblioteca Digital (UBA-FCEN) |
spelling |
Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacionalAmigo, Martín IgnacioCarreira Munich, Tobías AgustínHABILIDADGOHANDICAPAPRENDIZAJECOMPARABILIDADEl Go es un juego de mesa milenario creado en Asia que, a pesar de tener reglas relativamente sencillas, presenta una enorme complejidad combinatoria en cuanto a las posibles jugadas. Esto deriva en grandes diferencias de habilidad entre distintos jugadores. Es una práctica común que, cuando la diferencia de habilidad entre dos jugadores es muy grande, se ofrezca una ventaja para producir un juego más entretenido. En la tradición del Go existe un sistema de ranking con el que se intenta clasificar a las personas en niveles con la idea de que la diferencia de niveles represente la ventaja que una persona debería otorgarle a la otra. Sin embargo, determinar la ventaja necesaria para alcanzar un buen equilibrio en el juego es un problema de difícil solución ya que depende de la estimación de la habilidad de cada uno de los jugadores. El problema de estimar la probabilidad de ganar comenzó a resolverse a mediados del siglo pasado con el objetivo de evaluar la habilidad de los jugadores profesionales de ajedrez. Desde entonces la mayor´ıa de los modelos utilizan la probabilidad del resultado observado, r, para actualizar las estimaciones de habilidad s, P( r | si , sj ). En el caso del Go, además es importante estimar el efecto que produce la ventaja en la probabilidad de ganar. Actualmente, la Asociación Argentina de Go (AAGo) reúne a las personas aficionadas del juego de Go en nuestro país y utiliza el sistema de ranking de la Asociación Estadounidense de Go. En la práctica, este algoritmo ha mostrado tener serias dificultades según manifiestan los propios miembros de la AAGo. La dificultad particular que tiene la AAGo es el tamaño de su comunidad que además está compuesta por una gran diversidad de habilidades. En esta tesis nos propusimos desarrollar un sistema para la AAGo que mejore sustancialmente las estimaciones de habilidad con las que cuentan en la actualidad haciendo un uso eficiente de los datos. Para ello, decidimos adaptar el modelo estado del arte en la industria del video juego, TrueSkill Through Time (TTT), de modo tal que incorpore los efectos de las ventajas, modelo que llamamos TTT-hreg. En vez de propagar la información en un único sentido, del pasado al futuro, TTT propaga la información a través de todo el sistema ofreciendo así mejores estimaciones de habilidad con menor cantidad de datos. Luego de su publicación original, se implementó un algoritmo similar denominado Whole History Rating (WHR), de referencia en la actualidad en la estimación de habilidad de los jugadores profesionales de Go. Ambos algoritmos que utilizan toda la historia (TTT y WHR) mostraron tener un desempeño altamente superior al algoritmo utilizado actualmente por la AAGo. En particular, el modelo WHR mostró tener predicciones a priori mejores que TTT. Por otro lado, este último tiene la ventaja de permitir agregar nuevos factores respetando las reglas de la probabilidad dentro del marco bayesiano, simplificando su uso y adaptación a nuevos contextos. En la actualidad, no es posible comparar las estimaciones de habilidad obtenidas por las diferentes Asociaciones de Go del mundo, no sólo porque utilizan sistemas diferentes, sino porque en general son bases de datos disconexas. Sin embargo, unos pocos vínculos entre bases de datos le permitirían a nuestra solución propagar la información eficientemente, garantizando la comparabilidad entre las diversas asociaciones internacionales. En este trabajo dejamos sentadas las bases para extender el uso de nuestra solución como medida de referencia internacional utilizando la base de datos completa de KGS con 100 millones de partidas de todas las asociaciones de Go del mundo.Fil: Amigo, Martín Ignacio. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Fil: Carreira Munich, Tobías Agustín. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesLandfried, Gustavo AndrésMocskos, Esteban Eduardo2022info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000552_AmigoCarreiraMunichspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-29T13:43:37Zseminario:seminario_nCOM000552_AmigoCarreiraMunichInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-29 13:43:38.105Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse |
dc.title.none.fl_str_mv |
Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional |
title |
Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional |
spellingShingle |
Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional Amigo, Martín Ignacio HABILIDAD GO HANDICAP APRENDIZAJE COMPARABILIDAD |
title_short |
Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional |
title_full |
Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional |
title_fullStr |
Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional |
title_full_unstemmed |
Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional |
title_sort |
Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional |
dc.creator.none.fl_str_mv |
Amigo, Martín Ignacio Carreira Munich, Tobías Agustín |
author |
Amigo, Martín Ignacio |
author_facet |
Amigo, Martín Ignacio Carreira Munich, Tobías Agustín |
author_role |
author |
author2 |
Carreira Munich, Tobías Agustín |
author2_role |
author |
dc.contributor.none.fl_str_mv |
Landfried, Gustavo Andrés Mocskos, Esteban Eduardo |
dc.subject.none.fl_str_mv |
HABILIDAD GO HANDICAP APRENDIZAJE COMPARABILIDAD |
topic |
HABILIDAD GO HANDICAP APRENDIZAJE COMPARABILIDAD |
dc.description.none.fl_txt_mv |
El Go es un juego de mesa milenario creado en Asia que, a pesar de tener reglas relativamente sencillas, presenta una enorme complejidad combinatoria en cuanto a las posibles jugadas. Esto deriva en grandes diferencias de habilidad entre distintos jugadores. Es una práctica común que, cuando la diferencia de habilidad entre dos jugadores es muy grande, se ofrezca una ventaja para producir un juego más entretenido. En la tradición del Go existe un sistema de ranking con el que se intenta clasificar a las personas en niveles con la idea de que la diferencia de niveles represente la ventaja que una persona debería otorgarle a la otra. Sin embargo, determinar la ventaja necesaria para alcanzar un buen equilibrio en el juego es un problema de difícil solución ya que depende de la estimación de la habilidad de cada uno de los jugadores. El problema de estimar la probabilidad de ganar comenzó a resolverse a mediados del siglo pasado con el objetivo de evaluar la habilidad de los jugadores profesionales de ajedrez. Desde entonces la mayor´ıa de los modelos utilizan la probabilidad del resultado observado, r, para actualizar las estimaciones de habilidad s, P( r | si , sj ). En el caso del Go, además es importante estimar el efecto que produce la ventaja en la probabilidad de ganar. Actualmente, la Asociación Argentina de Go (AAGo) reúne a las personas aficionadas del juego de Go en nuestro país y utiliza el sistema de ranking de la Asociación Estadounidense de Go. En la práctica, este algoritmo ha mostrado tener serias dificultades según manifiestan los propios miembros de la AAGo. La dificultad particular que tiene la AAGo es el tamaño de su comunidad que además está compuesta por una gran diversidad de habilidades. En esta tesis nos propusimos desarrollar un sistema para la AAGo que mejore sustancialmente las estimaciones de habilidad con las que cuentan en la actualidad haciendo un uso eficiente de los datos. Para ello, decidimos adaptar el modelo estado del arte en la industria del video juego, TrueSkill Through Time (TTT), de modo tal que incorpore los efectos de las ventajas, modelo que llamamos TTT-hreg. En vez de propagar la información en un único sentido, del pasado al futuro, TTT propaga la información a través de todo el sistema ofreciendo así mejores estimaciones de habilidad con menor cantidad de datos. Luego de su publicación original, se implementó un algoritmo similar denominado Whole History Rating (WHR), de referencia en la actualidad en la estimación de habilidad de los jugadores profesionales de Go. Ambos algoritmos que utilizan toda la historia (TTT y WHR) mostraron tener un desempeño altamente superior al algoritmo utilizado actualmente por la AAGo. En particular, el modelo WHR mostró tener predicciones a priori mejores que TTT. Por otro lado, este último tiene la ventaja de permitir agregar nuevos factores respetando las reglas de la probabilidad dentro del marco bayesiano, simplificando su uso y adaptación a nuevos contextos. En la actualidad, no es posible comparar las estimaciones de habilidad obtenidas por las diferentes Asociaciones de Go del mundo, no sólo porque utilizan sistemas diferentes, sino porque en general son bases de datos disconexas. Sin embargo, unos pocos vínculos entre bases de datos le permitirían a nuestra solución propagar la información eficientemente, garantizando la comparabilidad entre las diversas asociaciones internacionales. En este trabajo dejamos sentadas las bases para extender el uso de nuestra solución como medida de referencia internacional utilizando la base de datos completa de KGS con 100 millones de partidas de todas las asociaciones de Go del mundo. Fil: Amigo, Martín Ignacio. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. Fil: Carreira Munich, Tobías Agustín. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. |
description |
El Go es un juego de mesa milenario creado en Asia que, a pesar de tener reglas relativamente sencillas, presenta una enorme complejidad combinatoria en cuanto a las posibles jugadas. Esto deriva en grandes diferencias de habilidad entre distintos jugadores. Es una práctica común que, cuando la diferencia de habilidad entre dos jugadores es muy grande, se ofrezca una ventaja para producir un juego más entretenido. En la tradición del Go existe un sistema de ranking con el que se intenta clasificar a las personas en niveles con la idea de que la diferencia de niveles represente la ventaja que una persona debería otorgarle a la otra. Sin embargo, determinar la ventaja necesaria para alcanzar un buen equilibrio en el juego es un problema de difícil solución ya que depende de la estimación de la habilidad de cada uno de los jugadores. El problema de estimar la probabilidad de ganar comenzó a resolverse a mediados del siglo pasado con el objetivo de evaluar la habilidad de los jugadores profesionales de ajedrez. Desde entonces la mayor´ıa de los modelos utilizan la probabilidad del resultado observado, r, para actualizar las estimaciones de habilidad s, P( r | si , sj ). En el caso del Go, además es importante estimar el efecto que produce la ventaja en la probabilidad de ganar. Actualmente, la Asociación Argentina de Go (AAGo) reúne a las personas aficionadas del juego de Go en nuestro país y utiliza el sistema de ranking de la Asociación Estadounidense de Go. En la práctica, este algoritmo ha mostrado tener serias dificultades según manifiestan los propios miembros de la AAGo. La dificultad particular que tiene la AAGo es el tamaño de su comunidad que además está compuesta por una gran diversidad de habilidades. En esta tesis nos propusimos desarrollar un sistema para la AAGo que mejore sustancialmente las estimaciones de habilidad con las que cuentan en la actualidad haciendo un uso eficiente de los datos. Para ello, decidimos adaptar el modelo estado del arte en la industria del video juego, TrueSkill Through Time (TTT), de modo tal que incorpore los efectos de las ventajas, modelo que llamamos TTT-hreg. En vez de propagar la información en un único sentido, del pasado al futuro, TTT propaga la información a través de todo el sistema ofreciendo así mejores estimaciones de habilidad con menor cantidad de datos. Luego de su publicación original, se implementó un algoritmo similar denominado Whole History Rating (WHR), de referencia en la actualidad en la estimación de habilidad de los jugadores profesionales de Go. Ambos algoritmos que utilizan toda la historia (TTT y WHR) mostraron tener un desempeño altamente superior al algoritmo utilizado actualmente por la AAGo. En particular, el modelo WHR mostró tener predicciones a priori mejores que TTT. Por otro lado, este último tiene la ventaja de permitir agregar nuevos factores respetando las reglas de la probabilidad dentro del marco bayesiano, simplificando su uso y adaptación a nuevos contextos. En la actualidad, no es posible comparar las estimaciones de habilidad obtenidas por las diferentes Asociaciones de Go del mundo, no sólo porque utilizan sistemas diferentes, sino porque en general son bases de datos disconexas. Sin embargo, unos pocos vínculos entre bases de datos le permitirían a nuestra solución propagar la información eficientemente, garantizando la comparabilidad entre las diversas asociaciones internacionales. En este trabajo dejamos sentadas las bases para extender el uso de nuestra solución como medida de referencia internacional utilizando la base de datos completa de KGS con 100 millones de partidas de todas las asociaciones de Go del mundo. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
https://hdl.handle.net/20.500.12110/seminario_nCOM000552_AmigoCarreiraMunich |
url |
https://hdl.handle.net/20.500.12110/seminario_nCOM000552_AmigoCarreiraMunich |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital (UBA-FCEN) instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales instacron:UBA-FCEN |
reponame_str |
Biblioteca Digital (UBA-FCEN) |
collection |
Biblioteca Digital (UBA-FCEN) |
instname_str |
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
instacron_str |
UBA-FCEN |
institution |
UBA-FCEN |
repository.name.fl_str_mv |
Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
repository.mail.fl_str_mv |
ana@bl.fcen.uba.ar |
_version_ |
1844618756006871040 |
score |
13.069144 |