Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional

Autores: Amigo, Martín Ignacio; Carreira Munich, Tobías Agustín
Año de publicación: 2022
Idioma: español castellano
Tipo de recurso: tesis de grado
Estado: versión publicada
Colaborador/a o director/a de tesis: Landfried, Gustavo Andrés
Mocskos, Esteban Eduardo
Descripción: El Go es un juego de mesa milenario creado en Asia que, a pesar de tener reglas relativamente sencillas, presenta una enorme complejidad combinatoria en cuanto a las posibles jugadas. Esto deriva en grandes diferencias de habilidad entre distintos jugadores. Es una práctica común que, cuando la diferencia de habilidad entre dos jugadores es muy grande, se ofrezca una ventaja para producir un juego más entretenido. En la tradición del Go existe un sistema de ranking con el que se intenta clasificar a las personas en niveles con la idea de que la diferencia de niveles represente la ventaja que una persona debería otorgarle a la otra. Sin embargo, determinar la ventaja necesaria para alcanzar un buen equilibrio en el juego es un problema de difícil solución ya que depende de la estimación de la habilidad de cada uno de los jugadores. El problema de estimar la probabilidad de ganar comenzó a resolverse a mediados del siglo pasado con el objetivo de evaluar la habilidad de los jugadores profesionales de ajedrez. Desde entonces la mayor´ıa de los modelos utilizan la probabilidad del resultado observado, r, para actualizar las estimaciones de habilidad s, P( r | si , sj ). En el caso del Go, además es importante estimar el efecto que produce la ventaja en la probabilidad de ganar. Actualmente, la Asociación Argentina de Go (AAGo) reúne a las personas aficionadas del juego de Go en nuestro país y utiliza el sistema de ranking de la Asociación Estadounidense de Go. En la práctica, este algoritmo ha mostrado tener serias dificultades según manifiestan los propios miembros de la AAGo. La dificultad particular que tiene la AAGo es el tamaño de su comunidad que además está compuesta por una gran diversidad de habilidades. En esta tesis nos propusimos desarrollar un sistema para la AAGo que mejore sustancialmente las estimaciones de habilidad con las que cuentan en la actualidad haciendo un uso eficiente de los datos. Para ello, decidimos adaptar el modelo estado del arte en la industria del video juego, TrueSkill Through Time (TTT), de modo tal que incorpore los efectos de las ventajas, modelo que llamamos TTT-hreg. En vez de propagar la información en un único sentido, del pasado al futuro, TTT propaga la información a través de todo el sistema ofreciendo así mejores estimaciones de habilidad con menor cantidad de datos. Luego de su publicación original, se implementó un algoritmo similar denominado Whole History Rating (WHR), de referencia en la actualidad en la estimación de habilidad de los jugadores profesionales de Go. Ambos algoritmos que utilizan toda la historia (TTT y WHR) mostraron tener un desempeño altamente superior al algoritmo utilizado actualmente por la AAGo. En particular, el modelo WHR mostró tener predicciones a priori mejores que TTT. Por otro lado, este último tiene la ventaja de permitir agregar nuevos factores respetando las reglas de la probabilidad dentro del marco bayesiano, simplificando su uso y adaptación a nuevos contextos. En la actualidad, no es posible comparar las estimaciones de habilidad obtenidas por las diferentes Asociaciones de Go del mundo, no sólo porque utilizan sistemas diferentes, sino porque en general son bases de datos disconexas. Sin embargo, unos pocos vínculos entre bases de datos le permitirían a nuestra solución propagar la información eficientemente, garantizando la comparabilidad entre las diversas asociaciones internacionales. En este trabajo dejamos sentadas las bases para extender el uso de nuestra solución como medida de referencia internacional utilizando la base de datos completa de KGS con 100 millones de partidas de todas las asociaciones de Go del mundo.
Fil: Amigo, Martín Ignacio. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Fil: Carreira Munich, Tobías Agustín. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia: HABILIDAD
GO
HANDICAP
APRENDIZAJE
COMPARABILIDAD
Nivel de accesibilidad: acceso abierto
Condiciones de uso: https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Institución: Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador: seminario:seminario_nCOM000552_AmigoCarreiraMunich

Acceder

id	BDUBAFCEN_b96cc801d42c57523fc9513b57fc6b85
oai_identifier_str	seminario:seminario_nCOM000552_AmigoCarreiraMunich
network_acronym_str	BDUBAFCEN
repository_id_str	1896
network_name_str	Biblioteca Digital (UBA-FCEN)
spelling	Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacionalAmigo, Martín IgnacioCarreira Munich, Tobías AgustínHABILIDADGOHANDICAPAPRENDIZAJECOMPARABILIDADEl Go es un juego de mesa milenario creado en Asia que, a pesar de tener reglas relativamente sencillas, presenta una enorme complejidad combinatoria en cuanto a las posibles jugadas. Esto deriva en grandes diferencias de habilidad entre distintos jugadores. Es una práctica común que, cuando la diferencia de habilidad entre dos jugadores es muy grande, se ofrezca una ventaja para producir un juego más entretenido. En la tradición del Go existe un sistema de ranking con el que se intenta clasificar a las personas en niveles con la idea de que la diferencia de niveles represente la ventaja que una persona debería otorgarle a la otra. Sin embargo, determinar la ventaja necesaria para alcanzar un buen equilibrio en el juego es un problema de difícil solución ya que depende de la estimación de la habilidad de cada uno de los jugadores. El problema de estimar la probabilidad de ganar comenzó a resolverse a mediados del siglo pasado con el objetivo de evaluar la habilidad de los jugadores profesionales de ajedrez. Desde entonces la mayor´ıa de los modelos utilizan la probabilidad del resultado observado, r, para actualizar las estimaciones de habilidad s, P( r \| si , sj ). En el caso del Go, además es importante estimar el efecto que produce la ventaja en la probabilidad de ganar. Actualmente, la Asociación Argentina de Go (AAGo) reúne a las personas aficionadas del juego de Go en nuestro país y utiliza el sistema de ranking de la Asociación Estadounidense de Go. En la práctica, este algoritmo ha mostrado tener serias dificultades según manifiestan los propios miembros de la AAGo. La dificultad particular que tiene la AAGo es el tamaño de su comunidad que además está compuesta por una gran diversidad de habilidades. En esta tesis nos propusimos desarrollar un sistema para la AAGo que mejore sustancialmente las estimaciones de habilidad con las que cuentan en la actualidad haciendo un uso eficiente de los datos. Para ello, decidimos adaptar el modelo estado del arte en la industria del video juego, TrueSkill Through Time (TTT), de modo tal que incorpore los efectos de las ventajas, modelo que llamamos TTT-hreg. En vez de propagar la información en un único sentido, del pasado al futuro, TTT propaga la información a través de todo el sistema ofreciendo así mejores estimaciones de habilidad con menor cantidad de datos. Luego de su publicación original, se implementó un algoritmo similar denominado Whole History Rating (WHR), de referencia en la actualidad en la estimación de habilidad de los jugadores profesionales de Go. Ambos algoritmos que utilizan toda la historia (TTT y WHR) mostraron tener un desempeño altamente superior al algoritmo utilizado actualmente por la AAGo. En particular, el modelo WHR mostró tener predicciones a priori mejores que TTT. Por otro lado, este último tiene la ventaja de permitir agregar nuevos factores respetando las reglas de la probabilidad dentro del marco bayesiano, simplificando su uso y adaptación a nuevos contextos. En la actualidad, no es posible comparar las estimaciones de habilidad obtenidas por las diferentes Asociaciones de Go del mundo, no sólo porque utilizan sistemas diferentes, sino porque en general son bases de datos disconexas. Sin embargo, unos pocos vínculos entre bases de datos le permitirían a nuestra solución propagar la información eficientemente, garantizando la comparabilidad entre las diversas asociaciones internacionales. En este trabajo dejamos sentadas las bases para extender el uso de nuestra solución como medida de referencia internacional utilizando la base de datos completa de KGS con 100 millones de partidas de todas las asociaciones de Go del mundo.Fil: Amigo, Martín Ignacio. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Fil: Carreira Munich, Tobías Agustín. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesLandfried, Gustavo AndrésMocskos, Esteban Eduardo2022info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000552_AmigoCarreiraMunichspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-12-18T09:01:05Zseminario:seminario_nCOM000552_AmigoCarreiraMunichInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-12-18 09:01:06.315Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv	Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional
title	Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional
spellingShingle	Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional Amigo, Martín Ignacio HABILIDAD GO HANDICAP APRENDIZAJE COMPARABILIDAD
title_short	Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional
title_full	Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional
title_fullStr	Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional
title_full_unstemmed	Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional
title_sort	Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional
dc.creator.none.fl_str_mv	Amigo, Martín Ignacio Carreira Munich, Tobías Agustín
author	Amigo, Martín Ignacio
author_facet	Amigo, Martín Ignacio Carreira Munich, Tobías Agustín
author_role	author
author2	Carreira Munich, Tobías Agustín
author2_role	author
dc.contributor.none.fl_str_mv	Landfried, Gustavo Andrés Mocskos, Esteban Eduardo
dc.subject.none.fl_str_mv	HABILIDAD GO HANDICAP APRENDIZAJE COMPARABILIDAD
topic	HABILIDAD GO HANDICAP APRENDIZAJE COMPARABILIDAD
dc.description.none.fl_txt_mv	El Go es un juego de mesa milenario creado en Asia que, a pesar de tener reglas relativamente sencillas, presenta una enorme complejidad combinatoria en cuanto a las posibles jugadas. Esto deriva en grandes diferencias de habilidad entre distintos jugadores. Es una práctica común que, cuando la diferencia de habilidad entre dos jugadores es muy grande, se ofrezca una ventaja para producir un juego más entretenido. En la tradición del Go existe un sistema de ranking con el que se intenta clasificar a las personas en niveles con la idea de que la diferencia de niveles represente la ventaja que una persona debería otorgarle a la otra. Sin embargo, determinar la ventaja necesaria para alcanzar un buen equilibrio en el juego es un problema de difícil solución ya que depende de la estimación de la habilidad de cada uno de los jugadores. El problema de estimar la probabilidad de ganar comenzó a resolverse a mediados del siglo pasado con el objetivo de evaluar la habilidad de los jugadores profesionales de ajedrez. Desde entonces la mayor´ıa de los modelos utilizan la probabilidad del resultado observado, r, para actualizar las estimaciones de habilidad s, P( r \| si , sj ). En el caso del Go, además es importante estimar el efecto que produce la ventaja en la probabilidad de ganar. Actualmente, la Asociación Argentina de Go (AAGo) reúne a las personas aficionadas del juego de Go en nuestro país y utiliza el sistema de ranking de la Asociación Estadounidense de Go. En la práctica, este algoritmo ha mostrado tener serias dificultades según manifiestan los propios miembros de la AAGo. La dificultad particular que tiene la AAGo es el tamaño de su comunidad que además está compuesta por una gran diversidad de habilidades. En esta tesis nos propusimos desarrollar un sistema para la AAGo que mejore sustancialmente las estimaciones de habilidad con las que cuentan en la actualidad haciendo un uso eficiente de los datos. Para ello, decidimos adaptar el modelo estado del arte en la industria del video juego, TrueSkill Through Time (TTT), de modo tal que incorpore los efectos de las ventajas, modelo que llamamos TTT-hreg. En vez de propagar la información en un único sentido, del pasado al futuro, TTT propaga la información a través de todo el sistema ofreciendo así mejores estimaciones de habilidad con menor cantidad de datos. Luego de su publicación original, se implementó un algoritmo similar denominado Whole History Rating (WHR), de referencia en la actualidad en la estimación de habilidad de los jugadores profesionales de Go. Ambos algoritmos que utilizan toda la historia (TTT y WHR) mostraron tener un desempeño altamente superior al algoritmo utilizado actualmente por la AAGo. En particular, el modelo WHR mostró tener predicciones a priori mejores que TTT. Por otro lado, este último tiene la ventaja de permitir agregar nuevos factores respetando las reglas de la probabilidad dentro del marco bayesiano, simplificando su uso y adaptación a nuevos contextos. En la actualidad, no es posible comparar las estimaciones de habilidad obtenidas por las diferentes Asociaciones de Go del mundo, no sólo porque utilizan sistemas diferentes, sino porque en general son bases de datos disconexas. Sin embargo, unos pocos vínculos entre bases de datos le permitirían a nuestra solución propagar la información eficientemente, garantizando la comparabilidad entre las diversas asociaciones internacionales. En este trabajo dejamos sentadas las bases para extender el uso de nuestra solución como medida de referencia internacional utilizando la base de datos completa de KGS con 100 millones de partidas de todas las asociaciones de Go del mundo. Fil: Amigo, Martín Ignacio. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. Fil: Carreira Munich, Tobías Agustín. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description	El Go es un juego de mesa milenario creado en Asia que, a pesar de tener reglas relativamente sencillas, presenta una enorme complejidad combinatoria en cuanto a las posibles jugadas. Esto deriva en grandes diferencias de habilidad entre distintos jugadores. Es una práctica común que, cuando la diferencia de habilidad entre dos jugadores es muy grande, se ofrezca una ventaja para producir un juego más entretenido. En la tradición del Go existe un sistema de ranking con el que se intenta clasificar a las personas en niveles con la idea de que la diferencia de niveles represente la ventaja que una persona debería otorgarle a la otra. Sin embargo, determinar la ventaja necesaria para alcanzar un buen equilibrio en el juego es un problema de difícil solución ya que depende de la estimación de la habilidad de cada uno de los jugadores. El problema de estimar la probabilidad de ganar comenzó a resolverse a mediados del siglo pasado con el objetivo de evaluar la habilidad de los jugadores profesionales de ajedrez. Desde entonces la mayor´ıa de los modelos utilizan la probabilidad del resultado observado, r, para actualizar las estimaciones de habilidad s, P( r \| si , sj ). En el caso del Go, además es importante estimar el efecto que produce la ventaja en la probabilidad de ganar. Actualmente, la Asociación Argentina de Go (AAGo) reúne a las personas aficionadas del juego de Go en nuestro país y utiliza el sistema de ranking de la Asociación Estadounidense de Go. En la práctica, este algoritmo ha mostrado tener serias dificultades según manifiestan los propios miembros de la AAGo. La dificultad particular que tiene la AAGo es el tamaño de su comunidad que además está compuesta por una gran diversidad de habilidades. En esta tesis nos propusimos desarrollar un sistema para la AAGo que mejore sustancialmente las estimaciones de habilidad con las que cuentan en la actualidad haciendo un uso eficiente de los datos. Para ello, decidimos adaptar el modelo estado del arte en la industria del video juego, TrueSkill Through Time (TTT), de modo tal que incorpore los efectos de las ventajas, modelo que llamamos TTT-hreg. En vez de propagar la información en un único sentido, del pasado al futuro, TTT propaga la información a través de todo el sistema ofreciendo así mejores estimaciones de habilidad con menor cantidad de datos. Luego de su publicación original, se implementó un algoritmo similar denominado Whole History Rating (WHR), de referencia en la actualidad en la estimación de habilidad de los jugadores profesionales de Go. Ambos algoritmos que utilizan toda la historia (TTT y WHR) mostraron tener un desempeño altamente superior al algoritmo utilizado actualmente por la AAGo. En particular, el modelo WHR mostró tener predicciones a priori mejores que TTT. Por otro lado, este último tiene la ventaja de permitir agregar nuevos factores respetando las reglas de la probabilidad dentro del marco bayesiano, simplificando su uso y adaptación a nuevos contextos. En la actualidad, no es posible comparar las estimaciones de habilidad obtenidas por las diferentes Asociaciones de Go del mundo, no sólo porque utilizan sistemas diferentes, sino porque en general son bases de datos disconexas. Sin embargo, unos pocos vínculos entre bases de datos le permitirían a nuestra solución propagar la información eficientemente, garantizando la comparabilidad entre las diversas asociaciones internacionales. En este trabajo dejamos sentadas las bases para extender el uso de nuestra solución como medida de referencia internacional utilizando la base de datos completa de KGS con 100 millones de partidas de todas las asociaciones de Go del mundo.
publishDate	2022
dc.date.none.fl_str_mv	2022
dc.type.none.fl_str_mv	info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado
format	bachelorThesis
status_str	publishedVersion
dc.identifier.none.fl_str_mv	https://hdl.handle.net/20.500.12110/seminario_nCOM000552_AmigoCarreiraMunich
url	https://hdl.handle.net/20.500.12110/seminario_nCOM000552_AmigoCarreiraMunich
dc.language.none.fl_str_mv	spa
language	spa
dc.rights.none.fl_str_mv	info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv	openAccess
rights_invalid_str_mv	https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv	Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv	reponame:Biblioteca Digital (UBA-FCEN) instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales instacron:UBA-FCEN
reponame_str	Biblioteca Digital (UBA-FCEN)
collection	Biblioteca Digital (UBA-FCEN)
instname_str	Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str	UBA-FCEN
institution	UBA-FCEN
repository.name.fl_str_mv	Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv	ana@bl.fcen.uba.ar
_version_	1851855152401612800
score	12.952241

Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional

Publicaciones similares