A methodological study of factorization machines

Autores
Prillo, Sebastián
Año de publicación
2019
Idioma
inglés
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Lombardi, Leandro Ezequiel
Descripción
La tarea de un sistema de recomendación es recomendarle a usuarios (tales como un usuario de Netflix, un usuario navegando Amazon, o un usuario escuchando música en Spotify) productos nuevos e interesantes (tales como pel´ıculas nuevas para mirar, productos para comprar, o música para escuchar). Con la llegada del e-commerce, los sistemas de recomendación se han vuelto ubicuos y la investigación en sistemas de recomendación ha prosperado. En este trabajo estudiamos las Máquinas de Factorización (FMs), un modelo de aprendizaje automático que forma parte del estado del arte en problemas de recomendación. Nuestro objetivo es estudiar dos aspectos de las FMs: la simetría de la ecuación del modelo FM, y la viabilidad de parametrizar de forma continua el orden de interacción de las FMs como propuesto en las FMs de orden intermedio. Más en general, en este trabajo tratamos de desarrollar una comprensión más profunda sobre el sesgo inductivo de las FMs. Este trabajo se basa en [1] y complementa la propuesta original con experimentación extensiva y análisis. Con respecto a la asimetría de las FMs, mostramos que esto tiene un impacto no trivial sobre las predicciones de las FMs. Por este motivo, mostramos que ensamblar dos FMs, una entrenada sobre los datos originales y otra entrenada luego de negar el valor de la variable respuesta, puede llevar a mejoras inusualmente grandes de performance (cuando se lo compara con la mejora de performance típicamente observada al ensamblar dos modelos de la misma clase). También consideramos una formulación simétrica de FMs para la cual la estrategia de ensamblado puede ser vista como una estrategia efectiva de regularización. Con respecto a parametrizar de forma continua el orden de interacción de FMs, mostramos que esto puede ser efectivo cuando las FMs se usan como predictor general, en algunos casos obteniendo performance comparable a la de predictores generales estado del arte como los gradient boosted decision trees (GBDTs). Por otra parte, cuando lo utilizamos en el contexto de problemas de recomendación, obtenemos poca o ninguna mejora.
The task of a recommender system is to recommend to users (such as a Netflix user, a user browsing on Amazon, or a user listening to music on Spotify) interesting, novel products (such as new movies to watch, products to purchase, or music to listen to). With the advent of e-commerce, recommender systems have become ubiquitous and research on recommender systems has thrived. In this work we study Factorization Machines (FMs), a state-of-the-art machine learning model which excels at recommendation problems. Our goal is to study two aspects of FMs: the asymmetry of the FM model equation, and the viability of continuously parameterizing the interaction order in FMs as proposed by Intermediate-Order FMs. More generally, in this work we try to develop a deeper understanding about the inductive bias of FMs. This work is based on [1] and complements the original proposal with thorough experimentation and analysis. Regarding the asymmetry of FMs, we show that it has a non-trivial impact on the predictions of FMs. Because of this, we show that ensembling two FMs, one trained on the original data and another trained after reversing the value of the response variable, can lead to unusually large performance improvements (when compared to the performance improvement typically observed by ensembling two models from the same model family). We consider a symmetric formulation of FMs for which the ensemble strategy can be seen as an effective regularization technique. Regarding continuously parameterizing the interaction order in FMs, we show that this can be effective when FMs are used as a general predictor, in some cases nearing the performance of state-of-the-art general predictors such as gradient boosted decision trees. On the other hand, when used in the context of recommendation problems, we obtain little to no improvement.
Fil: Prillo, Sebastián. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
APRENDIZAJE AUTOMATICO
SISTEMAS DE RECOMENDACION
MAQUINAS DE FACTORIZACION
FACTORIZACION DE MATRICES
KERNEL ANOVA
MACHINE LEARNING
RECOMMENDER SYSTEMS
FACTORIZATION MACHINES
MATRIX FACTORIZATION
ANOVA KERNEL
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
seminario:seminario_nCOM000621_Prillo

id BDUBAFCEN_66759a47cf506cdc7dfc1e9944223a16
oai_identifier_str seminario:seminario_nCOM000621_Prillo
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling A methodological study of factorization machinesUn estudio metodológico sobre máquinas de factorizaciónPrillo, SebastiánAPRENDIZAJE AUTOMATICOSISTEMAS DE RECOMENDACIONMAQUINAS DE FACTORIZACIONFACTORIZACION DE MATRICESKERNEL ANOVAMACHINE LEARNINGRECOMMENDER SYSTEMSFACTORIZATION MACHINESMATRIX FACTORIZATIONANOVA KERNELLa tarea de un sistema de recomendación es recomendarle a usuarios (tales como un usuario de Netflix, un usuario navegando Amazon, o un usuario escuchando música en Spotify) productos nuevos e interesantes (tales como pel´ıculas nuevas para mirar, productos para comprar, o música para escuchar). Con la llegada del e-commerce, los sistemas de recomendación se han vuelto ubicuos y la investigación en sistemas de recomendación ha prosperado. En este trabajo estudiamos las Máquinas de Factorización (FMs), un modelo de aprendizaje automático que forma parte del estado del arte en problemas de recomendación. Nuestro objetivo es estudiar dos aspectos de las FMs: la simetría de la ecuación del modelo FM, y la viabilidad de parametrizar de forma continua el orden de interacción de las FMs como propuesto en las FMs de orden intermedio. Más en general, en este trabajo tratamos de desarrollar una comprensión más profunda sobre el sesgo inductivo de las FMs. Este trabajo se basa en [1] y complementa la propuesta original con experimentación extensiva y análisis. Con respecto a la asimetría de las FMs, mostramos que esto tiene un impacto no trivial sobre las predicciones de las FMs. Por este motivo, mostramos que ensamblar dos FMs, una entrenada sobre los datos originales y otra entrenada luego de negar el valor de la variable respuesta, puede llevar a mejoras inusualmente grandes de performance (cuando se lo compara con la mejora de performance típicamente observada al ensamblar dos modelos de la misma clase). También consideramos una formulación simétrica de FMs para la cual la estrategia de ensamblado puede ser vista como una estrategia efectiva de regularización. Con respecto a parametrizar de forma continua el orden de interacción de FMs, mostramos que esto puede ser efectivo cuando las FMs se usan como predictor general, en algunos casos obteniendo performance comparable a la de predictores generales estado del arte como los gradient boosted decision trees (GBDTs). Por otra parte, cuando lo utilizamos en el contexto de problemas de recomendación, obtenemos poca o ninguna mejora.The task of a recommender system is to recommend to users (such as a Netflix user, a user browsing on Amazon, or a user listening to music on Spotify) interesting, novel products (such as new movies to watch, products to purchase, or music to listen to). With the advent of e-commerce, recommender systems have become ubiquitous and research on recommender systems has thrived. In this work we study Factorization Machines (FMs), a state-of-the-art machine learning model which excels at recommendation problems. Our goal is to study two aspects of FMs: the asymmetry of the FM model equation, and the viability of continuously parameterizing the interaction order in FMs as proposed by Intermediate-Order FMs. More generally, in this work we try to develop a deeper understanding about the inductive bias of FMs. This work is based on [1] and complements the original proposal with thorough experimentation and analysis. Regarding the asymmetry of FMs, we show that it has a non-trivial impact on the predictions of FMs. Because of this, we show that ensembling two FMs, one trained on the original data and another trained after reversing the value of the response variable, can lead to unusually large performance improvements (when compared to the performance improvement typically observed by ensembling two models from the same model family). We consider a symmetric formulation of FMs for which the ensemble strategy can be seen as an effective regularization technique. Regarding continuously parameterizing the interaction order in FMs, we show that this can be effective when FMs are used as a general predictor, in some cases nearing the performance of state-of-the-art general predictors such as gradient boosted decision trees. On the other hand, when used in the context of recommendation problems, we obtain little to no improvement.Fil: Prillo, Sebastián. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesLombardi, Leandro Ezequiel2019info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000621_Prilloenginfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-29T13:43:36Zseminario:seminario_nCOM000621_PrilloInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-29 13:43:37.901Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv A methodological study of factorization machines
Un estudio metodológico sobre máquinas de factorización
title A methodological study of factorization machines
spellingShingle A methodological study of factorization machines
Prillo, Sebastián
APRENDIZAJE AUTOMATICO
SISTEMAS DE RECOMENDACION
MAQUINAS DE FACTORIZACION
FACTORIZACION DE MATRICES
KERNEL ANOVA
MACHINE LEARNING
RECOMMENDER SYSTEMS
FACTORIZATION MACHINES
MATRIX FACTORIZATION
ANOVA KERNEL
title_short A methodological study of factorization machines
title_full A methodological study of factorization machines
title_fullStr A methodological study of factorization machines
title_full_unstemmed A methodological study of factorization machines
title_sort A methodological study of factorization machines
dc.creator.none.fl_str_mv Prillo, Sebastián
author Prillo, Sebastián
author_facet Prillo, Sebastián
author_role author
dc.contributor.none.fl_str_mv Lombardi, Leandro Ezequiel
dc.subject.none.fl_str_mv APRENDIZAJE AUTOMATICO
SISTEMAS DE RECOMENDACION
MAQUINAS DE FACTORIZACION
FACTORIZACION DE MATRICES
KERNEL ANOVA
MACHINE LEARNING
RECOMMENDER SYSTEMS
FACTORIZATION MACHINES
MATRIX FACTORIZATION
ANOVA KERNEL
topic APRENDIZAJE AUTOMATICO
SISTEMAS DE RECOMENDACION
MAQUINAS DE FACTORIZACION
FACTORIZACION DE MATRICES
KERNEL ANOVA
MACHINE LEARNING
RECOMMENDER SYSTEMS
FACTORIZATION MACHINES
MATRIX FACTORIZATION
ANOVA KERNEL
dc.description.none.fl_txt_mv La tarea de un sistema de recomendación es recomendarle a usuarios (tales como un usuario de Netflix, un usuario navegando Amazon, o un usuario escuchando música en Spotify) productos nuevos e interesantes (tales como pel´ıculas nuevas para mirar, productos para comprar, o música para escuchar). Con la llegada del e-commerce, los sistemas de recomendación se han vuelto ubicuos y la investigación en sistemas de recomendación ha prosperado. En este trabajo estudiamos las Máquinas de Factorización (FMs), un modelo de aprendizaje automático que forma parte del estado del arte en problemas de recomendación. Nuestro objetivo es estudiar dos aspectos de las FMs: la simetría de la ecuación del modelo FM, y la viabilidad de parametrizar de forma continua el orden de interacción de las FMs como propuesto en las FMs de orden intermedio. Más en general, en este trabajo tratamos de desarrollar una comprensión más profunda sobre el sesgo inductivo de las FMs. Este trabajo se basa en [1] y complementa la propuesta original con experimentación extensiva y análisis. Con respecto a la asimetría de las FMs, mostramos que esto tiene un impacto no trivial sobre las predicciones de las FMs. Por este motivo, mostramos que ensamblar dos FMs, una entrenada sobre los datos originales y otra entrenada luego de negar el valor de la variable respuesta, puede llevar a mejoras inusualmente grandes de performance (cuando se lo compara con la mejora de performance típicamente observada al ensamblar dos modelos de la misma clase). También consideramos una formulación simétrica de FMs para la cual la estrategia de ensamblado puede ser vista como una estrategia efectiva de regularización. Con respecto a parametrizar de forma continua el orden de interacción de FMs, mostramos que esto puede ser efectivo cuando las FMs se usan como predictor general, en algunos casos obteniendo performance comparable a la de predictores generales estado del arte como los gradient boosted decision trees (GBDTs). Por otra parte, cuando lo utilizamos en el contexto de problemas de recomendación, obtenemos poca o ninguna mejora.
The task of a recommender system is to recommend to users (such as a Netflix user, a user browsing on Amazon, or a user listening to music on Spotify) interesting, novel products (such as new movies to watch, products to purchase, or music to listen to). With the advent of e-commerce, recommender systems have become ubiquitous and research on recommender systems has thrived. In this work we study Factorization Machines (FMs), a state-of-the-art machine learning model which excels at recommendation problems. Our goal is to study two aspects of FMs: the asymmetry of the FM model equation, and the viability of continuously parameterizing the interaction order in FMs as proposed by Intermediate-Order FMs. More generally, in this work we try to develop a deeper understanding about the inductive bias of FMs. This work is based on [1] and complements the original proposal with thorough experimentation and analysis. Regarding the asymmetry of FMs, we show that it has a non-trivial impact on the predictions of FMs. Because of this, we show that ensembling two FMs, one trained on the original data and another trained after reversing the value of the response variable, can lead to unusually large performance improvements (when compared to the performance improvement typically observed by ensembling two models from the same model family). We consider a symmetric formulation of FMs for which the ensemble strategy can be seen as an effective regularization technique. Regarding continuously parameterizing the interaction order in FMs, we show that this can be effective when FMs are used as a general predictor, in some cases nearing the performance of state-of-the-art general predictors such as gradient boosted decision trees. On the other hand, when used in the context of recommendation problems, we obtain little to no improvement.
Fil: Prillo, Sebastián. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description La tarea de un sistema de recomendación es recomendarle a usuarios (tales como un usuario de Netflix, un usuario navegando Amazon, o un usuario escuchando música en Spotify) productos nuevos e interesantes (tales como pel´ıculas nuevas para mirar, productos para comprar, o música para escuchar). Con la llegada del e-commerce, los sistemas de recomendación se han vuelto ubicuos y la investigación en sistemas de recomendación ha prosperado. En este trabajo estudiamos las Máquinas de Factorización (FMs), un modelo de aprendizaje automático que forma parte del estado del arte en problemas de recomendación. Nuestro objetivo es estudiar dos aspectos de las FMs: la simetría de la ecuación del modelo FM, y la viabilidad de parametrizar de forma continua el orden de interacción de las FMs como propuesto en las FMs de orden intermedio. Más en general, en este trabajo tratamos de desarrollar una comprensión más profunda sobre el sesgo inductivo de las FMs. Este trabajo se basa en [1] y complementa la propuesta original con experimentación extensiva y análisis. Con respecto a la asimetría de las FMs, mostramos que esto tiene un impacto no trivial sobre las predicciones de las FMs. Por este motivo, mostramos que ensamblar dos FMs, una entrenada sobre los datos originales y otra entrenada luego de negar el valor de la variable respuesta, puede llevar a mejoras inusualmente grandes de performance (cuando se lo compara con la mejora de performance típicamente observada al ensamblar dos modelos de la misma clase). También consideramos una formulación simétrica de FMs para la cual la estrategia de ensamblado puede ser vista como una estrategia efectiva de regularización. Con respecto a parametrizar de forma continua el orden de interacción de FMs, mostramos que esto puede ser efectivo cuando las FMs se usan como predictor general, en algunos casos obteniendo performance comparable a la de predictores generales estado del arte como los gradient boosted decision trees (GBDTs). Por otra parte, cuando lo utilizamos en el contexto de problemas de recomendación, obtenemos poca o ninguna mejora.
publishDate 2019
dc.date.none.fl_str_mv 2019
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/seminario_nCOM000621_Prillo
url https://hdl.handle.net/20.500.12110/seminario_nCOM000621_Prillo
dc.language.none.fl_str_mv eng
language eng
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1844618755632529408
score 13.070432