Enhancing The Recommendation of High-impact Rare-event Business News for Professionals with LLM-based Augmentation
- Autores
- Bivort Haiek, Felipe; Ankolekar, Anupriya
- Año de publicación
- 2025
- Idioma
- inglés
- Tipo de recurso
- documento de conferencia
- Estado
- versión publicada
- Descripción
- Personalized news recommendation has become an essential tool for professionals around the world to keep track of news events matching their interests and alleviate information overload. Beyond personalization, an essential aspect of useful news recommendations for professional use is that they highlight events that are more significant and of higher impact. However, we find that state-of-the-art recommenders struggle to identify and recommend news about significant events. In this paper, we address this gap as follows. To mitigate the relative scarcity of news about significant events, we use an LLM to create a synthetic dataset of significant news seeded from business-relevant news in the MIND dataset. We train four state-of-the-art recommendation models (MINER, UNBERT, UniTRec, Fastformer) with synthetically enhanced versions of a subset of the MIND dataset. We find that this successfully improves the performance of two of the recommendation models on the MIND-large dataset restricted to news about significant events in terms of the MRR, NDCG@5 and Hit@5 metrics and the performance of UNBERT on the AUC metric. The contribution of this paper is three-fold: we highlight news significance as an important aspect of useful news recommendation, we demonstrate the use of generative LLMs to create synthetic datasets for training on rare data and lastly, we demonstrate that augmenting some recommendation models with more significant news improves news recommendation performance on the MIND dataset.
La recomendación personalizada de noticias se ha convertido en una herramienta esencial para que profesionales de todo el mundo puedan mantenerse al tanto de eventos noticiosos que se ajustan a sus intereses y, al mismo tiempo, reducir la sobrecarga de información. Más allá de la personalización, un aspecto clave de las recomendaciones de noticias útiles para uso profesional es que resalten eventos más significativos y de mayor impacto. Sin embargo, encontramos que los sistemas de recomendación más avanzados tienen dificultades para identificar y recomendar noticias sobre eventos significativos. En este artículo, abordamos esta limitación de la siguiente manera. Para mitigar la escasez relativa de noticias sobre eventos significativos, utilizamos un modelo de lenguaje grande (LLM) para crear un conjunto de datos sintético de noticias significativas a partir de noticias relevantes para el ámbito empresarial del conjunto de datos MIND. Entrenamos cuatro modelos de recomendación de ´ultima generación (MINER, UNBERT, Uni-TRec, Fastformer) con versiones mejoradas sintéticamente de un subconjunto del conjunto de datos MIND. Encontramos que esto mejora con éxito el rendimiento de dos de los modelos de recomendación en el conjunto de datos MIND-large, restringido a noticias sobre eventos significativos, en términos de las métricas MRR, NDCG@5 y Hit@5, así como el rendimiento de UNBERT en la métrica AUC. La contribución de este trabajo es triple: destacamos la importancia de la significancia de las noticias como un aspecto clave en la recomendación útil de noticias; demostramos el uso de modelos generativos LLM para crear conjuntos de datos sintéticos que permitan entrenar con datos poco frecuentes; y, finalmente, demostramos que al aumentar algunos modelos de recomendación con noticias más significativas se mejora el rendimiento de la recomendación en el conjunto de datos MIND.
Sociedad Argentina de Informática e Investigación Operativa - Materia
-
Ciencias Informáticas
Recommender Systems
LLMs
Augmentation
Sistemas de recomendación
Aumentación - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/4.0/
- Repositorio
.jpg)
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/190557
Ver los metadatos del registro completo
| id |
SEDICI_0f305a9423b0dc0fe897fe87d9d7be53 |
|---|---|
| oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/190557 |
| network_acronym_str |
SEDICI |
| repository_id_str |
1329 |
| network_name_str |
SEDICI (UNLP) |
| spelling |
Enhancing The Recommendation of High-impact Rare-event Business News for Professionals with LLM-based AugmentationMejorando la recomendación de noticias de negocios sobre eventos raros de alto impacto vía aumentación por LLMsBivort Haiek, FelipeAnkolekar, AnupriyaCiencias InformáticasRecommender SystemsLLMsAugmentationSistemas de recomendaciónAumentaciónPersonalized news recommendation has become an essential tool for professionals around the world to keep track of news events matching their interests and alleviate information overload. Beyond personalization, an essential aspect of useful news recommendations for professional use is that they highlight events that are more significant and of higher impact. However, we find that state-of-the-art recommenders struggle to identify and recommend news about significant events. In this paper, we address this gap as follows. To mitigate the relative scarcity of news about significant events, we use an LLM to create a synthetic dataset of significant news seeded from business-relevant news in the MIND dataset. We train four state-of-the-art recommendation models (MINER, UNBERT, UniTRec, Fastformer) with synthetically enhanced versions of a subset of the MIND dataset. We find that this successfully improves the performance of two of the recommendation models on the MIND-large dataset restricted to news about significant events in terms of the MRR, NDCG@5 and Hit@5 metrics and the performance of UNBERT on the AUC metric. The contribution of this paper is three-fold: we highlight news significance as an important aspect of useful news recommendation, we demonstrate the use of generative LLMs to create synthetic datasets for training on rare data and lastly, we demonstrate that augmenting some recommendation models with more significant news improves news recommendation performance on the MIND dataset.La recomendación personalizada de noticias se ha convertido en una herramienta esencial para que profesionales de todo el mundo puedan mantenerse al tanto de eventos noticiosos que se ajustan a sus intereses y, al mismo tiempo, reducir la sobrecarga de información. Más allá de la personalización, un aspecto clave de las recomendaciones de noticias útiles para uso profesional es que resalten eventos más significativos y de mayor impacto. Sin embargo, encontramos que los sistemas de recomendación más avanzados tienen dificultades para identificar y recomendar noticias sobre eventos significativos. En este artículo, abordamos esta limitación de la siguiente manera. Para mitigar la escasez relativa de noticias sobre eventos significativos, utilizamos un modelo de lenguaje grande (LLM) para crear un conjunto de datos sintético de noticias significativas a partir de noticias relevantes para el ámbito empresarial del conjunto de datos MIND. Entrenamos cuatro modelos de recomendación de ´ultima generación (MINER, UNBERT, Uni-TRec, Fastformer) con versiones mejoradas sintéticamente de un subconjunto del conjunto de datos MIND. Encontramos que esto mejora con éxito el rendimiento de dos de los modelos de recomendación en el conjunto de datos MIND-large, restringido a noticias sobre eventos significativos, en términos de las métricas MRR, NDCG@5 y Hit@5, así como el rendimiento de UNBERT en la métrica AUC. La contribución de este trabajo es triple: destacamos la importancia de la significancia de las noticias como un aspecto clave en la recomendación útil de noticias; demostramos el uso de modelos generativos LLM para crear conjuntos de datos sintéticos que permitan entrenar con datos poco frecuentes; y, finalmente, demostramos que al aumentar algunos modelos de recomendación con noticias más significativas se mejora el rendimiento de la recomendación en el conjunto de datos MIND.Sociedad Argentina de Informática e Investigación Operativa2025-08info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf156-170http://sedici.unlp.edu.ar/handle/10915/190557enginfo:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/JAIIO/article/view/19779info:eu-repo/semantics/altIdentifier/issn/2451-7496info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2026-02-26T11:39:42Zoai:sedici.unlp.edu.ar:10915/190557Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292026-02-26 11:39:42.664SEDICI (UNLP) - Universidad Nacional de La Platafalse |
| dc.title.none.fl_str_mv |
Enhancing The Recommendation of High-impact Rare-event Business News for Professionals with LLM-based Augmentation Mejorando la recomendación de noticias de negocios sobre eventos raros de alto impacto vía aumentación por LLMs |
| title |
Enhancing The Recommendation of High-impact Rare-event Business News for Professionals with LLM-based Augmentation |
| spellingShingle |
Enhancing The Recommendation of High-impact Rare-event Business News for Professionals with LLM-based Augmentation Bivort Haiek, Felipe Ciencias Informáticas Recommender Systems LLMs Augmentation Sistemas de recomendación Aumentación |
| title_short |
Enhancing The Recommendation of High-impact Rare-event Business News for Professionals with LLM-based Augmentation |
| title_full |
Enhancing The Recommendation of High-impact Rare-event Business News for Professionals with LLM-based Augmentation |
| title_fullStr |
Enhancing The Recommendation of High-impact Rare-event Business News for Professionals with LLM-based Augmentation |
| title_full_unstemmed |
Enhancing The Recommendation of High-impact Rare-event Business News for Professionals with LLM-based Augmentation |
| title_sort |
Enhancing The Recommendation of High-impact Rare-event Business News for Professionals with LLM-based Augmentation |
| dc.creator.none.fl_str_mv |
Bivort Haiek, Felipe Ankolekar, Anupriya |
| author |
Bivort Haiek, Felipe |
| author_facet |
Bivort Haiek, Felipe Ankolekar, Anupriya |
| author_role |
author |
| author2 |
Ankolekar, Anupriya |
| author2_role |
author |
| dc.subject.none.fl_str_mv |
Ciencias Informáticas Recommender Systems LLMs Augmentation Sistemas de recomendación Aumentación |
| topic |
Ciencias Informáticas Recommender Systems LLMs Augmentation Sistemas de recomendación Aumentación |
| dc.description.none.fl_txt_mv |
Personalized news recommendation has become an essential tool for professionals around the world to keep track of news events matching their interests and alleviate information overload. Beyond personalization, an essential aspect of useful news recommendations for professional use is that they highlight events that are more significant and of higher impact. However, we find that state-of-the-art recommenders struggle to identify and recommend news about significant events. In this paper, we address this gap as follows. To mitigate the relative scarcity of news about significant events, we use an LLM to create a synthetic dataset of significant news seeded from business-relevant news in the MIND dataset. We train four state-of-the-art recommendation models (MINER, UNBERT, UniTRec, Fastformer) with synthetically enhanced versions of a subset of the MIND dataset. We find that this successfully improves the performance of two of the recommendation models on the MIND-large dataset restricted to news about significant events in terms of the MRR, NDCG@5 and Hit@5 metrics and the performance of UNBERT on the AUC metric. The contribution of this paper is three-fold: we highlight news significance as an important aspect of useful news recommendation, we demonstrate the use of generative LLMs to create synthetic datasets for training on rare data and lastly, we demonstrate that augmenting some recommendation models with more significant news improves news recommendation performance on the MIND dataset. La recomendación personalizada de noticias se ha convertido en una herramienta esencial para que profesionales de todo el mundo puedan mantenerse al tanto de eventos noticiosos que se ajustan a sus intereses y, al mismo tiempo, reducir la sobrecarga de información. Más allá de la personalización, un aspecto clave de las recomendaciones de noticias útiles para uso profesional es que resalten eventos más significativos y de mayor impacto. Sin embargo, encontramos que los sistemas de recomendación más avanzados tienen dificultades para identificar y recomendar noticias sobre eventos significativos. En este artículo, abordamos esta limitación de la siguiente manera. Para mitigar la escasez relativa de noticias sobre eventos significativos, utilizamos un modelo de lenguaje grande (LLM) para crear un conjunto de datos sintético de noticias significativas a partir de noticias relevantes para el ámbito empresarial del conjunto de datos MIND. Entrenamos cuatro modelos de recomendación de ´ultima generación (MINER, UNBERT, Uni-TRec, Fastformer) con versiones mejoradas sintéticamente de un subconjunto del conjunto de datos MIND. Encontramos que esto mejora con éxito el rendimiento de dos de los modelos de recomendación en el conjunto de datos MIND-large, restringido a noticias sobre eventos significativos, en términos de las métricas MRR, NDCG@5 y Hit@5, así como el rendimiento de UNBERT en la métrica AUC. La contribución de este trabajo es triple: destacamos la importancia de la significancia de las noticias como un aspecto clave en la recomendación útil de noticias; demostramos el uso de modelos generativos LLM para crear conjuntos de datos sintéticos que permitan entrenar con datos poco frecuentes; y, finalmente, demostramos que al aumentar algunos modelos de recomendación con noticias más significativas se mejora el rendimiento de la recomendación en el conjunto de datos MIND. Sociedad Argentina de Informática e Investigación Operativa |
| description |
Personalized news recommendation has become an essential tool for professionals around the world to keep track of news events matching their interests and alleviate information overload. Beyond personalization, an essential aspect of useful news recommendations for professional use is that they highlight events that are more significant and of higher impact. However, we find that state-of-the-art recommenders struggle to identify and recommend news about significant events. In this paper, we address this gap as follows. To mitigate the relative scarcity of news about significant events, we use an LLM to create a synthetic dataset of significant news seeded from business-relevant news in the MIND dataset. We train four state-of-the-art recommendation models (MINER, UNBERT, UniTRec, Fastformer) with synthetically enhanced versions of a subset of the MIND dataset. We find that this successfully improves the performance of two of the recommendation models on the MIND-large dataset restricted to news about significant events in terms of the MRR, NDCG@5 and Hit@5 metrics and the performance of UNBERT on the AUC metric. The contribution of this paper is three-fold: we highlight news significance as an important aspect of useful news recommendation, we demonstrate the use of generative LLMs to create synthetic datasets for training on rare data and lastly, we demonstrate that augmenting some recommendation models with more significant news improves news recommendation performance on the MIND dataset. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-08 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia |
| format |
conferenceObject |
| status_str |
publishedVersion |
| dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/190557 |
| url |
http://sedici.unlp.edu.ar/handle/10915/190557 |
| dc.language.none.fl_str_mv |
eng |
| language |
eng |
| dc.relation.none.fl_str_mv |
info:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/JAIIO/article/view/19779 info:eu-repo/semantics/altIdentifier/issn/2451-7496 |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
| dc.format.none.fl_str_mv |
application/pdf 156-170 |
| dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
| reponame_str |
SEDICI (UNLP) |
| collection |
SEDICI (UNLP) |
| instname_str |
Universidad Nacional de La Plata |
| instacron_str |
UNLP |
| institution |
UNLP |
| repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
| repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
| _version_ |
1858282591319228416 |
| score |
12.665996 |