Reconocimiento automático de artículos científicos
- Autores
- Lavallen, Pablo J.; Bordignon, Fernando Raúl Alfredo; Tolosa, Gabriel Hernán
- Año de publicación
- 2005
- Idioma
- español castellano
- Tipo de recurso
- documento de conferencia
- Estado
- versión publicada
- Descripción
- En el presente trabajo se describe un modelo basado en un conjunto de reglas heurísticas que permite la detección automática de documentos de carácter científico a partir del análisis lógico de su estructura. En particular, se definen 4 categorías de reglas que se aplican en diferentes niveles de especificidad. Se implementó un prototipo de software a los efectos de validar y ajustar el comportamiento del modelo. Se trabajó con un corpus de formatos heterogéneos de 600 documentos relacionados al área de las ciencias de la computación y la informática, donde el 50% fueron artículos y el resto textos varios sobre el dominio del conocimiento en cuestión. Se realizaron diferentes experimentos con la intención de probar las reglas y ajustar empíricamente el valor umbral. De los experimentos realizados se obtuvieron resultados, medidos en términos de precisión, que oscilan entre 0.85 y 0.94.
Eje: Otros
Red de Universidades con Carreras en Informática (RedUNCI) - Materia
-
Ciencias Informáticas
reconocimiento automático
Graphics recognition and interpretation
Optical character recognition (OCR)
artículos científicos - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/2.5/ar/
- Repositorio
.jpg)
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/21175
Ver los metadatos del registro completo
| id |
SEDICI_15e241649654813fc46c2e76ca74f820 |
|---|---|
| oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/21175 |
| network_acronym_str |
SEDICI |
| repository_id_str |
1329 |
| network_name_str |
SEDICI (UNLP) |
| spelling |
Reconocimiento automático de artículos científicosLavallen, Pablo J.Bordignon, Fernando Raúl AlfredoTolosa, Gabriel HernánCiencias Informáticasreconocimiento automáticoGraphics recognition and interpretationOptical character recognition (OCR)artículos científicosEn el presente trabajo se describe un modelo basado en un conjunto de reglas heurísticas que permite la detección automática de documentos de carácter científico a partir del análisis lógico de su estructura. En particular, se definen 4 categorías de reglas que se aplican en diferentes niveles de especificidad. Se implementó un prototipo de software a los efectos de validar y ajustar el comportamiento del modelo. Se trabajó con un corpus de formatos heterogéneos de 600 documentos relacionados al área de las ciencias de la computación y la informática, donde el 50% fueron artículos y el resto textos varios sobre el dominio del conocimiento en cuestión. Se realizaron diferentes experimentos con la intención de probar las reglas y ajustar empíricamente el valor umbral. De los experimentos realizados se obtuvieron resultados, medidos en términos de precisión, que oscilan entre 0.85 y 0.94.Eje: OtrosRed de Universidades con Carreras en Informática (RedUNCI)2005-05info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf31-35http://sedici.unlp.edu.ar/handle/10915/21175spainfo:eu-repo/semantics/altIdentifier/isbn/950-665-337-2info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/2.5/ar/Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-10-15T10:47:10Zoai:sedici.unlp.edu.ar:10915/21175Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-10-15 10:47:10.596SEDICI (UNLP) - Universidad Nacional de La Platafalse |
| dc.title.none.fl_str_mv |
Reconocimiento automático de artículos científicos |
| title |
Reconocimiento automático de artículos científicos |
| spellingShingle |
Reconocimiento automático de artículos científicos Lavallen, Pablo J. Ciencias Informáticas reconocimiento automático Graphics recognition and interpretation Optical character recognition (OCR) artículos científicos |
| title_short |
Reconocimiento automático de artículos científicos |
| title_full |
Reconocimiento automático de artículos científicos |
| title_fullStr |
Reconocimiento automático de artículos científicos |
| title_full_unstemmed |
Reconocimiento automático de artículos científicos |
| title_sort |
Reconocimiento automático de artículos científicos |
| dc.creator.none.fl_str_mv |
Lavallen, Pablo J. Bordignon, Fernando Raúl Alfredo Tolosa, Gabriel Hernán |
| author |
Lavallen, Pablo J. |
| author_facet |
Lavallen, Pablo J. Bordignon, Fernando Raúl Alfredo Tolosa, Gabriel Hernán |
| author_role |
author |
| author2 |
Bordignon, Fernando Raúl Alfredo Tolosa, Gabriel Hernán |
| author2_role |
author author |
| dc.subject.none.fl_str_mv |
Ciencias Informáticas reconocimiento automático Graphics recognition and interpretation Optical character recognition (OCR) artículos científicos |
| topic |
Ciencias Informáticas reconocimiento automático Graphics recognition and interpretation Optical character recognition (OCR) artículos científicos |
| dc.description.none.fl_txt_mv |
En el presente trabajo se describe un modelo basado en un conjunto de reglas heurísticas que permite la detección automática de documentos de carácter científico a partir del análisis lógico de su estructura. En particular, se definen 4 categorías de reglas que se aplican en diferentes niveles de especificidad. Se implementó un prototipo de software a los efectos de validar y ajustar el comportamiento del modelo. Se trabajó con un corpus de formatos heterogéneos de 600 documentos relacionados al área de las ciencias de la computación y la informática, donde el 50% fueron artículos y el resto textos varios sobre el dominio del conocimiento en cuestión. Se realizaron diferentes experimentos con la intención de probar las reglas y ajustar empíricamente el valor umbral. De los experimentos realizados se obtuvieron resultados, medidos en términos de precisión, que oscilan entre 0.85 y 0.94. Eje: Otros Red de Universidades con Carreras en Informática (RedUNCI) |
| description |
En el presente trabajo se describe un modelo basado en un conjunto de reglas heurísticas que permite la detección automática de documentos de carácter científico a partir del análisis lógico de su estructura. En particular, se definen 4 categorías de reglas que se aplican en diferentes niveles de especificidad. Se implementó un prototipo de software a los efectos de validar y ajustar el comportamiento del modelo. Se trabajó con un corpus de formatos heterogéneos de 600 documentos relacionados al área de las ciencias de la computación y la informática, donde el 50% fueron artículos y el resto textos varios sobre el dominio del conocimiento en cuestión. Se realizaron diferentes experimentos con la intención de probar las reglas y ajustar empíricamente el valor umbral. De los experimentos realizados se obtuvieron resultados, medidos en términos de precisión, que oscilan entre 0.85 y 0.94. |
| publishDate |
2005 |
| dc.date.none.fl_str_mv |
2005-05 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia |
| format |
conferenceObject |
| status_str |
publishedVersion |
| dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/21175 |
| url |
http://sedici.unlp.edu.ar/handle/10915/21175 |
| dc.language.none.fl_str_mv |
spa |
| language |
spa |
| dc.relation.none.fl_str_mv |
info:eu-repo/semantics/altIdentifier/isbn/950-665-337-2 |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/2.5/ar/ Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5) |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/2.5/ar/ Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5) |
| dc.format.none.fl_str_mv |
application/pdf 31-35 |
| dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
| reponame_str |
SEDICI (UNLP) |
| collection |
SEDICI (UNLP) |
| instname_str |
Universidad Nacional de La Plata |
| instacron_str |
UNLP |
| institution |
UNLP |
| repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
| repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
| _version_ |
1846063896798953472 |
| score |
13.22299 |