Método de corrección ortográfica basado en trigramas y distancia de edición
- Autores
- Bordignon, Fernando Raúl Alfredo; Tolosa, Gabriel Hernán; Peri, Jorge Alberto; Barrientos, Diego
- Año de publicación
- 2005
- Idioma
- español castellano
- Tipo de recurso
- documento de conferencia
- Estado
- versión publicada
- Descripción
- En este trabajo se exponen los primeros resultados obtenidos de evaluación de un método de corrección ortográfica. Éste permite identificar errores y generar una lista de posibles reemplazos ordenada de acuerdo a la distancia que las sugerencias mantienen con la palabra incorrecta. El método opera en dos etapas de procesamiento. Primero, mediante la utilización de un filtro basado en trigramas se construye una lista de términos candidatos; luego, se ordena la lista utilizando la métrica distancia de edición. Los primeros resultados muestran el método basado en trigramas es una alternativa válida para la corrección de errores de ortografía, alcanzando un rendimiento cercano al 81%. Especialmente, se debe considerar que se trata de un corrector de ortografía de propósito general basado en palabras aisladas y sin ningún tipo de información del contexto.
Eje: Otros
Red de Universidades con Carreras en Informática (RedUNCI) - Materia
-
Ciencias Informáticas
corrección ortográfica
edición
Optical character recognition (OCR)
trigramas
Edge and feature detection
distancia de edición - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/2.5/ar/
- Repositorio
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/21174
Ver los metadatos del registro completo
id |
SEDICI_45157c83f549113f72d9a35e4bbcd472 |
---|---|
oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/21174 |
network_acronym_str |
SEDICI |
repository_id_str |
1329 |
network_name_str |
SEDICI (UNLP) |
spelling |
Método de corrección ortográfica basado en trigramas y distancia de ediciónBordignon, Fernando Raúl AlfredoTolosa, Gabriel HernánPeri, Jorge AlbertoBarrientos, DiegoCiencias Informáticascorrección ortográficaediciónOptical character recognition (OCR)trigramasEdge and feature detectiondistancia de ediciónEn este trabajo se exponen los primeros resultados obtenidos de evaluación de un método de corrección ortográfica. Éste permite identificar errores y generar una lista de posibles reemplazos ordenada de acuerdo a la distancia que las sugerencias mantienen con la palabra incorrecta. El método opera en dos etapas de procesamiento. Primero, mediante la utilización de un filtro basado en trigramas se construye una lista de términos candidatos; luego, se ordena la lista utilizando la métrica distancia de edición. Los primeros resultados muestran el método basado en trigramas es una alternativa válida para la corrección de errores de ortografía, alcanzando un rendimiento cercano al 81%. Especialmente, se debe considerar que se trata de un corrector de ortografía de propósito general basado en palabras aisladas y sin ningún tipo de información del contexto.Eje: OtrosRed de Universidades con Carreras en Informática (RedUNCI)2005-05info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf26-30http://sedici.unlp.edu.ar/handle/10915/21174spainfo:eu-repo/semantics/altIdentifier/isbn/950-665-337-2info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/2.5/ar/Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-03T10:27:21Zoai:sedici.unlp.edu.ar:10915/21174Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-03 10:27:21.818SEDICI (UNLP) - Universidad Nacional de La Platafalse |
dc.title.none.fl_str_mv |
Método de corrección ortográfica basado en trigramas y distancia de edición |
title |
Método de corrección ortográfica basado en trigramas y distancia de edición |
spellingShingle |
Método de corrección ortográfica basado en trigramas y distancia de edición Bordignon, Fernando Raúl Alfredo Ciencias Informáticas corrección ortográfica edición Optical character recognition (OCR) trigramas Edge and feature detection distancia de edición |
title_short |
Método de corrección ortográfica basado en trigramas y distancia de edición |
title_full |
Método de corrección ortográfica basado en trigramas y distancia de edición |
title_fullStr |
Método de corrección ortográfica basado en trigramas y distancia de edición |
title_full_unstemmed |
Método de corrección ortográfica basado en trigramas y distancia de edición |
title_sort |
Método de corrección ortográfica basado en trigramas y distancia de edición |
dc.creator.none.fl_str_mv |
Bordignon, Fernando Raúl Alfredo Tolosa, Gabriel Hernán Peri, Jorge Alberto Barrientos, Diego |
author |
Bordignon, Fernando Raúl Alfredo |
author_facet |
Bordignon, Fernando Raúl Alfredo Tolosa, Gabriel Hernán Peri, Jorge Alberto Barrientos, Diego |
author_role |
author |
author2 |
Tolosa, Gabriel Hernán Peri, Jorge Alberto Barrientos, Diego |
author2_role |
author author author |
dc.subject.none.fl_str_mv |
Ciencias Informáticas corrección ortográfica edición Optical character recognition (OCR) trigramas Edge and feature detection distancia de edición |
topic |
Ciencias Informáticas corrección ortográfica edición Optical character recognition (OCR) trigramas Edge and feature detection distancia de edición |
dc.description.none.fl_txt_mv |
En este trabajo se exponen los primeros resultados obtenidos de evaluación de un método de corrección ortográfica. Éste permite identificar errores y generar una lista de posibles reemplazos ordenada de acuerdo a la distancia que las sugerencias mantienen con la palabra incorrecta. El método opera en dos etapas de procesamiento. Primero, mediante la utilización de un filtro basado en trigramas se construye una lista de términos candidatos; luego, se ordena la lista utilizando la métrica distancia de edición. Los primeros resultados muestran el método basado en trigramas es una alternativa válida para la corrección de errores de ortografía, alcanzando un rendimiento cercano al 81%. Especialmente, se debe considerar que se trata de un corrector de ortografía de propósito general basado en palabras aisladas y sin ningún tipo de información del contexto. Eje: Otros Red de Universidades con Carreras en Informática (RedUNCI) |
description |
En este trabajo se exponen los primeros resultados obtenidos de evaluación de un método de corrección ortográfica. Éste permite identificar errores y generar una lista de posibles reemplazos ordenada de acuerdo a la distancia que las sugerencias mantienen con la palabra incorrecta. El método opera en dos etapas de procesamiento. Primero, mediante la utilización de un filtro basado en trigramas se construye una lista de términos candidatos; luego, se ordena la lista utilizando la métrica distancia de edición. Los primeros resultados muestran el método basado en trigramas es una alternativa válida para la corrección de errores de ortografía, alcanzando un rendimiento cercano al 81%. Especialmente, se debe considerar que se trata de un corrector de ortografía de propósito general basado en palabras aisladas y sin ningún tipo de información del contexto. |
publishDate |
2005 |
dc.date.none.fl_str_mv |
2005-05 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia |
format |
conferenceObject |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/21174 |
url |
http://sedici.unlp.edu.ar/handle/10915/21174 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.relation.none.fl_str_mv |
info:eu-repo/semantics/altIdentifier/isbn/950-665-337-2 |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/2.5/ar/ Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5) |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/2.5/ar/ Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5) |
dc.format.none.fl_str_mv |
application/pdf 26-30 |
dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
reponame_str |
SEDICI (UNLP) |
collection |
SEDICI (UNLP) |
instname_str |
Universidad Nacional de La Plata |
instacron_str |
UNLP |
institution |
UNLP |
repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
_version_ |
1842260111001649152 |
score |
13.13397 |