Integración de métodos de descubrimiento de conocimiento embebido en fuentes de información desestructuradas

Autores
Rodríguez, Juan Manuel
Año de publicación
2025
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
En el año 2007 Michele Banko introduce un nuevo concepto en materia de extracción de información a partir de textos, al que llama en inglés: Open Information Extraction (Open IE o OIE). Se trata de un paradigma de extracción de conocimiento en donde un sistema informático realiza una sola pasada sobre el total de las fuentes de información no estructurada en formato de lenguaje natural (llamado corpus de documentos), dadas como entrada y extrae un gran conjunto de tuplas relacionales sin requerir ningún tipo de intervención humana. En el mismo trabajo Banko presenta un método llamado TEXTRUNNER, el cual es el primer método que trabaja dentro de este nuevo paradigma. A partir de este trabajo se propusieron otros métodos de extracción de conocimiento bajo el paradigma que Banko llamó Open Information Extraction y que en español se lo puede llamar de forma más concreta: métodos de extracción de conocimiento para la Web, debido a que están pensados para trabajar con los grandes volúmenes de datos que provienen de Internet en general y de la Web en particular.
Red de Universidades con Carreras en Informática
Materia
Ciencias Informáticas
Extracción de conocimiento
Open Information Extraction
Paradigmas
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/184465

id SEDICI_d9ff4c8399a662895df1f57a1a9d7d25
oai_identifier_str oai:sedici.unlp.edu.ar:10915/184465
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Integración de métodos de descubrimiento de conocimiento embebido en fuentes de información desestructuradasRodríguez, Juan ManuelCiencias InformáticasExtracción de conocimientoOpen Information ExtractionParadigmasEn el año 2007 Michele Banko introduce un nuevo concepto en materia de extracción de información a partir de textos, al que llama en inglés: Open Information Extraction (Open IE o OIE). Se trata de un paradigma de extracción de conocimiento en donde un sistema informático realiza una sola pasada sobre el total de las fuentes de información no estructurada en formato de lenguaje natural (llamado corpus de documentos), dadas como entrada y extrae un gran conjunto de tuplas relacionales sin requerir ningún tipo de intervención humana. En el mismo trabajo Banko presenta un método llamado TEXTRUNNER, el cual es el primer método que trabaja dentro de este nuevo paradigma. A partir de este trabajo se propusieron otros métodos de extracción de conocimiento bajo el paradigma que Banko llamó Open Information Extraction y que en español se lo puede llamar de forma más concreta: métodos de extracción de conocimiento para la Web, debido a que están pensados para trabajar con los grandes volúmenes de datos que provienen de Internet en general y de la Web en particular.Red de Universidades con Carreras en Informática2025-04info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf790-794http://sedici.unlp.edu.ar/handle/10915/184465spainfo:eu-repo/semantics/altIdentifier/isbn/978-987-575-267-2info:eu-repo/semantics/reference/url/https://sedici.unlp.edu.ar/handle/10915/182261info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-10-22T17:31:11Zoai:sedici.unlp.edu.ar:10915/184465Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-10-22 17:31:11.556SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Integración de métodos de descubrimiento de conocimiento embebido en fuentes de información desestructuradas
title Integración de métodos de descubrimiento de conocimiento embebido en fuentes de información desestructuradas
spellingShingle Integración de métodos de descubrimiento de conocimiento embebido en fuentes de información desestructuradas
Rodríguez, Juan Manuel
Ciencias Informáticas
Extracción de conocimiento
Open Information Extraction
Paradigmas
title_short Integración de métodos de descubrimiento de conocimiento embebido en fuentes de información desestructuradas
title_full Integración de métodos de descubrimiento de conocimiento embebido en fuentes de información desestructuradas
title_fullStr Integración de métodos de descubrimiento de conocimiento embebido en fuentes de información desestructuradas
title_full_unstemmed Integración de métodos de descubrimiento de conocimiento embebido en fuentes de información desestructuradas
title_sort Integración de métodos de descubrimiento de conocimiento embebido en fuentes de información desestructuradas
dc.creator.none.fl_str_mv Rodríguez, Juan Manuel
author Rodríguez, Juan Manuel
author_facet Rodríguez, Juan Manuel
author_role author
dc.subject.none.fl_str_mv Ciencias Informáticas
Extracción de conocimiento
Open Information Extraction
Paradigmas
topic Ciencias Informáticas
Extracción de conocimiento
Open Information Extraction
Paradigmas
dc.description.none.fl_txt_mv En el año 2007 Michele Banko introduce un nuevo concepto en materia de extracción de información a partir de textos, al que llama en inglés: Open Information Extraction (Open IE o OIE). Se trata de un paradigma de extracción de conocimiento en donde un sistema informático realiza una sola pasada sobre el total de las fuentes de información no estructurada en formato de lenguaje natural (llamado corpus de documentos), dadas como entrada y extrae un gran conjunto de tuplas relacionales sin requerir ningún tipo de intervención humana. En el mismo trabajo Banko presenta un método llamado TEXTRUNNER, el cual es el primer método que trabaja dentro de este nuevo paradigma. A partir de este trabajo se propusieron otros métodos de extracción de conocimiento bajo el paradigma que Banko llamó Open Information Extraction y que en español se lo puede llamar de forma más concreta: métodos de extracción de conocimiento para la Web, debido a que están pensados para trabajar con los grandes volúmenes de datos que provienen de Internet en general y de la Web en particular.
Red de Universidades con Carreras en Informática
description En el año 2007 Michele Banko introduce un nuevo concepto en materia de extracción de información a partir de textos, al que llama en inglés: Open Information Extraction (Open IE o OIE). Se trata de un paradigma de extracción de conocimiento en donde un sistema informático realiza una sola pasada sobre el total de las fuentes de información no estructurada en formato de lenguaje natural (llamado corpus de documentos), dadas como entrada y extrae un gran conjunto de tuplas relacionales sin requerir ningún tipo de intervención humana. En el mismo trabajo Banko presenta un método llamado TEXTRUNNER, el cual es el primer método que trabaja dentro de este nuevo paradigma. A partir de este trabajo se propusieron otros métodos de extracción de conocimiento bajo el paradigma que Banko llamó Open Information Extraction y que en español se lo puede llamar de forma más concreta: métodos de extracción de conocimiento para la Web, debido a que están pensados para trabajar con los grandes volúmenes de datos que provienen de Internet en general y de la Web en particular.
publishDate 2025
dc.date.none.fl_str_mv 2025-04
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/184465
url http://sedici.unlp.edu.ar/handle/10915/184465
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/isbn/978-987-575-267-2
info:eu-repo/semantics/reference/url/https://sedici.unlp.edu.ar/handle/10915/182261
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
790-794
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1846783818428579840
score 12.982451