Explotación de corpus paralelos alineados para el desarrollo de entornos de composición de documentos estructurados bilingües

dc.contributor.advisorAlegría Loinaz, Iñakies_ES
dc.contributor.authorCasillas Rubio, Arantzaes_ES
dc.contributor.otherFacultad de Ingenieríaes_ES
dc.contributor.otherInteligencia Artificiales_ES
dc.date.accessioned2024-01-29T08:09:47Z
dc.date.available2024-01-29T08:09:47Z
dc.date.issued2000-12-21
dc.description.abstractLa IA(Inteligencia Artificial) es un area que abarca conocimiento de muy diverso tipo y en la que, por su naturaleza interdisciplinar, se produce la convergencia de tecnicas muy diferentes. Entre las muchas aplicaciones de la IA existe una antigua y destacada, pero que se resiste a su resolucion, es el PLN (Procesamiento del Lenguaje Natural) y dentro de ese particularmente la traduccion entre textos en diferentes idiomas. Esta tesis se enfrenta de una manera realista a este problema abordandolo en su vertiente mas viable. Tiene como principal caracteristica la convergencia de diferentes tecnicas y la puesta es practica de una manera novedosa. Concretamente esta tesis aborada el tema de la composicion de documentacion especializada multilingue. Se propone una metodologia de composicion que combina diversas areas de gran actualidad dentro del PLN como son: el tratamiento de corpus, el procesamiento de documentos estructurados, los lenguajes de etiquetado, la traduccion automatica y la generacion multilingue. Con esta metodologia se crean, a partir de un corpus alineado, recursos linguisticos, memorias de traduccion y estructuras de tipo de documento, para posteriormente utilizarlos en la composicion de documentacion similar. Para llevar a la practica la metodologia propuesta es necesario desarrollar diferentes algoritmos, algunos de ellos innovadores, tanto para el tratamiento de documentos estructurados SGML,-Standard Generalize markup Languaje- como para la manipulacion y creacion de memorias de traduccion a partir de corpus alineados. A lo largo de esta memoria se justifica que SGML, es el lenguaje de etiquetado mas apropiado para anotar documentos estructurados pertenecientes a un dominio especifico que posteriormente se vayan a utilizar como base para la composicion de documentacion similar. Para demostrar la eficacia de la metodologia propuesta se ha desarrollado un prototipo de editor bilingüe que hemos llamado BiGentor. En este edites_ES
dc.identifier.urihttp://hdl.handle.net/20.500.14454/37
dc.language.isospaes_ES
dc.publisherUniversidad de Deustoes_ES
dc.subjectLógicaes_ES
dc.subjectMatemáticases_ES
dc.subjectLingüísticaes_ES
dc.subjectLógica deductivaes_ES
dc.subjectCiencia de los ordenadoreses_ES
dc.subjectLingüística aplicadaes_ES
dc.titleExplotación de corpus paralelos alineados para el desarrollo de entornos de composición de documentos estructurados bilingüeses_ES
dc.typedoctoral thesises_ES
Archivos
Colecciones