Tractament automàtic de la informació en espanyol: processament lèxic, sintàctic i semàntic

  • Subirats Ruggeberg, Carlos (PI)
  • Torres Hernández, Maria Judit (Becari/a)
  • Colás Pasamontes, José (Col.laborador/a)
  • Cristóbal de Gregorio, María (Col.laborador/a)
  • Emilia Victoria Enríquez Carrasco (Col.laborador/a)
  • Mairal Usón, Ricardo (Col.laborador/a)
  • Bobes Soler, Eulalia De (Investigador/a contractat/da)
  • Fuentes Morán, Teresa (Investigador/a contractat/da)
  • Garcia De Quesada, Mercedes (Investigador/a contractat/da)
  • Garrido Íñigo, Paloma (Investigador/a contractat/da)
  • Moya Sariñena, Lidia (Investigador/a contractat/da)
  • Ortega Gil, Marc (Investigador/a contractat/da)
  • Pascual Dominguez, Blanca (Investigador/a contractat/da)
  • Rios Mestre, Antonio (Investigador/a)

Detalls del projecte

Descripció

1. El primer objectiu d'aquest projecte és ampliar la cobertura lèxica i desenvolupar les aplicacions informàtiques d'un sistema que processa automàticament la informació lèxica i sintàctica mitjançant diccionaris i sintaxis computacionals, i algorismes d'intersecció de autòmates. Els algoritmes d'intersecció de autòmates intersecten un text convertit prèviament en un autòmata finit determinista (AFD), les transicions del qual estan etiquetades amb informació d'un diccionari electrònic, amb transductors p-subsecuencials que es generen automàticament a partir de sintaxis computacionals que formalitzen les construccions sintàctiques associades als predicats de l'espanyol. La intersecció del AFD (text) amb els transductors (construccions sintàctiques) és un AFD transducit en el qual es restitueixen de forma no ambigua les relacions de predicació. 2. El segon objectiu d'aquest projecte és desenvolupar un corpus amb etiquetació semàntica que tingui aplicacions per al processament automàtic de la informació textual. La selecció de les oracions d'aquest corpus es realitzarà automàticament amb criteris sintàctics mitjançant les eines d'anàlisi lèxica i sintàctic de 1. La etiquetació semàntica es desenvoluparà dintre de la teoria de la semàntica de marcs (frame semantics) amb la col·laboració del projecte Framenet\super 1\nosuper , que cedirà les següents eines per al desenvolupament del projecte: (1) la base de dades que gestionarà el corpus, (2) les eines de etiquetació semiautomàtica i (3) les aplicacions d'explotació del corpus per al processament semàntic automàtic de textos.
EstatusAcabat
Data efectiva d'inici i finalització1/12/021/12/05

Finançament

  • Ministerio de Ciencia y Tecnología (MCYT): 160.080,00 €

Fingerprint

Explora els temes de recerca tractats en aquest projecte. Les etiquetes es generen en funció dels ajuts rebuts. Juntes formen un fingerprint únic.