BRAVO: Búsqueda de Respuestas Avanzada Multimodal y Multilingüe - Recuperación de Información

Estado

Finished

Fecha de comienzo

2007-10-01

Fecha de finalización

2010-09-30

Miembros

Jose Miguel Goñi Menoyo; José Carlos González Cristóbal; Amalio Francisco Nieto Serrano; Josefa Zuleide Hernández Diego; Sara Lana Serrano (Universidad Politécnica de Madrid)

Descripción

El objetivo de este proyecto es desarrollar una plataforma para responder a preguntas sobre contenidos multimedia.
Este entorno permitirá el análisis de técnicas y métodos disponibles en varios idiomas, Recuperación de Información (IR), al responder a la pregunta (QA), la información y la extracción de la ontología así como el reconocimiento automático de voz para el habla espontánea. Además, es importante concentrarse en lengua española, tanto en lenguaje de consulta y colecciones de documentos.

Este objetivo también implica aplicar nuevas técnicas y mejorar los actuales a través de la definición de técnicas híbridas y evaluación de las mismas. El alcance del proyecto no se limita a tratar los objetos textuales, sino ampliar a objetos multimedia que se describen mediante el uso en casos particulares de representaciones documentales utilizado los objetos de texto.
Objetivos parciales son:
· Crear una plataforma multimodal de control de calidad (texto y voz) y multilingüe de acceso al contenido multimedia.

Para integrar en esta plataforma los componentes de las diferentes fases online y offline que se deben realizar en los sistemas de control de calidad mejoran el estado de la técnica en este campo (Información Recuperación, Respuesta extracción y clasificación y análisis de la pregunta)
· Definir, implementar y evaluar las actualizaciones necesarias en un subsistema de IR para integrarlo en la plataforma de control de calidad. En particular, el tratamiento de las unidades más pequeñas de documentos (sentencias, párrafos, etc) será considerado con el fin de localizar la información requerida, así como el tratamiento inteligente de las entidades (reconocimiento del nombre de entidades) y la integración de léxico y conocimiento semántico en la ampliación de consultas.
· Evaluar la plataforma en los foros internacionales, principalmente CLEF, TAC y otros.
· Desarrollar recursos lingüísticos para las lenguas árabe y japonés.
· Integrar recursos lingüísticos para permitir un mejor procesamiento del habla espontánea con el fin de ajustar un reconocedor de voz a las consultas de los usuarios.
· Diseñar modelos de datos en dominios específicos para la construcción de ontologías usando técnicas semiautomáticas.
Para lograr los objetivos planteados anteriormente el proyecto fue asignado al subproyecto 8 PDE de la LABDA-UC3M , subproyecto 5,5 de GSI-UPM y subproyecto 9 de LLI-UAM