DALI - DIGITAL AUDIO LIBRARY INDEXING

DALI (Digital Audio Library Indexing) es un sistema de recuperación de documentos de audio y vídeo mediante consultas en lenguaje natural.

Los vídeos sobre los que se busca son de los canales en YouTube de RTVE, Antena3 TV, TeleMadrid, Cuatro, Agencia EFE, EuropaPress, etc. Esos contenidos han sido procesados por medios completamente automáticos para su indexación y búsqueda. La reproducción se hace directamente desde YouTube, ya que no se mantiene copia de los mismos en nuestros servidores después del procesamiento.

La transcripción se obtiene mediante el sistema de reconocimiento automático del habla Media Mining Indexer de la compañía austriaca SAIL LABS. Daedalus es socio comercializador e integrador de su tecnología de reconocimiento de habla para España y Latinoamérica.

MMI proporciona un documento XML con dicha transcripción y con información adicional, como por ejemplo el instante de tiempo para cada frase, de manera que facilita el acceso a momentos concretos del documento audiovisual. Estas transcripciones, junto con metadatos del vídeo, se almacena en una base de datos MySQL. Por ejemplo, el canal de YouTube, la duración y la categoría del vídeo se almacenan también para permitir combinarlos con la consulta en lenguaje natural.

Dada una consulta, DALI recupera los vídeos más relevantes junto con su información asociada. La interfaz muestra la lista de dichos vídeos, el fragmento de la transcripción de audio correspondiente a la consulta del usuario, junto con un reproductor que permite acceder al vídeo directamente de YouTube.

DALI - Digital Audio Library Indexing


Pruébalo >>
DALI - Digital Audio Library Indexing (última actualización: 29/11/2011)
© 2011 Daedalus-Data, Decisions and Language, S. A.

DALI

Haz búsquedas en los diálogos de los vídeos de diferentes canales de YouTube.

Pruébalo >>