Google silenciosamente ha lanzado una herramienta de búsqueda llamada GAudi [1] esta semana en Google Labs [2]. Por ahora, Google está usando la herramienta para propósitos de experimentación para indexar el contenido político en los vídeos YouTube, pero las probabilidades son que estén explorando esto como servicio y lo expandirán en algún punto en el futuro. Arnaud Sahuguet, el adminsitrador de producto para Google Audio Indexing explicó exactamente qué significa este nuevo desarrollo.
Hasta ahora, sólo algunas pequeñas compañías de búsqueda multimedia han sido capaces de indexar el audio de manera efectiva, incluyendo Nexidia [3] y TVEyes [4], dos compañías pioneras en el espacio de indexación audio. De hecho escribí acerca de estas compañías en un artículo de Streaming Media Magazine el año pasado llamado The Search is On [5]. Estas compañías son capaces de indexar a una velocidad increíble con Nexidia construyendo un índice fonético y TVEyes usando un método híbrido de indexación fonética y el uso de una biblioteca de términos conocidos.
De acuerdo a Sahuget, Google Audio Indexing usa la tecnología de voz para transformar palabras habladas en texto y luego usa la tecnología de indexación de Google para entregar los mejores resultados al usuario. "Los vídeos entregados están basados en puestos – entre otras cosas- en el contenido hablado, el metadata y la novedad del vídeo. Periódicamente indexamos los canales políticas de YouTube en busca de nuevo contenido. Tan pronto como un vídeo es subido a YouTube, es indexado y procesado por nuestro sistema para ser buscado por nuestros usuarios."
Cuando Google adquirió YouTube [6] hace unos años, me pregunté en esos momentos qué pensaba hacer con él, especialmente después de invertir 1.6 mil millones de dólares. Con tanta gente viendo vídeos en YouTube, ciertamente tenía el potencial de generar utilidades sustanciales basadas en anuncios, pero además de la monetización del medio, Google es primeramente una compañía de búsqueda, así que desarrollar una forma de buscar vídeo tiene sentido. Sahuget dice que más y más contenido está siendo creado en formato de vídeo en línea, lo que explicaría porqué Google decidió desarrollar esta herramienta ahora.
"La transcripción de voz-a-texto es una herramienta útil que le permite a los usuarios encontrar instantáneamente y consumir contenido de vídeo a través de distintos vídeos buscando términos específicos, incluso si el publicador del vídeo no lo ha transcrito." Explica que se usa mucho tiempo viendo un vídeo cuando sólo se busca cierta parte. "Usando la tecnología de voz-a-texto, podemos identificar las porciones del vídeo que son relevantes al contenido."
Por ahora, Sahuget dice que están limitando el proyecto al contenido político de YouTube, pero parece poco probable que se detenga ahí aunque no se comprometió a nada en específico. "El reconocimiento de voz es un problema y un reto y estamos constantemente trabajando para mejorar nuestra tecnología, pero no tenemos nada que anunciar por ahora," dice. Apuesto que esto es sólo el principio.
Fuente: Daniweb [7]