Este noviembre festejamos el primer aniversario del lanzamiento de “automatic captions”, o subtítulos automáticos. Al principio, trabajábamos solo con algunos canales socios, pero pronto pusimos los subtítulos automáticos al alcance de todos. Como ya se sabe, nos gusta lanzar los productos y servicios de manera rápida e ir mejorando basados en la experiencia real del usuario, por eso este año hemos estado progresando de manera continua para aumentar la cantidad y mejorar la calidad de los videos online subtitulados.

Este es un resumen de los logros alcanzados hasta ahora:
  • Los usuarios han mirado videos subtitulados más de 23 millones de veces, y han traducido de manera automática subtítulos en más de 7,6 millones de oportunidades.
  • El número de subtítulos creados manualmente ha crecido más de tres veces, principalmente debido a la tecnología de subtitulado automático.
  • Recientemente, hemos reducido en 20 % la tasa de error en nuestros algoritmos de reconocimiento de voz.
Cuando realizamos el lanzamiento en noviembre de 2009, mencionamos cómo el video online presenta un desafío a gran escala. Antes de que existieran los subtítulos automáticos, había en YouTube alrededor de 200 mil videos subtitulados. Puede parecer una cantidad enorme, pero el hecho es que en YouTube se suben más de 35 horas de video por minuto. Nuestros objetivo es que todos puedan acceder a los videos, aunque no puedan escuchar lo que se dice o no entiendan el idioma.

Desde marzo de este año, los usuarios han podido acceder a subtítulos en casi cualquier video en el que se hable inglés con claridad. Menos de un año después, es evidente que existe una fuerte demanda de contenido subtitulado y que los usuarios han hecho buen uso de la tecnología que pusimos a su disposición (más de 23 millones de vistas no es un dato menor). Los usuarios también están utilizando esta tecnología para acceder a contenido en su propio idioma, ya que los subtítulos pueden traducirse automáticamente a más de 50 lenguas: de hecho, ya han habido más de 7,6 millones de traducciones.

Por supuesto, los subtítulos automáticos no son perfectos, por lo tanto hemos llevado a cabo una serie de iniciativas para ayudar a la gente a crear subtítulos de manera manual. En un evento el año pasado presentamos el denominado automatic caption timing, una funcionalidad que puede convertir un archivo de texto común en subtítulos con códigos de tiempo.

Ahora hemos agregado esta opción a la API de Datos de YouTube para facilitar el desarrollo de guiones y aplicaciones capaces de cargar un gran número de subtítulos a la vez. También, hace poco comenzamos el programa de calificación YouTube Ready para ayudar a los dueños de videos a encontrar proveedores profesionales de subtítulos que estén familiarizados con la tecnología de YouTube. Gracias a estos esfuerzos hemos visto cómo se ha más que triplicado el número de subtítulos creados manualmente en YouTube (hoy hay disponibles más de 500 mil).
Pero cuando se trata de subtítulos, no nos interesa solo la cantidad sino también la calidad. Y también tenemos buenas noticias al respecto, ya que como lo haría un niño de 1 año, YouTube también ha estado aprendiendo nuevas palabras. Por ejemplo, ahora somos capaces de reconocer la palabra en inglés "smartphone" (hagan la prueba activando la opción de reconocimiento de voz).

En las últimas semanas hemos desplegado mejoras significativas en nuestra tecnología de reconocimiento de voz para optimizar la precisión de los subtítulos automáticos. El nuevo modelo de reconocimiento de voz de YouTube reduce el promedio de error en alrededor de 20%. Si bien estas mejoras varían de video en video de acuerdo con la calidad del sonido y la claridad de las palabras, esto significa que si un video en el pasado identificaba correctamente 50% de las palabras, ahora reconoce 60%, y el que antes identificaba 75%, ahora puede reconocer alrededor de 80%. Como siempre, continuaremos introduciendo mejoras así que habrá más novedades pronto.

Desde un punto de vista personal, es alentador ver todos los comentarios, notas de agradecimiento, videos, blog posts y hasta reportes de bugs que hemos recibido en el último año. Si bien es imposible responder a cada uno de ellos, nos son muy útiles porque nos permiten dirigir y enfocar los esfuerzos en este proyecto. Hemos considerado la retroalimentación de los usuarios para realizar un número de mejoras sutiles en el servicio, como por ejemplo la opción de “Always show automatic captions” (o mostrar siempre subtítulos automáticos) con el agregado de un botón interactivo de transcripción para que el usuario pueda ver todos los subtítulos y saltar a través del video, con el botón rojo de CC (closed captions) más fácil de localizar.

¿Qué se viene? Seguiremos trabajando para mejorar la exactitud y para hacer que los subtítulos estén disponibles en todos lados: en la TV por Internet, la computadora y el teléfono celular. Hay otras novedades que pronto anunciaremos, así que manténganse atentos.

Ken Harrenstien, Caption Jedi, recientemente miró "Sign Language from the Space Station"