Google trabaja en el reconocimiento de voz offline

El reconocimiento de voz es ya algo común en nuestro smartphone en estos días, y una parte también común es el retraso mientras esperamos a que Siri, Alexa o Google nos devuelvan la consulta, ya sea correctamente interpretada o horriblemente destrozada. El último reconocimiento de voz de Google funciona totalmente fuera de línea, eliminando por completo ese retraso. Eso sí, todavía se presenta como una opción y como el estándar del servicio.

El retraso se debe a que tu voz, o algunos datos derivados de ella, tiene que viajar desde tu teléfono a los servidores de quienquiera que opere el servicio, donde es analizado y devuelto poco tiempo después. Esto puede tomar desde un puñado de milisegundos hasta varios segundos enteros (¡qué pesadilla!), o más tiempo si esos paquetes se pierden en el éter.

¿Por qué no hacer el reconocimiento de voz en el dispositivo? No hay nada que les gustaría más a estas empresas, pero convertir la voz en texto en el orden de los milisegundos requiere bastante potencia informática. No se trata sólo de escuchar un sonido y escribir una palabra – entender lo que alguien está diciendo palabra por palabra implica mucho contexto sobre el lenguaje y la intención.

Tu teléfono podría hacerlo, seguro, pero no sería mucho más rápido que enviarlo a la nube, y se comería tu batería. Pero los constantes avances en este campo han hecho plausible hacerlo, y el último producto de Google lo pone a disposición de cualquiera que tenga un Pixel.

El trabajo de Google sobre el tema, se basó en avances anteriores para crear un modelo lo suficientemente pequeño y eficiente como para caber en un teléfono (son 80 megabytes, si tienes curiosidad), pero capaz de escuchar y transcribir el habla como tú dices.

Entonces, ¿cuál es el truco? Bueno, sólo funciona en Gboard, la aplicación de teclado de Google, y sólo funciona en Pixels, ¡Ah! y sólo funciona en inglés americano. Así que, en cierto modo, esto es una especie de prueba de estrés para lo que vendrá en el futuro.

Hacer que el reconocimiento de voz sea más sensible, y que funcione sin conexión, es un buen avance. Pero es algo anecdótico considerando que casi ninguno de los otros productos de Google funciona fuera de línea. ¿Va a dictar en un documento compartido mientras está desconectado? ¿Escribir un correo electrónico? ¡Vas a necesitar una conexión para eso! Por supuesto, esto también será mejor en conexiones lentas e irregulares, pero hemos de admitir que es un poco irónico.

Deja un comentario