Una aplicación que ofrece traducciones en tiempo real permitirá a los japoneses hablar por teléfono con extranjeros.

Tecnología

Aplicaciones para no perderse en la traducción por teléfono

Una aplicación que ofrece traducciones en tiempo real permitirá a los japoneses hablar por teléfono con extranjeros, mientras ambos interlocutores usan su propio idioma.

23 de octubre de 2012

NTT Docomo -la cadena de teléfonos celulares más grande del país- comenzará traduciendo del japonés al inglés, chino mandarín y coreano, seguidos por otras lenguas. Es el último traductor de conversaciones telefónicas de este tipo en ser lanzado en los últimos meses.

Las firmas Lexifone y Vocre han desarrollado otros productos, mientras que Alcatel-Lucent y Microsoft están trabajando en otras soluciones.

Los productos tienen el potencial de hacer que las compañías eviten recurrir a personal multilingüe especialmente entrenado, ayudándolas así a reducir costos. También podrían beneficiar a la industria turística.

Sin embargo, el software de este tipo de aplicaciones no ofrece traducciones perfectas, lo cual limita su uso en algunas situaciones.

Tecnología de la nube

La aplicación de NTT Docomo ofrece traducciones de voz y texto de conversaciones telefónicas. NTT Docomo presentó su aplicación Hanashite Hon'yaku para dispositivos Android este mes en la Exhibición Combinada de Tecnologías Avanzadas en Japón y tiene planes de lanzarla el 1 de noviembre.

Hanashite Hon'yaku brinda a los usuarios traducciones en voz de la conversación de la otra persona después de una ligera pausa, así como un texto.

"Se agregarán a esta aplicación el francés, alemán, indonesio, italiano, portugués, español y tailandés a fines de noviembre, elevando el número de idiomas aparte del japonés a diez", señaló la firma en un comunicado.

"Las traducciones rápidas y exactas son posibles con cualquier teléfono inteligente, independientemente de las especificaciones del dispositivo, porque Hanashite Hon'yaku utiliza la nube de Docomo (servidores de computadora remotos) para su procesamiento".

La persona que hace la llamada debe subscribirse a uno de los paquetes de Docomo para poder usarlo.
Traducciones en línea fija.

NTT Docomo se enfrentará pronto a la competencia de la firma francesa Alcatel-Lucent, que está desarrollando un producto rival: WeTalk, que incluye el japonés y una docena de idiomas más, como inglés, francés y árabe.

El servicio está diseñado para funcionar en cualquier teléfono de línea fija, lo cual implica que la compañía ha tenido que encontrar una forma de reconocimiento de voz que use muestras de audio a un ritmo de 8 kHz ó 16 kHz.

Otros productos que dependen de conexiones de datos han usado muestras más altas de 44kHz que son más fáciles de procesar. Alcatel-Lucent emplea una tecnología patentada para capturar la voz del usuario y realizarla antes de aplicar el software de reconocimiento de voz. La información pasa por el software de traducción y después por un sintetizador de voz.

La firma dijo que todo esto podría hacerse en menos de un segundo. Sin embargo, optó por esperar antes de que el interlocutor haya terminado de hablar para iniciar la traducción a raíz de experimentos realizados con trabajadores de la compañía de seguros Axa, que sugirieron que los usuarios preferían la experiencia.

"Todavía estamos trabajando en mejorar el sistema", dijo a la BBC Gilles Gerlinger, cofundador del producto.
"Puedes tener conversaciones con una persona, pero deseamos permitir conferencias con diez personas y cuatro idiomas diferentes y el sistema brindaría traducciones en todos los idiomas necesarios".

"También tenemos un proyecto llamado MyVoice que puede tener una voz sintética que suene como tu voz real". Gerlinger sugirió que su firma ganaría dinero del producto al alquilar servidores con el software necesario a grandes empresas y cobrar a empresas más pequeñas un cargo por la cantidad de tiempo que usaran el servicio.

Videochats convertidos

Lexifone cobra a los usuarios por su servicio dependiendo de la duración de sus llamadas. Los laboratorios de investigación de Microsoft también han estado trabajando en una tecnología que se llama Teléfono Traductor. La firma ha reconocido que uno de sus más grandes problemas es lograr que el software se adapte a los distintos modos en que la gente pronuncia las palabras.

"Las tecnologías aún no son perfectas", señaló en 2010 el investigador Kit Thambiratnam. "Pero sentimos que son lo suficientemente buenas para que dos personas se comuniquen en sus lenguas maternas, siempre y cuando estén dispuestas a hablar cuidadosamente".

Google ya cuanta con una aplicación de traducción que funciona con 17 lenguajes hablados, al permitir conversaciones cara a cara con un extranjero, pero todavía no está diseñada para funcionar con llamadas telefónicas.

La nueva compañía israelí Lexifone espera lograr una ventaja inicial con su propio producto de conversación telefónica que fue lanzada este año con una oferta de traducciones en inglés, español, portugués, italiano, francés y chino mandarín.

Su jefe ejecutivo, un exingeniero de computación de IBM, tiene la ambición de quebrantar la industria de la traducción humana que, según dijo, cuesta US$14.000 millones anuales.

La aplicación Vocre ganó el premio de selección de la audiencia en el festival Techcrunch Disrupt.
"Nuestro plan original fue para un crecimiento anual de 200%", declaró Ike Sagie el mes pasado a la agencia Reuters que matizó que por la aceptación que tuvo el producto en el mercado cree que tiene "el potencial para crecer más rápido que eso".

La firma está trabajando con BT y Telefónica para ofrecer su servicio a los clientes de esas redes telefónicas.

Mientras tanto, la empresa californiana MyLanguage está buscando otra estrategia al brindar traducciones de voz y texto durante videochats a través de su aplicación Vocre para iPhones que está en fase de pruebas. Los clientes necesitan una conexión de internet para usarla.

Perdidos en la traducción

Pese a las ambiciones de aquellos involucrados en el incipiente sector, un analista puso en tela de juicio sus oportunidades de éxito.

"Esta clase de tecnologías en tiempo real han estado a 'dos o tres años de distancia' durante la década pasada", señaló Benedict Evans, experto en tecnología en Enders Analysis.

"Tanto el reconocimiento de voz como la traducción automática ya están en cierto modo ahí si uno no es demasiado exigente".

"Pero en general no son tan buenas soluciones como hablar el idioma y sospecho que no serán lo suficientemente confiables como para usarlas a nivel empresarial cuando uno necesita estar realmente seguro acerca de lo que la otra persona dijo".