Noticias, Gadgets, Android, Móviles, Descargas de Aplicaciones

Cómo funcionan los asistentes de voz y quién los expresa

Los asistentes de voz entran cada vez más en nuestras vidas. Muchos todavía no han comenzado a utilizarlos activamente, pero negarles de alguna manera una marcha victoriosa, al menos, es ilógico. La aparición masiva de asistentes de voz comenzó en los días del iPhone 4S y Siri que aparecieron en él. Desde entonces, para ser honesta, no se ha vuelto mucho más sabia, lo cual es extraño. Además de ella, también está Alexa, Google Assistant, Cortana, Alice, Portal e incluso la recientemente aparecida Marusya de Mail.ru Group. Todos ellos están unidos por un objetivo: permitir que los usuarios sientan la presencia de un asistente virtual que cumplirá con cualquier (casi) solicitud. La pregunta es, ¿por qué hablan con voces femeninas y quién las expresa?

¿Cómo funciona el asistente de voz?

En primer lugar, vale la pena comprender cómo comienzan a hablar los asistentes de voz en general. A pesar de todo el aparente realismo de su voz y, a veces, incluso de la entonación, hay una computadora detrás de cada frase, y no una persona real. Es él quien sintetiza letras y palabras, reuniéndolas en una sola frase. Aunque la gente también aplica su aparato de habla a esto.

Naturalmente, no es posible transferir toda la base de datos y todos los desarrollos en reconocimiento de texto y síntesis de voz a un teléfono inteligente. Es por ello que los asistentes solo trabajan cuando están conectados a la Red. En otros casos, simplemente dicen que tienen problemas de conexión. Esta es casi la única frase que tienen sin conexión.

Como resultado, su solicitud se envía al servidor para determinar lo que dijo, los datos se procesan y la respuesta regresa. El asistente, por así decirlo, pregunta al servidor: “¿Qué dijo?”. Todo esto sucede en segundos o incluso en fracciones de segundo, pero con raras excepciones, funciona exactamente así.

Después de procesar el comando en el servidor, el comando se devuelve en forma de comando inverso o se forma una consulta de búsqueda, en base a los resultados de los cuales se genera una respuesta de voz (en el caso de un teléfono inteligente, es también visual). En el primer caso se enciende la luz, se abre la puerta y similares, y en el segundo se anuncia el tiempo o, por ejemplo, las últimas novedades.

Además, trabajar a través de un servidor le permite hacer que los dispositivos domésticos inteligentes sean más versátiles. Así es como puede garantizar su trabajo de forma remota. Por ejemplo, encienda el hervidor cuando se acerque a la casa, encienda la luz del garaje con anticipación o encienda el robot aspirador mientras trabaja.

¿Por qué los asistentes de voz hablan con voz femenina?

Para responder a esta pregunta, vale la pena recurrir a la psicología o simplemente hacer la pregunta, ¿de quién será la voz agradable para una persona, hombre o mujer? Los hombres responderán que es mujer y la opinión de las mujeres estará dividida. La hembra no repelerá a ninguno de ellos, aunque el macho sea más amable.

Esta es la respuesta. Es solo que todas las personas son más leales a la voz femenina que a la masculina. Sin embargo, si lo desea, algunos asistentes también ofrecen una versión masculina de la voz. Pero los fabricantes son reacios a introducir una función de selección de voz. En este caso, se pierde lo más importante: la actitud del usuario hacia el asistente, como asistente vivo y no como máquina.

Además, se cree que la voz femenina calma y te permite relacionarte con más calma con lo que está sucediendo. Es por eso que, en casi todos los aviones militares, es con una voz femenina que se dan las órdenes sobre acercarse a un ángulo crítico de ataque, una posible pérdida y otros momentos desagradables.

¿Qué voz crees que debería hablar un asistente de voz si no se puede cambiar? Responde a continuación y analicémoslo en detalle en nuestro chat de Telegram.

¿Cómo suenan los asistentes de voz?

Como dije anteriormente, muchos asistentes de voz trabajan con una voz completamente sintética. Es decir, todo lo que dicen es solo actuación de voz con cierto timbre, tonalidad y otros parámetros. Ninguna persona viva está detrás de esto. Un ejemplo de estos asistentes es el Asistente de Google.

Algunos asistentes de voz, por el contrario, son expresados ​​por personas reales que, en la vida cotidiana, son actores, locutores o se dedican a la actuación de voz (publicidad, dibujos animados, gadgets). Esto hace que la voz sea más humana y el usuario la percibe no como una computadora, sino como un asistente real. La psique está organizada de tal manera que es más fácil y agradable sentir la presencia de una persona que la presencia de un trozo de hierro “sin alma”.

Para construir un modelo de voz, su propietario debe leer muchas frases y sonidos típicos, que luego se procesan y generan en la voz del propio asistente. Cuantas más frases se graben, más viva será la voz y se cometerán menos errores.

Un ejemplo de una voz subdesarrollada que encontré cuando conducía por los Estados Unidos. El navegador, que llevé en el mismo lugar que el coche, estaba en ruso. En lugar de “Hai Wei”, el navegante dijo “Hwai”. Las voces localizadas del navegador no son tan importantes como el asistente de voz, que debería estar en casi todas partes. Por eso, allí reaccioné con humor y una vez más me aseguré de que los creadores de voces para asistentes hicieran su trabajo de manera más responsable. Nunca me he encontrado con semejantes jambas, por ejemplo, con Alice.

¿Quién da voz a los asistentes de voz?

Probablemente la voz más famosa expresada por asistentes de voz es Susan Bennett. Fue ella quien le dio su voz al Siri original en inglés.

Nació en 1949 en Clinton, Nueva York, Estados Unidos. Susan dedicó toda su vida al arte, se dedicó a la actuación e incluso se probó a sí misma como productora. Aunque no tiene muchos papeles en películas, pero tiene mucha actuación de voz.

Por ejemplo, ha expresado comerciales para Ford, Coca-Cola, Fisher-Price, McDonald’s, Goodyear, VISA, Hot Pockets, Cartoon Network y otros. Además, su voz es hablada por el sistema de notificación en las terminales de Delta Air Lines en todo el mundo, varios sistemas de navegación y sistemas telefónicos. Desde el 4 de octubre de 2011, ha inmortalizado su voz frente a Siri.

En la versión rusa, el asistente de Apple habla con la voz de Maria Konoplyanskaya. Es imposible encontrar mucha información sobre ella, pero definitivamente podemos decir que su experiencia en el campo de la actuación de voz no es tan buena como la de Susan Bennett. Además, vale la pena señalar que su voz está muy procesada, pero aún puedes reconocer a su amante en ella.

Otra opción de asistente es Alexa de Amazon. La voz original también está basada en una computadora, sin embargo, posteriormente se decidió agregar una voz masculina y se eligió a Samuel L. Jackson como base. Permítanme recordarles que entre sus principales trabajos de los últimos años, se puede destacar el papel de Fury en las películas de Marvel.

Mucha gente conoce a un asistente de voz como Cortana de Microsoft. El asistente recibió su nombre en honor a la heroína de la serie de juegos de computadora Halo, que se lanzan para XBox y PC, sin pasar por la PlayStation. En el original, la voz del asistente es la misma persona que da voz a la heroína del juego: Jen Taylor.

Aquí llegamos a nuestro compatriota, que originalmente se suponía que se llamaba Maya, pero este nombre fue abandonado, ya que es muy parecido al nombre del mes y puede dispararse accidentalmente al pronunciar frases ordinarias. Como resultado, recibió el nombre de Alice. Entre otras cosas, a los requisitos por nombre estaba la ausencia del sonido “er”, que es poco pronunciado por los niños pequeños, y no debería ser generalizado, nuevamente para eliminar los positivos accidentales. Sin embargo, a este respecto, los autores aún estaban reasegurados y permitieron llamar al asistente con la palabra “Yandex”. Si Alice vive en la familia, esto es normal, pero si hay alguien llamado Yandex, vale la pena pensarlo. Si dos niños fueron nombrados por Alice y Yandex, entonces los cuerpos autorizados ya deberían esforzarse.

La voz de Alice es Tatyana Shitova, quien da voz a Scarlett Johansson, Charlize Theron y algunas otras actrices en películas en ruso.

No pude encontrar en ninguna parte confirmación de esta versión e incluso mencionarla, pero una coincidencia me parece muy extraña. En 2014, se estrenó la película de ciencia ficción Lucy, en la que el papel principal fue interpretado por Scarlett Johansson. Al final de la película, el personaje principal pudo poner su mente, bombeada como resultado de la exposición a una hormona fuerte, dentro de la computadora. Como resultado, terminó en todas las computadoras del mundo con un propósito exclusivamente bueno.

Entonces, unos años después Yandex libera a un asistente y él habla con la voz de esa misma Lucy. Quizás esto sea una coincidencia, quizás no, pero el hecho me pareció muy interesante.

Como ves, todos los asistentes son diferentes, pero el uso de una voz en vivo en ellos ayuda mucho a utilizar todas las funciones, hacerlo con gusto y percibir fácilmente lo que se dice. Por supuesto, seguirán desarrollándose. Al final, cada uno de nosotros tendrá su propio Jarvis en casa, que hará literalmente todo. Hasta ahora, los asistentes solo pueden ayudar, pero su presencia en los ponentes ya hace la vida más fácil. Lo más importante es que te acostumbres y comiences a apreciarlos. Por lo tanto, estamos esperando el desarrollo de esta dirección tecnológica.