Iratxe Gómez: «Estaba en China y me enteré por un anuncio de que mi voz era la de Siri»

Está «harta» del modo plano y de no sentir emociones, aunque confiesa que hablar como una máquina es un recurso que utiliza mucho a día de hoy en su trabajo como docente: «Los alumnos son tan nativos digitales que es lo que más apela a su atención»


Hace más de 10 años que sin saberlo se metió en la piel de Siri. Lo descubrió por casualidad unos años después. Sin embargo, a día de hoy Iratxe Gómez no ha conseguido separarse del asistente virtual de Apple y todavía la reconocen por la calle, especialmente los invidentes. «Para ellos no solamente es la voz de Siri, es algo más. Cuando me identifican les hace tantísima ilusión que me rindo», señala esta vasca, que en la actualidad combina la docencia con la formación en doblaje para abrirse a otros campos.

-¿Cuánto tiempo llevas siendo Siri?

-Fui la primera versión que salió al mercado, desde el 2010. Han salido otras a posteriori, la mía sigue siendo la primera, pero no la única.

-¿Cómo surge? ¿Un cásting?

-No, no. En aquel momento, en el 2006, trabajaba en una empresa de creación de call centers y surgió la oportunidad de utilizar los TTS, los conversores de texto a voz, para no tener que utilizar a locutores humanos porque se abaratan mucho los costes. Me puse a utilizar esa herramienta, como soy licenciada en Filología Inglesa con la especialidad de fonética y fonología, detecté una serie de errores que contenía la aplicación original. Reporté la incidencia contemplando todos esos errores y mi empresa se negó a enviarlo alegando que más bien sería que yo no tenía ni idea de manejar la máquina, no que supiera más que quien la hubiera desarrollado. Como ellos no quisieron, lo envié yo por mi cuenta.

-¿A Apple?

-No, no, yo con Apple no he tenido nunca jamás relación laboral. A Nuance, son creadores tanto de conversión de texto como reconocimiento de voz, son desarrolladores importantísimos a nivel mundial. Les envié la incidencia y me pidieron que colaborase con ellos para seguir mejorando la máquina. Yo, que justo ese día había dejado esa empresa, les dije: «A mí explicadme, ¿por qué voy a querer pelear con una máquina que no habla bien cuando yo me pongo detrás del micro y a la primera lo digo?». Y me dicen: «¿También eres locutora?». Les dije que sí y me respondieron: «Pues hazlo tú». Y lo hice yo.

-Lo que empezó como un proyecto para esta empresa, después se convirtió en Siri.

-En el año 2013 me marché a vivir a China con mi marido y con mi hijo, y viendo un programa de televisión, salía el mago Pop haciendo un truco con un iPhone, y al final era la voz de Siri quien daba el resultado. Ahí fue cuando yo descubrí que mi voz era la de Siri, pero nadie me lo había contado.

-¿Y qué hiciste?

-Me puse en contacto con la empresa, y les dije: «Yo este producto no lo he grabado». Y me dijeron: «No, tú hiciste otro y ahora ya quien lo compre y lo que hagan con él no es asunto tuyo». Muchas veces me dicen: «¿Te han robado?». Sí, pero me han robado con guante blanco. Lo que han hecho desde el punto de vista ético, no es bonito, pero es perfectamente legal. De esta forma llegó hasta Apple.

-¿Sigues en contacto con ellos?

-Sí, sí yo he estado trabajando con ellos hasta el 2019, en el 2020 con la pandemia se ha parado todo. He estado haciendo ampliaciones de los sistemas de navegación, porque para el reconocimiento de voz, una vez que hay los archivos suficientes, no me necesitan para mejorar, pero en navegación sí, a medida que los vehículos han ido ampliando las funciones que pueden hacer por comandos de voz. Antes solo era lo de «guiado a destino», y ahora hay coches de gama alta que son capaces de llamar solos al taller si detectan una avería.

-Te iba a preguntar si le habías aportado personalidad a Siri, pero es que conscientemente nunca has sido Siri.

-Conscientemente no, pero sí que le di la personalidad a Siri porque la pauta que me dieron cuando hice esa grabación era que fuera absolutamente neutral, y que dijera lo que dijera nunca se pudiese traslucir una emoción detrás de mi voz.

-¿Resulta fácil?

-No, no es nada fácil porque, imagínate, fueron tres semanas, una media de cuatro a seis horas al día, sin parar, frase tras frase, además, no son ni palabritas ni frases cortas. Había textos bastante largos, noticias del día, recortes de literatura, textos ficticios, cuentos... había de todo, porque lo que interesa no es tanto lo que digo, sino los sonidos que van a extraer de ahí. Necesitan los fonemas, los monemas... los sonidos que componen el idioma en cualquiera de sus posibles enunciaciones.

-Al principio, Siri decía «sietecientos», ahora creo que ya lo han corregido.

-Eso da mucha rabia, porque más que en Siri como tal, en los navegadores yo me encontraba con cantidad de errores... La palabra Huelva, que no tiene ninguna complicación. Otra cosa es cuando te encuentras dentro del castellano con palabras en gallego, catalán o euskera, que ahí la máquina se vuelve loca porque no es exactamente el mismo sonido que en castellano, pero que con Huelva diga: «Huerve», ¿por qué? Porque los informáticos que lo programaron, lo hicieron mal, y muchas veces hay un pequeño desfase entre lo que es el desarrollo informático y la supervisión de los lingüistas. Por desgracia, no se suele contar mucho con la gente de letras para supervisar el producto final.

-De ahí que pasen estas cosas ¿no?

-Claro, si no lo ponen a prueba... A mí me ha sucedido. Cuando grababa en Alemania, me mandaban a supervisar las sesiones a un chico que si tenías suerte era hijo de emigrantes españoles, hablaba español, pero como hijo de emigrantes, no era nativo del todo, y encima con una variante muchas veces regional. Imagínate que mandaban al hijo de unos andaluces que me decía: «Es que dices las zetas muy raras». ¿Que yo digo las zetas muy raras? Si no hay un experto en su materia, es muy difícil que el resultado final sea perfecto. Gracias a Dios, todo eso se ha ido solucionando porque cuanto más se usa, más aprenden la máquina, los programadores y el equipo técnico.

-Te iba a preguntar si hablaba gallego, pero entiendo que no.

-No, ni euskera tampoco. No hay un número suficiente de hablantes como para que hagan la inversión económica.

-¿Hay un truco o hay que ordenar las palabras de una manera determinada para que entienda mejor?

-Sí que es cierto qué depende de cómo se formulen las preguntas, pero igual que cuando hacemos una búsqueda en cualquier buscador informático, dependiendo de cómo lo escribas, es más fiable o más concreto. Es como la cajita de Google, pero con voz. Cuanto más simples mejor, sin embargo, luego tenemos por contrapartida que lo más difícil de los reconocimientos de voz son los monosílabos. Un o un no es difícil que la máquina lo entienda, le gustan las palabras más largas porque tiene menos que encajen con el número de letras que le pones.

-¿Te han reconocido alguna vez?

-Sí, porque cuando esa voz esta omnipresente en tu vida es muy fácil. La persona que te reconoce a veces se queda muy descolocada y eso sucede sobre todo con los invidentes. Para ellos no solamente es la voz de Siri, es algo más, es la voz que les lee los correos electrónicos, las búsqueda que hacen por Internet... Además, en su caso, la voz no ha cambiado en todos los dispositivos todavía. Muchas veces se encuentran a Siri hablando de una forma, y la voz que les sigue leyendo todo lo demás, es la mía. Es como la voz de tu hermano o de tu amiga que está todo el tiempo hablando contigo, si la oyen fuera de ese dispositivo, se quedan descolocados, diciendo: «Te conozco».

-¿Te ha pasado?

-Me ha pasado comprar un cupón y que el vendedor me diga: «Pero, tú eres...».

-No queda otra que desvelarse ¿no?

-No, no, es que, además, a ellos les hace tantísima ilusión que yo me rindo, lo que me pidan, porque luego me empiezan: «¿No me podrías grabar algo para mandárselo a tal?» Y yo: «Claro que sí».

-Ahora mismo estás haciendo un curso de Doblaje en la escuela audiovisual 35 mm.

-Sí, he vuelto al mundo de la docencia, soy profesora de inglés, y como sigo con una especie de doble vida, para seguir con el tema de voz, me apunté al curso de doblaje para ampliar mercado y romper con la máquina.

-¿Tocar otros sectores?

-Sí, quiero salir de Siri, ya he quedado harta de ponerme en modo plano y ni sentir ni padecer. Es como los cantantes que solo tienen un éxito, ya pueden sacar 25.500 discos, que le van a pedir Despacito.

-Te cuidas mucho la voz.

-Si te dijera que sí quedaría precioso, pero no es la realidad. No voy pegando gritos, porque no es mi estilo. Me cuido porque como docente son muchas horas usando la voz, pero tengo la suerte de haber nacido con una buena genética que me permite tener una buena voz sin cuidarme en exceso. A veces no es un gran exceso, simplemente el sobreesfuerzo de hablar en un ambiente de mucho ruido, bebidas muy frías, fumar... Yo he sido fumadora muy light, pero ya lo he dejado. Relativo cuidado, hay que tenerlo, a lo loco no se consigue nada, pero tampoco soy una friki que va todo el día con la bufanda porque mi voz es de oro.

-¿Te ha pasado estar en tu día a día y sin darte cuenta hablar como Siri?

-Sí, eso lo utilizo en clase muchísimo. Esta herramienta sí que es buena y lo demás son tonterías. En vez de gritar a los alumnos, les hablas como una máquina y se ponen a tus órdenes. Al final son tan sumamente nativos digitales, que eso es lo que más apela a su atención, todo lo demás es la señora esta que viene a darme el rollo.

Conoce toda nuestra oferta de newsletters

Hemos creado para ti una selección de contenidos para que los recibas cómodamente en tu correo electrónico. Descubre nuestro nuevo servicio.

Votación
8 votos
Comentarios

Iratxe Gómez: «Estaba en China y me enteré por un anuncio de que mi voz era la de Siri»