Multilingüe por defecto, listos para más
PT, ES, IT, EN en el lanzamiento. El modelo de voz, los prompts y los evals — qué cambia entre idiomas.
Qué significa «multilingüe» de verdad
No es una capa de traducción encima de un worker en inglés. Cada idioma tiene su propia voz, su propio modelo de prosodia, su propio eval set y su lista de lo que el worker puede decir.
PT-PT y PT-BR son dos workers distintos, no uno. Lo mismo para ES-ES y ES-MX. Los acentos importan, los modismos importan y los registros de formalidad importan.
Los evals son la parte difícil
Tenemos 1.200 turnos de conversación evaluados por idioma y los volvemos a ejecutar en cada actualización de modelo. Un turno que puntúa 4,6 en inglés puede quedar en 3,1 en italiano por una conjugación que el modelo falla bajo presión.
Sin evals por idioma, enviaríamos regresiones cada semana. Con ellos, detectamos las regresiones antes que el cliente.
Qué viene después
FR y DE están en beta privada. NL y PL están en el roadmap para Q4. Cada nuevo idioma son unas seis semanas de trabajo, sobre todo en curación de evals y no en fine-tuning. El modelo es la parte barata ahora.
