Formación de Speech-to-Text Models en AI Trainer

Antes de que se haga un análisis de las llamadas del contact center (análisis de sentiment o intent detection), el primer paso es transcribir la voz a texto (STT). Los modelos speech-to-text son una parte integral de muchos productos impulsados por la IA como Talkdesk AI Trainer o Interaction Analytics.

Los errores de transcripción ocurren en las operaciones diarias de un contact center, principalmente con nombres de marcas y productos o cualquier otra frase específica del dominio y fuera del vocabulario. Con AI Trainer es bastante sencillo corregir estos problemas comunes y, por lo tanto, mejorar el rendimiento del modelo STT.

 

Formación de los modelos STT

Para mejorar el rendimiento del modelo STT, en primer lugar:

image_1.png

1. Seleccione el modelo correcto en la página de inicio de AI Trainer [1] (también conocida como "Models page"). Los modelos speech-to-text tienen un chip que indica su tipo (Speech-to-text).

Sugerencia: su cuenta puede tener varios modelos STT configurados, por lo que sus transcripciones se pueden adaptar a varios idiomas y lenguas vernáculas específicas de la región.

Será redirigido a la página Vocabulary, donde verá las listas de todas las frases que gestiona. Su objetivo es corregir el modelo STT y optimizar la transcripción en la dirección correcta, según las reglas que especifique al añadir nuevas frases.

 

Dos funcionalidades principales están disponibles en esta página:

image_2.png

2. New phrase [2], donde puede añadir nuevas frases al vocabulario personalizado mediante las opciones “Sounds Like” o “International Phonetic Alphabet” (consulte las subsecciones a continuación).

image_3.png

3. Test vocabulary [3]. Después de agregar sus primeras frases, el entrenamiento comenzará automáticamente. Cuando el modelo esté entrenado, verá una opción para probar la mejora con su propia voz.

Sugerencia: compruebe si su cuenta tiene algún modelo STT configurado. Si este no es el caso, comuníquese con su Solutions Consultant o Customer Success Manager "Gerente de Cuenta" para hacer una petición de la configuración.

 

Adición de una frase al Vocabulario

Siga estos pasos para añadir una nueva frase:

image_4.png

1. Haga clic en New phrase [1].

image_5.png

2. En el panel lateral, agregue una frase [2] que desee corregir.

Nota: este es el único campo obligatorio. Sin embargo, se recomienda usar los campos “Sounds like” or IPA (International Phonetic Alphabet) para especificar cómo suena la frase que está corrigiendo y usar "Display as” para facilitar información sobre la transcripción esperada.

3. Escriba cómo suena la frase (fonéticamente) en el campo "Sounds like" [3]:

a. Añada cómo suena la frase transcrita. Si usa más de una palabra, únalas con un guión. Para los acrónimos, use puntos después de cada letra.

b. Alternativamente, añada una forma fonética de la frase, especificando con mayor precisión la pronunciación de la frase con sonidos abiertos y cerrados y la duración y pausas en la voz.

4. En el campo "Display as" [4], escriba cómo debería verse la transcripción.

5. Cuando haya terminado, haga clic en Create [5].

Sugerencia: puede deshacer esta acción en cualquier momento que desee al hacer clic en el botón Cancel.

 

La opción de probar la mejora en AI Trainer se desbloqueará tan pronto como termine la formación.

Ejemplo:

image_6.png

 

Probar el vocabulario personalizado

Después de añadir nuevas frases al vocabulario personalizado, en AI Trainer puede probar si la transcripción ha mejorado. Hay dos formas de probar esto:

image_7.png

  • Con su propia voz [1]: grabando algún discurso y viendo la transcripción en vivo.

image_8.png

 

Nota: Las transcripciones informadas estarán disponibles pronto.

Volver ""
Por favor, inicie sesión para enviar una solicitud.