Revista El Color del Dinero

Bienvenidos a Spain News Today.

La IA del discurso de AiOla supera a Whisper de OpenAI en el reconocimiento de términos

modelo iola Automatiza la creación de procesos y flujos de trabajo personalizados para realizar informes e inspecciones en industrias como la de fabricación, cadena de suministro, logística, farmacéutica y más.

Tel Aviv, Israel, 18 de abril de 2024 /PRNewswire/ — aiola, una tecnología impulsada por IA que automatiza los flujos de trabajo empresariales mediante la captura de datos hablados, ha anunciado un gran avance en el campo del reconocimiento de voz. Impulsada por un nuevo modelo de descubrimiento de palabras clave, la solución de aiOla ha avanzado para igualar la competencia humana en la comprensión de la terminología específica de la industria. El modelo patentado AdaKWS logró una precisión del 95 % en la detección de palabras clave, superando el modelo Whisper de OpenAI, líder en la industria, que alcanzó una precisión del 88 %.

La detección de palabras clave es un aspecto fundamental del reconocimiento de voz que aborda el problema de la identificación de términos mediante la detección de palabras y frases predefinidas. “Piense en una entrega de mensajería en la que su paquete llega dañado. El mensajero debe presentar un informe utilizando códigos y abreviaturas específicos que describan la situación; esos códigos y abreviaturas son palabras clave en la industria, omnipresentes en muchos campos, y dominan las comunicaciones. incluyendo En eso, el CEO y cofundador de aiOla dijo, hasta la mitad del discurso de los trabajadores, Príncipe de Haramati. «La capacidad de descubrir palabras clave permite la automatización de procesos diarios en una amplia gama de industrias, desde presentar un informe de daños en un paquete hasta completar una inspección de seguridad en una planta de fabricación de alimentos, convirtiendo las palabras en acción».

READ  Kioxia ofrece rendimiento PCIe® 4.0 para los usuarios de PC de todos los días

Las aplicaciones de automatización de procesos de aiOla pueden comprender con precisión el habla, la jerga y las abreviaturas en más de 100 idiomas, independientemente de los acentos y el ruido de fondo. aiOla logra esto combinando un sofisticado modelo de descubrimiento de palabras clave con un modelo de reconocimiento de voz. El proceso de configuración lleva apenas unas horas: los clientes proporcionan ejemplos de sus listas de verificación o plantillas, y aiOla crea automáticamente plantillas de idiomas adaptadas al caso de uso. Luego, los trabajadores pueden completar sus operaciones verbalmente usando la aplicación aiOla mientras mantienen los ojos y las manos en el equipo. La capacidad excepcional de aiOla para detectar términos poco comunes de la industria con alta precisión permite que la plataforma distinga fácilmente entre el habla relacionada con los procesos comerciales y las conversaciones cotidianas.

La aplicación aprovecha un modelo patentado desarrollado por el equipo de científicos de aiOla para reconocer una lista predefinida de palabras clave dentro del habla. Esto hace posible adaptar instantáneamente la solución de aiOla a la jerga de cualquier industria sin tener que volver a entrenar su modelo de IA. Al realizar una evaluación comparativa de la detección de términos y palabras clave en 16 idiomas, el modelo más grande de Whisper logró una precisión del 88 % en comparación con la precisión del 95 % de aiOla. Además, en una prueba reciente que consistió en palabras clave difíciles de detectar tomadas de audiolibros en inglés, el modelo CED realizado por un equipo de investigadores de Apple logró un 92,7%, mientras que el modelo AdaKWS de aiOla alcanza un 95,1% de precisión.

READ  Obtenga Microsoft Project Pro o Microsoft Visio Pro por $20

«La detección de palabras clave plantea desafíos importantes debido a la escasez de datos de entrenamiento, especialmente en diversos idiomas y dialectos. Por lo general, requiere un ajuste específico de la industria para permitir que los modelos reconozcan términos que no son comunes en el habla cotidiana», dijo el jefe de aiOla. científico, Profesor Prof. Jose Keshet. «Nuestro modelo superó consistentemente las líneas base de OpenAI Whisper por un amplio margen, logrando una mejora significativa con respecto a la línea base de mejor rendimiento. Además, nuestro modelo es mucho más eficiente y utiliza 15 veces menos parámetros».

Para obtener más información sobre la tecnología aiOla, visite: https://aiola.com

Explore la búsqueda de descubrimiento de palabras clave de aiOla: https://arxiv.org/pdf/2309.08561.pdf

Acerca de Ayoola:

La tecnología patentada de aiOla comprende más de 100 idiomas y reconoce términos y abreviaturas, lo que demuestra una baja tasa de error incluso en entornos ruidosos. La tecnología aiOla transforma los procesos manuales en industrias críticas en flujos de trabajo sin papel y basados ​​en datos impulsados ​​por IA a través del reconocimiento de voz avanzado.

Fuente Ayoola