Google LLC dijo hoy que ha abierto un códec llamado Lyra que se basa en el aprendizaje automático para permitir llamadas de voz de alta calidad en situaciones de bajo ancho de banda.
Lira, Que ahora está alojado en GitHub, puede comprimir audio a tan solo 3 kbps al tiempo que garantiza una calidad de sonido que es comparable a otros códecs que requieren mucho más ancho de banda.
Escribiendo sobre Lyra para la primera vez En febrero, Google dijo que aunque la conectividad móvil se está extendiendo rápidamente por todo el mundo, no todo el mundo tiene acceso a conexiones a Internet rápidas y fiables. Además, la llegada del trabajo remoto y el trabajo remoto durante la pandemia de COVID-19 significa que los límites de datos se están expandiendo incluso en áreas con las conexiones más confiables, dijo Google. En los Estados Unidos, por ejemplo, 90 de las 200 ciudades principales experimentaron una caída dramática en la velocidad de Internet al comienzo de un pánico, según una analizando Por BroadbandNow.
Google dijo hoy que está haciendo que Lyra sea de código abierto para ayudar a marcar la diferencia en este tipo de situaciones.
El códec Lyra está optimizado para comprimir y normalizar el habla humana reconocible en el menor espacio posible. Google dijo que Lyra se creó con un modelo de aprendizaje automático que ha sido entrenado en miles de horas de audio para personas que hablan, y en más de 70 idiomas, para garantizar que pueda ser utilizado por tantas personas como sea posible. Igualmente importante, el códec puede ejecutarse en dispositivos de bajo consumo, incluido un teléfono inteligente que tiene solo 90 ms de latencia, dijo Google.
Google explica en su sitio Blog de código abierto Lyra consta de dos componentes principales: un codificador y un decodificador. El software codificador se utiliza para capturar las distintas características o características del habla de una persona cuando habla por teléfono. Lyra captura estas características en fragmentos de 40 ms, las comprime y luego las envía a través de la red. En el otro extremo, el decodificador convierte estas características nuevamente en una forma de onda de sonido que puede ser recibida y entendida por la persona al otro lado de la llamada.
Los ingenieros de Google Chrome, Andrew Storus y Michael Chinen, escribieron en una publicación de blog.
A continuación, se muestra un ejemplo de la calidad de las llamadas al utilizar Lyra. Tiene una calidad significativamente más baja de lo que muchas personas están acostumbradas con su grabación encriptada naturalmente, pero aún se puede reconocer claramente.
La nueva tecnología de audio de Google Duo Lyra brinda a las personas un audio confiable y de alta calidad, incluso en la red 2G. Escuche más # Android Jefe de producto Jamison Brittel. pic.twitter.com/asAkV3Gi8s
– Android (Android) 2 de marzo de 2021
Google ya implementó Lyra en su aplicación gratuita de videollamadas Duo y ha dicho que proporciona un código fuente abierto porque cree que podría ser adecuado para más aplicaciones. Google cree que hay una serie de aplicaciones para las que Lyra puede ser especialmente adecuada, que van desde archivar grandes cantidades de voz y ahorrar energía de la batería hasta aliviar la congestión de la red en caso de emergencia.
«Estamos emocionados de ver la innovación por la que la comunidad de código abierto se ha hecho famosa aplicada a Lyra para crear aplicaciones más sobresalientes e impactantes», dijeron Storus y Chinen. «nosotros [want] Para habilitar a los desarrolladores y obtener comentarios lo más rápido posible «.
Imagen: Google
Ya que estás aquí …
Muestre su apoyo a nuestra misión suscribiéndose a nuestro canal de YouTube con un solo clic (a continuación). A medida que aumente el número de suscriptores, YouTube sugerirá contenido relevante para empresas y tecnología emergentes. ¡Gracias!
Apoya nuestra misión: >>>>>> Suscríbete ahora >>>>>> Para nuestro canal de YouTube.
… también queremos contarte sobre nuestra misión y cómo puedes ayudarnos a lograrla. El modelo de negocio de SiliconANGLE Media Inc. es compatible. Sobre el valor intrínseco del contenido, no del anuncio. A diferencia de muchas publicaciones en línea, no tenemos un firewall o un banner publicitario en ejecución, porque queremos mantener nuestra prensa abierta, sin afectar ni tener que rastrear el tráfico.Presiona, informa y comenta Silicio – Junto con video en vivo sin grabar del estudio de Silicon Valley y equipos de video móviles de todo el mundo en El cubo Se necesita mucho trabajo, tiempo y dinero. Mantener una alta calidad requiere el apoyo de patrocinadores que se alineen con nuestra visión de contenido periodístico sin publicidad.
Si le gustan los informes, las entrevistas en video y otro contenido sin publicidad aquí, tómese el tiempo para ver una muestra de nuestro contenido de video patrocinado, Tuitea tu apoyoY sigue volviendo con él Silicio.
«Food ninja. Freelance pop culture fanatic. Wannabe zombie maven. Twitter aficionado.»
More Stories
La red social Butterflies AI añade una función que te convierte en un personaje de inteligencia artificial
Edición del vigésimo aniversario de Hautlence HLXX: redefiniendo el tiempo con minutos que retroceden y horas saltantes
Un marco para resolver ecuaciones diferenciales parciales equivalentes puede guiar el procesamiento y la ingeniería de gráficos por computadora