Créditos de la imagen: Google
No tengo ninguna foto de mi experiencia en Project Starline. Google tenía una política estricta de «sin fotos, sin videos». Tampoco compañeros de clase. Estoy en una sala de conferencias oscura en los terrenos del anfiteatro Shoreline en Mountain View. Entras y te sientas frente a una mesa. Frente a ti hay lo que parece una gran televisión de pantalla plana.
El labio en la parte inferior de la pantalla se extiende en un arco grabado en un tweeter. Hay tres módulos de cámara en los bordes de la pantalla, en la parte superior y alrededor de los lados. Es un poco como Kinects en el aspecto que tienen todas las cámaras estereoscópicas modernas.
Una sesión muy corta de siete minutos es una entrevista efectiva. La figura suave y descolorida entra en el marco y se queda quieta, con nitidez en el enfoque. Parece ser una configuración de privacidad y una oportunidad para que el sistema calibre su sujeto. Una de las principales diferencias entre este prototipo del proyecto Starline y el que Google mostró a fines del año pasado es la caída significativa en el hardware.
El equipo redujo la cantidad de cámaras de «varias» a unas pocas y redujo drásticamente el tamaño total del sistema de algo parecido a una de esas cabinas de comedor. El truco aquí es desarrollar un modelo 3D en tiempo real de una persona con muchos menos ángulos de cámara. Aquí es donde intervienen AI y ML, para llenar los vacíos en los datos, no muy diferente de cómo Pixel aproxima los fondos con herramientas como Magic Erase, aunque con renderizado 3D.
Después de que surge el tema de mi entrevista, un miembro del equipo de Project Starline, los ojos y el cerebro tardan un tiempo en adaptarse. Es una imagen 3D convincente, especialmente para una persona que se ve en tiempo real, con aproximadamente el mismo tipo de retraso que podría experimentar en una antigua llamada de Zoom 2D.
Notarás que algo está… apagado. Los humanos tienden a ser los más difíciles. Hemos evolucionado durante miles de años para detectar la más mínima desviación de la norma. Me deshago del término «espasmos» para describir el movimiento sutil sobre partes de la piel del sujeto. Él, más exactamente, los llama «artefactos». Estos son algunos ejemplos que el sistema no detecta por completo, probablemente debido a limitaciones en los datos recopilados por los sensores integrados. Esto incluye partes que carecen de información visual, apareciendo como si el artista se hubiera quedado sin pintura.
Gran parte de su nivel de comodidad personal se reduce a adaptarse a esta nueva presentación de información digital. En general, cuando la mayoría de nosotros estamos hablando con otra persona, no dedicamos toda la conversación a centrarnos en su apariencia física. Te enfocas en las palabras, y si te gustan esas cosas, las señales físicas sutiles que estamos lanzando en el camino. Presumiblemente, cuanto más utilice el sistema, menos calibración necesitará su cerebro.
Citado de Google publicación de investigación Sobre tecnología:
Nuestro sistema logra señales audiovisuales 3D clave (audio estereoscópico, de escena en movimiento, espacial) y permite una amplia gama de señales de comunicación (contacto visual, gestos con las manos, lenguaje corporal), pero no requiere anteojos especiales ni micrófonos/auriculares corporales. . El sistema consta de una pantalla estéreo con autoseguimiento, captura y subsistemas 3D de alta resolución, y transmisión en red utilizando secuencias de video comprimidas en color y profundidad. Otras contribuciones incluyen un nuevo algoritmo de fusión geométrica basado en imágenes, cancelación de eco en espacio libre y localización de altavoces.
Efectivamente, Project Starline recopila información y la presenta de una manera que crea percepción de profundidad (estereoscópica), usando dos cámaras biológicas separadas en nuestros cráneos. Mientras tanto, el audio espacial ofrece una función similar al audio, calibrando los altavoces para dar la impresión de que la voz del hablante sale de su boca virtual.
Google ha estado probando este prototipo en particular durante algún tiempo con WeWork, T-Mobile y Salesforce, presumiblemente el tipo de grandes clientes corporativos interesados en tal cosa. Gran parte de los comentarios, dice la compañía, se trata de cuán realista es la experiencia en comparación con cosas como Google Meet, Zoom y Webex, las plataformas que salvaron nuestro trasero colectivo durante la pandemia, pero que aún tienen una cantidad significativa de limitaciones.
Probablemente haya escuchado a la gente quejarse, o a usted mismo, sobre las cosas que nos perdimos cuando pasamos de una reunión en persona a una virtual. Son sentimientos objetivamente reales. Project Starline obviamente sigue siendo una experiencia hipotética, pero probablemente engañará a su cerebro para que crea lo contrario. Para una reunión en el lugar de trabajo, honestamente, esto probablemente sea más que suficiente.
Aquí no hay horario ni precios. Google se refirió a él como un «proyecto tecnológico» durante nuestra reunión. Se supone que el resultado ideal de todo el tiempo y el dinero gastados en un proyecto de este tipo es un producto vendible. El tamaño final y el precio potencial seguramente estarán más allá del alcance de la mayoría de nosotros. Puedo ver una versión más modular del sistema de cámara montada en el costado del televisor o la computadora sin problemas.
Para la mayoría de las personas en la mayoría de las situaciones, es una exageración en su forma actual, pero es fácil ver cómo Google podría señalar el futuro de las teleconferencias. Definitivamente le gana a tus jefes Te hace tomar llamadas En un metaverso incompleto.
«Food ninja. Freelance pop culture fanatic. Wannabe zombie maven. Twitter aficionado.»
More Stories
La red social Butterflies AI añade una función que te convierte en un personaje de inteligencia artificial
Edición del vigésimo aniversario de Hautlence HLXX: redefiniendo el tiempo con minutos que retroceden y horas saltantes
Un marco para resolver ecuaciones diferenciales parciales equivalentes puede guiar el procesamiento y la ingeniería de gráficos por computadora