VASA-1 la nueva IA de Microsoft



Microsoft ha presentado una inteligencia artificial capaz de generar avatares hiperrealistas a partir de una imagen y un archivo de voz. VASA-1 puede darle vida a tus fotografías añadiendo expresiones, al tiempo que sincroniza el movimiento de tus labios con el clip de sonido. El resultado final es sorprendente y podría revolucionar la forma como interactuamos en el mundo digital.

De acuerdo con los investigadores, VESA-1 captura toda la gama de expresiones humanas, incluidos los movimientos naturales de la cabeza, para generar avatares parlantes verdaderamente creíbles. Esto es posible al separar elementos como los rasgos faciales, la posición de la cabeza y las expresiones, lo here que permite un control detallado de cada atributo y la posibilidad de editar el contenido por separado.

VESA-1 here va más allá de otros modelos de inteligencia artificial que añaden audio a una website imagen y sincronizan el movimiento de labios. Los investigadores han creado expresiones realistas con movimientos en un espacio website definido. Esto produce una imagen más auténtica y menos rígida.

"Consideramos todas las dinámicas faciales posibles, incluido el movimiento de los labios, la expresión (sin labios), la mirada y el parpadeo, entre otras, como una única variable latente y modelamos su distribución probabilística de click here manera unificada", mencionan los autores de Microsoft Research. "Nuestro modelado holístico de la dinámica facial, junto con los patrones de movimiento de la cabeza aprendidos conjuntamente, conduce a la generación de una amplia gama de comportamientos de conversación emotivos y realistas".

Leave a Reply

Your email address will not be published. Required fields are marked *