En un video de demostración, los investigadores de la compañía animaron la icónica imagen de Leonardo Da Vinci para recitar un rap cómico interpretado por la actriz Anne Hathaway.
Gracias a la nueva tecnología de inteligencia artificial de Microsoft, la Mona Lisa no solo sonríe, ahora también recita rap. Investigadores de Microsoft presentaron VASA-1, un modelo de IA capaz de crear videos realistas a partir de imágenes fijas y audio de una persona hablando. Estos videos, que pueden generarse a partir de rostros fotorrealistas o ilustraciones, cuentan con una sincronización labial y movimientos faciales naturales.
En una demostración, animaron a la Mona Lisa para recitar un rap cómico de Anne Hathaway. Aunque impresionante, el realismo del modelo plantea preocupaciones sobre su potencial uso indebido, especialmente en desinformación.
Microsoft ha manifestado su intención de no lanzar VASA-1 públicamente hasta asegurarse de su uso responsable y cumplir con las regulaciones adecuadas.
VASA-1 se entrenó con videos de caras hablando para reconocer movimientos faciales naturales como el parpadeo y las expresiones. Aunque presenta señales de ser generado por IA, como parpadeos poco frecuentes, Microsoft considera que supera a otras herramientas similares, allanando el camino para avatares realistas en interacciones conversacionales