Моделът Emote Portrait Alive (EMO) на Alibaba Cloud, който е в състояние да преобразува портретни снимки в говорещи и дори пеещи аватари, вече е достъпен в приложението Tongyi Qianwen, с ход, който технологичният гигант се надява да донесе по-широка потребителска база за тестване на неговия инструмент GenAI. Понастоящем инструментът не поддържа персонализирано аудио, но потребителите могат да избират от повече от 80 шаблона, включително хитови песни, и да генерират видеоклипове след качване на портретна снимка. В публикация на WeChat в акаунта на Alibaba Cloud, компанията каза, че EMO се е превърнал в „един от най-популярните модели на AI след Sora на OpenAI“, след като направи публични документи, свързани с EMO, в края на февруари. Отделът за облачни изчисления на Alibaba също добави, че неговата аудио-управлявана технология се очаква да бъде приложена в области като цифрови хора, филмова продукция и виртуален съпровод в бъдеще. [“>Alibaba Cloud, in Chinese]
Свързани
Нашия източник е Българо-Китайска Търговско-промишлена палaта