CÔNG NGHỆ

Trí tuệ nhân tạo của Alibaba có khả năng biến bức hoạ Mona Lisa biết nói và hát

Mô hình Emote Portrait Live là công nghệ tiên tiến giúp biến ảnh tĩnh thành chuyển động, đánh dấu một bước tiến quan trọng trong lĩnh vực này.

Các chuyên gia kỹ thuật Trung Quốc tại Viện Điện toán Thông minh (IIC) của Alibaba vừa sáng tạo ra một ứng dụng AI mới mang tên Emote Portrait Live, giúp biến đổi một bức ảnh tĩnh thành hình ảnh có thể nói và hát.

Công nghệ đằng sau mô hình Emote Portrait Live dựa trên khả năng tổng hợp của các mô hình lan truyền. Mô hình lan truyền là một mô hình toán học được sử dụng để mô tả cách mọi thứ lan truyền hoặc lan rộng theo thời gian. Trong trường hợp này, mô hình lan truyền được áp dụng để mô tả cách các chuyển động trên khuôn mặt truyền từ một điểm xuất phát đến các phần khác của khuôn mặt.

AI Của Alibaba Có Thể Biến Bức Hoạ Monalisa Biết Nói Và Hát

Mô hình Emote Portrait Live sử dụng phương pháp khuếch tán để tổng hợp trực tiếp video đầu nhân vật từ hình ảnh và âm thanh được cung cấp, không cần xử lý phức tạp hay biểu diễn trung gian, giúp đơn giản hóa quá trình tạo video đầu người biết nói.

Mục tiêu của nhóm nghiên cứu là phát triển một khung đầu biết nói có thể nhận diện được nhiều biểu hiện thực tế trên khuôn mặt, bao gồm cả những biểu hiện tinh tế và cho phép chuyển động đầu tự nhiên. Để đạt được mục tiêu này, các nhà nghiên cứu đã tích hợp các cơ chế điều khiển ổn định vào mô hình của họ, bao gồm bộ điều khiển tốc độ và bộ điều khiển vùng mặt, nhằm cải thiện độ ổn định trong quá trình phát triển.

AI Của Alibaba Có Thể Biến Bức Hoạ Monalisa Biết Nói Và Hát 2

So với các trí tuệ nhân tạo trước đây chỉ có khả năng biến đổi miệng và một phần của khuôn mặt, Emote có thể tạo ra biểu cảm của khuôn mặt, tư thế, nhíu mày hoặc lắc đầu. Đặc biệt, phần miệng được tạo ra bởi trí tuệ nhân tạo trong Emote trông rất tự nhiên.

Trong một số video được Alibaba công bố, hình ảnh sẽ chuyển đổi thành video và biểu diễn các bài hát được nhập vào một cách nhanh chóng, giống như việc bức tranh Mona Lisa kể lại đoạn độc thoại của nhân vật Rosalind trong vở kịch As You Like It, Màn 3, Cảnh 2 của Shakespeare.

Cùng Chuyên Mục

"MacBook của tôi có thể phát nổ nếu không mở ra xem bên trong: Sự việc khó tin"
CÔNG NGHỆ

"MacBook của tôi có thể phát nổ nếu không mở ra xem bên trong: Sự việc khó tin"

Một chiếc laptop bị kênh lên một cách kỳ lạ khiến bộ pin bên trong phồng lên như một chiếc áo phao khi mở máy ra.

Giải pháp tiết kiệm điện hiệu quả trong mùa nắng nóng
CÔNG NGHỆ

Giải pháp tiết kiệm điện hiệu quả trong mùa nắng nóng

Năm nay, thời tiết nắng nóng đến sớm hơn, khiến nhu cầu sử dụng điều hòa tăng cao. Người tiêu dùng ưu tiên sản phẩm tiết kiệm điện và hiệu quả làm mát. Điều hòa Samsung Inverter AR10DYHZAWKNSV được nhiều người lựa chọn trong phân khúc tầm trung.

Bí quyết khởi nghiệp tuổi 30 từ Jeff Bezos và Mark Zuckerberg
CÔNG NGHỆ

Bí quyết khởi nghiệp tuổi 30 từ Jeff Bezos và Mark Zuckerberg

Sau tuổi 30, thời gian để bứt phá trong cuộc đời bạn sẽ ít đi và quan trọng hơn bao giờ hết là cần phải có một lộ trình phát triển đúng đắn.

Vivo iQOO Z9 ra mắt: Cấu hình mạnh, giá từ 5,9 triệu đồng
CÔNG NGHỆ

Vivo iQOO Z9 ra mắt: Cấu hình mạnh, giá từ 5,9 triệu đồng

Vivo iQOO Z9 là smartphone tầm trung mới với màn hình lớn, pin dung lượng cao và giá phải chăng.

TikTok chuẩn bị cạnh tranh với Instagram của Meta
CÔNG NGHỆ

TikTok chuẩn bị cạnh tranh với Instagram của Meta

Sắp tới, một ứng dụng chia sẻ ảnh độc lập từ TikTok có thể sẽ được ra mắt.

Sự phát triển từ hoài nghi đến thống trị của iPhone
CÔNG NGHỆ

Sự phát triển từ hoài nghi đến thống trị của iPhone

Khi Steve Jobs giới thiệu iPhone vào năm 2007, nhiều người hoài nghi và nghi ngờ về thành công của sản phẩm trước sự cạnh tranh từ các hãng điện thoại lớn như Nokia.