Google giới thiệu công nghệ AI mới cho phép tạo video từ văn bản
Bộ phận nghiên cứu của Google (Google Research) mới đây đã vừa có màn trình diễn khả năng mới vô cùng độc đáo của Lumiere, một mô hình AI mới của công ty.
AI mới của Google có khả năng tạo video như thật chỉ bằng vài dòng text hoặc văn bản
Theo đó, công nghệ AI mới này được Google phát triển với mục tiêu giải quyết thách thức lớn trong việc tổng hợp video, đó là "xây dựng chuyển động thực tế, đa dạng và mạch lạc," theo thông tin từ hãng.
Trước đây, các video được tạo ra bằng AI thường gặp vấn đề giật cục, trong khi phương pháp của Google mang đến trải nghiệm liền mạch hơn. Lumiere đạt được điều này thông qua kiến trúc Space-Time U-Net, cho phép tạo ra video hoàn chỉnh từ đầu đến cuối chỉ trong một lần chạy.
Phương pháp này đem lại sự khác biệt so với các mô hình trước đây, nơi mà chỉ tổng hợp những khoảnh khắc chính và cách xa nhau, gây khó khăn trong việc tạo ra video cuối cùng có sự đồng nhất.
Lumiere không chỉ có khả năng xây dựng phong cách đặc biệt cho video dựa trên hình ảnh mẫu được cung cấp bởi người dùng, mà còn có khả năng tạo nội dung mới. Điều này cung cấp cho người dùng sự linh hoạt, cho phép họ chỉnh sửa hoặc sửa chữa những phần bị lỗi trong video hiện tại theo yêu cầu cá nhân của họ.
Google Research đã so sánh hiệu suất của Lumiere với các AI khác hiện đang tạo video từ văn bản, bao gồm ImagenVideo, Pika, ZeroScope và Gen2. Trong thử nghiệm, nhóm nghiên cứu đề xuất một nhóm video có chất lượng hình ảnh và chuyển động tốt nhất mà không tiết lộ chúng được tạo ra bởi mô hình nào. Theo báo cáo, Lumiere vượt trội hơn mọi đối thủ trong các thử nghiệm.
Tuy nhiên, mô hình này chưa được công bố cho công chúng, và người dùng internet chỉ mới có cơ hội xem các bản demo của Lumiere.
Theo: Zdnet
:
Viết bình luận