So Sánh Sức Mạnh AI giữa Mỹ và Trung Quốc: Runway Gen-3 Alpha và Kuaishou Kling AI

Doanh nghiệp gần bạn nhất

được xác nhận bởi itcctv

So Sánh Sức Mạnh AI giữa Mỹ và Trung Quốc: Runway Gen-3 Alpha và Kuaishou Kling AI

Sau hai bài viết trải nghiệm chi tiết hai mô hình tạo sinh video nhờ thuật toán AI mà mình gửi tới anh em trong thời gian qua, có lẽ cũng đã đến lúc so sánh trực tiếp khả năng của cả hai mô hình này, để xem video ngắn từ mô hình AI nào trông chân thực hơn, và bàn về những giới hạn của những công nghệ tạo sinh hình ảnh dựa trên những gì mô hình và thuật toán AI học được từ những nội dung do con người tạo ra, rồi dựa vào đó để tạo ra những hình ảnh hoàn toàn không có thật.

Gen-3 là mô hình ngôn ngữ mới nhất của RunwayML, trụ sở Manhattan, New York, Mỹ. Còn Kling AI là sản phẩm của Kuaishou Technology, trụ sở Bắc Kinh, Trung Quốc.

Anh em quan tâm có thể đọc lại hai bài trải nghiệm AI Runway Gen-3 Alpha Test, và Kuaishou Kling AI của mình:

Làm video bằng AI Runway Gen-3: Chưa hoàn hảo, nhưng một 9 một 10 với Sora

Trước khi nói tới trải nghiệm sử dụng hay chính bản thân phiên bản thử nghiệm Alpha của mô hình tạo sinh video Gen-3 từ RunwayML, mời anh em xem trước đoạn clip ngắn 30 giây, chỉ sử dụng nội dung tạo ra bằng mô hình AI này.
tinhte.vn


Tạo video bằng AI Trung Quốc: Kling AI vừa mở cửa toàn cầu, làm clip miễn phí

Ngày 24/7, Kuaishou Technology của Trung Quốc cuối cùng cũng mở cửa thử nghiệm mô hình tạo sinh hình ảnh và video do chính họ phát triển mang tên Kling AI. Trước đó nếu như muốn tạo ra những đoạn clip ngắn dài khoảng 5 giây theo yêu cầu…
tinhte.vn


Mình có giải pháp so sánh trực tiếp như thế này. Vấn đề của Kling AI nằm ở hai điểm. Thứ nhất, Kling AI giờ muốn trả tiền để làm nhiều hơn 6 video vẫn chưa khả thi, nên đó là giới hạn của bài viết so sánh của mình ngày hôm nay. Và vấn đề thứ hai, Kling AI cũng chỉ cho làm mỗi video dài 5 giây, chất lượng “thấp”, độ phân giải 1280x720 pixel, để máy chủ xử lý nhanh nhất cho người dùng miễn phí, trong quá trình thử nghiệm rộng rãi mô hình này trên toàn thế giới.

Thành ra để công bằng, chỉ có một cách là gõ cùng một prompt vào cả hai cửa sổ tạo video bằng AI trên trang web của RunwayML và Kuaishou Technology, rồi cùng chọn đoạn video dài 5 giây. Cả hai công cụ này đều được điều chỉnh tham số tạo sinh video ngẫu nhiên.

Sáu câu lệnh được lựa chọn dựa trên những góc quay và giải pháp quay khác nhau. Có cảnh cận, có cảnh toàn, có cảnh rượt đuổi theo chủ thể và cũng có những cảnh yêu cầu mô hình AI phải tạo ra những chi tiết không có thực, để thử nghiệm khả năng sáng tạo dựa trên những gì hai mô hình AI đã được học.


hyperspeed drone shot flying through an abandoned building, fast motion, graffiti paintings on the walls, high contrast, low light, vibrant color, cinematic color

Runway Gen 3 Alpha:

Video Player is loading.
Current Time 0:00
Duration 0:05
Loaded: 100.00%
Stream Type LIVE
Remaining Time 0:05
 
1x
    • Chapters
    • descriptions off, selected
    • subtitles settings, opens subtitles settings dialog
    • subtitles off, selected


      Kuaishou Kling AI:

      Quảng cáo


      Video Player is loading.
      Current Time 0:00
      Duration 0:05
      Loaded: 47.94%
      Stream Type LIVE
      Remaining Time 0:05
       
      1x
        • Chapters
        • descriptions off, selected
        • subtitles settings, opens subtitles settings dialog
        • subtitles off, selected


          Điều đầu tiên mình để ý khi so sánh Gen 3 Alpha và Kling AI, đó là khác biệt về tốc độ tạo sinh những đoạn clip 5 giây của hai mô hình này phụ thuộc gần như hoàn toàn vào sức mạnh của hệ thống máy chủ đám mây. Cùng thời lượng video, nhưng khoảng thời gian mình phải chờ đợi Kling AI trả kết quả lâu gấp từ 5 đến 6 lần so với máy chủ của Runway Gen 3. Hai lý do được đưa ra. Thứ nhất, Kuaishou không thể có những GPU Nvidia H100 hay H200 vì quy định cấm vận của phía Mỹ, không có những GPU xử lý thuật toán AI mạnh nhất trên thị trường ở thời điểm hiện tại, nên khả năng vận hành mô hình AI, thời lượng video lẫn cả tốc độ tạo video của AI Trung Quốc đều bị giới hạn nghiêm trọng, chờ khá lâu.

          Lý do thứ hai, muốn dùng thử Runway Gen-3 Alpha phải trả tiền, mỗi ngày sẽ có 1000 token để anh em tạo video, sang ngày hôm sau reset, lại dùng được tiếp. Việc startup AI trụ sở tại New York thương mại hóa mô hình đang trong quá trình thử nghiệm cũng giúp họ trang trải được phần nào chi phí máy chủ đám mây dùng để vận hành những ứng dụng dựa trên những mô hình AI do họ phát triển. Thành ra làm video rất nhanh.

          Có ba yếu tố cần đề cập trong cái prompt đầu tiên này. Thứ nhất là độ mượt của chuyển động camera, thứ hai là ánh sáng màu sắc, và thứ ba là độ đồng nhất của chi tiết hình ảnh. Cả ba khía cạnh này, Gen-3 Alpha nhỉnh hơn một cách rõ ràng. Màu sắc trong video Kling AI làm ra có phần rực hơn, nhưng chi tiết hình ảnh liên tục bị thay đổi, không nhất quán như video của Gen-3. Rồi tốc độ của camera mô phỏng drone bay cũng là một giới hạn của Kling AI. “Tốc độ nhanh” có vẻ AI hiểu là tốc độ khung hình mượt chứ không phải drone bay nhanh. Về phần mô phỏng nhịp độ camera, Gen-3 làm tốt hơn.


          close up static shot: the camera is angled up at a young Asian woman standing in a neon lit street at night, she is looking directly into the camera, neon light reflections, cinematic color, f1.8, high contrast, low light, vibrant color

          Runway Gen-3 Alpha:

          Quảng cáo



          Video Player is loading.
          Current Time 0:00
          Duration 0:05
          Loaded: 100.00%
          Stream Type LIVE
          Remaining Time 0:05
           
          1x
            • Chapters
            • descriptions off, selected
            • subtitles settings, opens subtitles settings dialog
            • subtitles off, selected
              Trở thành viên của itcctv — Đăng ký
              Thủ thuật tin học văn phòng Thủ thuật Word Thủ thuật Excel
              Cuộn