AMD hợp tác với Stability AI ra mắt mô hình Stable Diffusion 3.0 Medium mới chạy trực tiếp trên NPU XDNA thế hệ 2 của dòng CPU Ryzen AI. Đây là mô hình SD 3.0 Medium BF16 (Block FP16) đầu tiên trên thế giới được tối ưu cho NPU XDNA 2. Theo AMD, mô hình này giữ được chất lượng ảnh cao trong khi giảm đáng kể yêu cầu về dung lượng bộ nhớ, cho phép người dùng có thể tự ra lệnh tạo sinh ảnh với chất lượng in ấn ngay trên laptop chỉ nhờ sức mạnh của NPU tích hợp, không cần kết nối lên máy chủ đám mây.
Mô hình SD 3.0 Medium mới sử dụng định dạng số học BF16 (Block FP16), kết hợp hiệu năng ở mức 8 bit nhưng với độ chính xác của FP16. Thiết kế block floating-point cho phép NPU XDNA 2 xử lý gần như bằng tốc độ 8 bit (INT8) trong khi duy trì chất lượng ảnh như FP16, vượt trội so với các định dạng truyền thống. Kết quả là chất lượng ảnh tạo ra cải thiện rõ rệt, chân thực hơn đáng kể so với thế hệ trước sử dụng mô hình SDXL Turbo. AMD cung cấp cả hình ảnh minh hoạ so sánh cho thấy người và vật thể được tạo ra bằng SD 3.0 Medium có chi tiết tinh tế, tự nhiên hơn rất nhiều. Đồng thời, mô hình mới tối ưu hóa bộ nhớ: nó có thể chạy trên laptop 24 GB RAM trong khi chỉ tiêu tốn khoảng 9 GB bộ nhớ. Mức này tương đương giảm gần 3/4 so với yêu cầu trước đó. Chính nhờ những cải tiến này mà các laptop phổ thông dưới 32 GB RAM giờ cũng có thể tạo sinh ảnh AI độ phân giải cao mà không bị giới hạn bởi bộ nhớ quá thấp.
Trên NPU XDNA 2, quy trình tạo sinh ảnh được triển khai qua hệ pipeline 2 giai đoạn. Đầu tiên, mô hình SD 3.0 Medium tạo ảnh 1024 × 1024 (1 MP), sau đó NPU tự động đưa ảnh này vào bộ tăng cường XDNA Super Resolution để nâng lên 2048 × 2048 (4 MP), được coi là mức chất lượng có thể dùng cho in ấn. Kết quả là các ảnh đầu ra có độ phân giải cao và chi tiết, phù hợp kể cả trong trường hợp người dùng muốn in ảnh hay sử dụng cho nhu cầu đồ hoạ chuyên nghiệp. Theo AMD, người dùng có thể tùy chỉnh ảnh thành hình stock chất lượng cao dùng cho thiết kế và marketing. Lấy ví dụ như in logo thương hiệu lên lon nước giải khát hoặc áo thun, giúp sáng tạo nhanh chóng những nội dung quảng cáo cho thương hiệu.
Không chỉ chất lượng, khả năng xử lý trực tiếp trên thiết bị cũng là ưu thế của mô hình mới này. Toàn bộ quá trình tạo sinh ảnh diễn ra offline ngay trên laptop có cấu hình dùng vi xử lý Ryzen AI có NPU XDNA 2 (tối thiểu 50 TOPS) và RAM từ 24 GB trở lên; không cần kết nối Internet hay sử dụng máy chủ đám mây. Điều này giúp bảo mật dữ liệu người dùng, giảm độ trễ và không phụ thuộc băng thông mạng, đáp ứng nhu cầu ở bất kỳ đâu. AMD nhấn mạnh laptop Ryzen AI có thể tạo sinh ảnh mọi lúc mọi nơi. Kết hợp với ứng dụng Amuse 3.1 do Tensorstack phát triển, người dùng chỉ việc cài đặt driver Adrenalin mới nhất và bật chế độ XDNA 2 Stable Diffusion Offload ở mức chất lượng cao là có thể trải nghiệm ngay mô hình mới. Tuy tốc độ tạo sinh ảnh trên NPU (khoảng 70 giây cho ảnh 2048p) chậm hơn so với GPU rời (trong thử nghiệm mất khoảng 30 giây) nhưng bù lại NPU cho phép duy trì thiết kế laptop mỏng nhẹ, tản nhiệt tốt và tiết kiệm năng lượng hơn.
Trong khi các giải pháp AI phổ biến hiện nay vẫn cần GPU mạnh hoặc dịch vụ đám mây để chạy mô hình Stable Diffusion chất lượng cao, AMD đang xây dựng nền tảng AI PC mới - những mẫu laptop Ryzen AI tích hợp NPU cho phép người dùng tự tạo nội dung sinh động ngay trên máy tính. Điều này giúp phổ cập công nghệ Generative AI cho nhiều đối tượng hơn: từ nhà thiết kế đồ hoạ và marketer cần ảnh stock tùy biến, tới người sáng tạo nội dung cá nhân không muốn phụ thuộc mạng Internet hay các hình ảnh phải trả tiền thuê bao. Hơn nữa, bằng cách hợp tác với Stability AI và hỗ trợ cấp phép cộng đồng (miễn phí cho cá nhân và doanh nghiệp nhỏ), AMD khuyến khích việc ứng dụng mô hình Stable Diffusion 3.0 Medium trên quy mô rộng hơn.
Trong bối cảnh cạnh tranh, AMD đang khẳng định vị thế trong cuộc đua AI di động bên cạnh Intel và NVIDIA. Đây là lợi thế để dòng máy Ryzen AI trở nên đúng nghĩa hơn với cụm AI PC chạy Windows 11, khi cho phép thực thi các tác vụ tạo sinh ảnh và hỗ trợ AI phức tạp ngay trên thiết bị. Mục tiêu dài hạn, AMD còn có thể phát triển thêm các mô hình AI khác (chẳng hạn như các phân khúc tạo ảnh cỡ trung bình, nhỏ) tối ưu cho NPU, cũng như cập nhật kiến trúc XDNA thế hệ sau. Hướng đi “AI on-device” cũng cho thấy xu thế mới trong ngành: giảm phụ thuộc điện toán đám mây, tăng cường tính riêng tư và hiệu năng cho thiết bị của người dùng cuối.
Đối với người dùng, mô hình SD 3.0 Medium mở ra nhiều khả năng ứng dụng mới. Các nhà sáng tạo nội dung và marketer với laptop chạy CPU Ryzen AI có thể nhanh chóng tạo ảnh quảng cáo, thiết kế bằng AI mà không cần camera hay studio, ấn tượng nhất là thực hiện ngay cả khi đang di chuyển. Quy trình này hoàn toàn cục bộ, không cần kết nối mạng cho dịch vụ đám mây hay yêu cầu băng thông lớn. Những tổ hợp thuật toán nâng cao cũng được tích hợp sẵn, khoảng cách đánh dấu, chấm câu trong câu lệnh (prompt) cũng được AMD tối ưu để tạo ra hình ảnh tốt nhất.
Động thái của AMD là 1 đột phá về công nghệ và thị trường trong lĩnh vực AI trên PC. Việc ra mắt mô hình SD 3.0 Medium BF16 không chỉ nâng tầm khả năng sáng tạo ngay trên máy tính cá nhân mà còn thúc đẩy xu hướng AI cục bộ hay AI tại biên (edge AI). Trong tương lai, nếu AMD tiếp tục phát triển bộ công cụ NPU-không-cloud, người dùng sẽ có thêm nhiều lựa chọn trong sáng tạo nội dung đa phương tiện mà không phụ thuộc vào hạ tầng đám mây, góp phần mở rộng hệ sinh thái AI PC đúng nghĩa hơn. Nguồn:tinhte.vn/thread/amd-ra-mat-mo-hinh-ai-bf16-dau-tien-cho-npu-xdna-2-tren-laptop.4040305/