Sony thử nghiệm nhân vật ảo trong game vận hành bằng AI, vừa khớp vừa có hồn

Doanh nghiệp gần bạn nhất

được xác nhận bởi itcctv

Sony thử nghiệm nhân vật ảo trong game vận hành bằng AI, vừa khớp vừa có hồn
Hình ảnh rao vặt

Sony thử nghiệm nhân vật ảo trong game vận hành bằng AI, vừa khớp vừa có hồn

Cũng là AI, nhưng phản ứng của cộng đồng đối với Activision khi họ thừa nhận dùng AI, và phản ứng khi nhìn thấy Sony bị rò rỉ một đoạn tech demo thử nghiệm nội bộ, ứng dụng AI để tạo ra những nhân vật có cá tính và có chiều sâu, hai phản ứng đó thực sự rất khác nhau. Mấy tháng trước, Activision đã thừa nhận họ sử dụng AI để tạo ra vài hình ảnh xuất hiện trong Call of Duty: Black Ops 6. Điều này đã khiến cả cộng đồng lên tiếng chê bai vì tiết kiệm không đúng lúc đúng chỗ, kết quả AI tạo hình cũng chẳng chất lượng:



Còn với Sony, hai ngày vừa rồi, cộng đồng gamer trên các mạng xã hội lớn như Reddit và X xôn xao vì một đoạn clip được leak trên các mạng xã hội này. Trong đó, nhân vật Aloy nổi tiếng của series game nhập vai thế giới mở Horizon của studio Hà Lan, Guerrilla Games. Nhân vật ảo đồ họa 3D được vận hành bởi cùng lúc vài công cụ, bao gồm cả mô hình ngôn ngữ AI để tạo ra những câu thoại có hồn cho nhân vật ảo.

Trước khi bị đánh bản quyền và bị gỡ bỏ khỏi mọi nền tảng mạng xã hội, đoạn video bị rò rỉ là phần trình bày của giám đốc Sharwin Raghoebardajal, một trong những lãnh đạo mảng phát triển công nghệ trò chơi điện tử, lập trình phần mềm của Sony Interactive Entertainment. Raghoebardajal đảm nhiệm vị trí giám đốc quản lý tại Advanced Technology Group của PlayStation Studios, đảm trách từ công nghệ thiết kế trò chơi điện tử, trí tuệ nhân tạo, tầm nhìn của máy tính và công nghệ gương mặt đồ họa vi tính.

Thứ được Raghoebardajal trình diễn là mô hình nhân vật Aloy, vận hành hoàn toàn bằng mô hình ngôn ngữ lớn. Nhờ đó, Aloy phiên bản ảo có thể trò chuyện như một trợ lý AI, nhưng với bối cảnh và thông tin liên quan tới cốt truyện game. Người chơi sẽ nói chuyện vào microphone, và công cụ Whisper, biến giọng nói thành văn bản của OpenAI sẽ tạo ra những dòng chữ để chatbot hiểu rồi trả lời. Để trả lời những câu hỏi, yêu cầu hay đơn giản là những trò chuyện từ con người, cả GPT-4 lẫn Llama 3 đều được ứng dụng, đi kèm với đó là khả năng tư duy lý luận logic của mô hình ngôn ngữ lớn.


Khi chatbot AI tạo ra được câu trả lời, sẽ đến bước đưa câu trả lời đó vào công cụ tên là EVS, viết tắt của Emotional Voice Synthesis. Đây là công cụ do chính các nhà phát triển của Advanced Technology Group của Sony tạo ra, biến dòng chữ thành giọng nói. Cuối cùng, khi mô hình nhân vật Aloy nói ra câu thoại được tạo ra từ EVS, công nghệ thứ hai của Sony phát triển, Mockingbird, công cụ đồng bộ âm thanh với khẩu hình miệng và cử động gương mặt ảo sẽ làm việc để nhân vật đồ họa 3D trông chân thực nhất.



Xin phép được nhắc lại, những gì thể hiện trong đoạn clip bị rò rỉ đều là những gì được trình diễn trong nội bộ tập đoàn, giữa các dev và các nhà phát triển game thuộc PlayStation Studios. Thẳng thắn thừa nhận thì, đoạn video này đã khiến cộng đồng có những tranh cãi. Có người thì nói demo này trông thực sự đáng sợ. Còn nhiều người khác thì cho rằng đây hoàn toàn có thể là tương lai của ngành game.

Theo giám đốc Raghoebardajal, demo này được vận hành trên máy tính. Nhưng các kỹ sư tại Advanced Technology Group của Sony cũng đang thử nghiệm công nghệ này trên hệ thống PS5 mà không bào quá nhiều hiệu năng phần cứng, ảnh hưởng tới chất lượng đồ họa cũng như tốc độ khung hình của trò chơi đang được máy console xử lý.

Nếu anh em thấy công nghệ này quen, thì Nvidia cũng có thứ y hệt, và đã được họ giới thiệu cũng như trình diễn kể từ năm 2023, mang tên ACE, viết tắt của Avatar Cloud Engine. Trong bộ ứng dụng ACE, viết tắt của Avatar Cloud Engine, là đầy đủ mọi giải pháp tạo ra một nhân vật ảo thông qua sự hỗ trợ của AI:
  • Nvidia Riva ASR, TTS và NMT: Tự động nhận diện giọng nói, dịch thuật nhanh ngôn ngữ và chuyển văn bản thành lời thoại.
  • Nemotron LLM: Mô hình ngôn ngữ cho phép hiểu rõ ngôn ngữ, cũng như tạo ra những câu trả lời rất đúng với ngữ cảnh.
  • Audio2Face: Công nghệ điều chỉnh cử động gương mặt nhân vật ảo dựa trên âm thanh giọng nói, khớp cử động môi và cả khuôn mặt.
  • Omniverse RTX: Xử lý chi tiết đồ họa làn da, mái tóc dựa vào ray tracing thời gian thực.
  • Audio2Gesture: AI tạo cử động cơ thể dựa trên âm thanh giọng nói của nhân vật.
  • Nemotron-3 4.5B: SLM 4.5 tỷ tham số, vận hành ngay trên PC trang bị card RTX để tạo sinh với độ trễ thấp.



Không loại trừ khả năng, những công nghệ như của Sony hay Nvidia đang phát triển sẽ được triển khai rất sớm, để tạo ra những thế giới ảo, bên trong đó là những nhân vật có hồn, có chiều sâu, không phụ thuộc vào những dòng thoại được các biên kịch nghĩ ra, rồi để cho những diễn viên lồng tiếng đọc lại. Với sự kết hợp giữa công cụ tối ưu cử động gương mặt với chatbot AI, mọi nhân vật ảo trong game đều có chất lượng tương đương với nhau, không có tình trạng nhân vật chính thì được trau chuốt, nhân vật phụ hay thậm chí là NPC có trong màn chơi thì chỉ vỏn vẹn mấy câu lặp đi lặp lại.

Nhưng ở khía cạnh ngược lại, đã bắt đầu có những sợ hãi trong cộng đồng các nhà phát triển game, hay thậm chí là cả những hãng phim về cách AI có thể tác động đến quá trình sáng tạo khi phát triển game cũng như phát triển đồ họa máy tính, đặc biệt là khi quá nhiều vụ cắt giảm nhân sự đang tác động đến ngành công nghiệp game toàn cầu. Gần một nửa trong số 3.000 người đã trả lời khảo sát tại GDC 2024 cho biết, các công cụ AI tạo sinh hiện đang được sử dụng tại nơi làm việc của họ, với 31% cho biết họ đích thân sử dụng chúng. Không chỉ các nghệ sĩ, họa sĩ hay nhà phát triển game có nguy cơ bị AI đào thải, mà ngay cả những diễn viên lồng tiếng trong ngành game cũng vậy.
Nguồn:tinhte.vn/thread/sony-thu-nghiem-nhan-vat-ao-trong-game-van-hanh-bang-ai-vua-khop-vua-co-hon.3968283/
💬 bình luận

Bình luận

Trở thành viên của itcctv — Đăng ký
Thủ thuật tin học văn phòng Thủ thuật Word Thủ thuật Excel
Cuộn