Hướng dẫn tạo video bằng AI Google Veo: phân biệt các tài khoản, prompt tạo video, các lưu ý

Doanh nghiệp gần bạn nhất

được xác nhận bởi itcctv

Hướng dẫn tạo video bằng AI Google Veo: phân biệt các tài khoản, prompt tạo video, các lưu ý
Hình ảnh rao vặt

Hướng dẫn tạo video bằng AI Google Veo: phân biệt các tài khoản, prompt tạo video, các lưu ý

Google đã chính thức cho người dùng xài thử Veo 3 - model tạo video có cả hình ảnh lẫn âm thanh thoại với chất lượng đầu ra rất cao, độ phân giải lên tới 1080, độ dài tùy ý, các cảnh quay không chỉ ít lỗi mà còn rất tự nhiên, đồng bộ thoại với chuyển động của miệng và biểu cảm gương mặt nhân vật chân thật. Nhiều video đã được share trên mạng, trong bài viết này mình sẽ giải thích chi tiết về cách tiếp cận dịch vụ này, làm sao để có tính năng Veo 3 trong tài khoản Google và một workflow đơn giản nhưng dễ áp dụng cho bạn nào quan tâm.


Đầu tiên chính là cái rắc rối nhất, tài khoản Google nào và làm sao để có tính năng Veo 3 tạo video.

Sau sự kiện Google IO 2025 vừa diễn ra, Google đã chính thức tích hợp các tính năng có Gemini vào trong gói Google One, chia thành 3 loại là: Free, Pro và Ultra. Mỗi gói sẽ bao gồm nhiều dịch vụ trong đó, bao gồm cả Gemini chatbot, NotebookLM Pro, Youtube Premium, dung lượng Google Drive và quyền truy cập vào model Veo để tạo video.



Người dùng gói Pro và Ultra sẽ có thể tạo video bằng model Veo với các giới hạn khác nhau. Cụ thể:
  • Gói Google AI Pro sẽ được truy cập vào model Veo 2 và Veo 3, mỗi tháng sẽ được cấp 1000 tín dụng AI. Hiện đã được triển khai tất cả các nước có dịch vụ Google, bao gồm Việt Nam.
  • Gói Google AI Ultra sẽ được truy cập vào model Veo 2 và Veo 3, mỗi tháng sẽ được cấp 12500 tín dụng AI.Hiện đã được triển khai ở hơn 70 nước, chưa có ở Việt Nam.

Về chuyện xài các tín dụng AI đó, tùy vào model Veo người dùng xài, tương ứng với chất lượng video đầu ra mà sẽ tốn số tín dụng khác nhau mỗi lần tạo. Cụ thể:
  • Model Veo 2 + mode tạo nhanh: chất lượng thấp nhất, tốn 10 tín dụng mỗi lượt tạo.
  • Model Veo 2 + mode chất lượng cao: chất lượng video cao hơn, tốn 100 tín dụng mỗi lượt tạo.
  • Model Veo 3: chất lượng video cao nhất, tốn 150 tín dụng mỗi lần tạo.



Như vậy, đối với người dùng đã đăng ký Google One Pro (khoảng 500 ngàn mỗi tháng) là đã có thể tạo video bằng Veo 2. Người dùng Google One Ultra (hiện đang cho xài thử với giá 3 triệu / 3 tháng, sau đó là 6 triệu mỗi tháng) thì sẽ được tiếp cận vào Veo 3. Các quyền lợi khác các bạn có thể xem thêm trong ảnh bên trên.

Một thông tin quan trọng là tại thời điểm này, tính năng Veo 2 và Veo 3 chưa hỗ trợ vùng Việt Nam. Do đó, chỉ người dùng từ các khu vực được hỗ trợ mới được truy cập vào.

Sau khi đã có tài khoản đủ điều kiện, có thể truy cập từ vùng được hỗ trợ, thì tiếp theo là câu hỏi "giờ bấm vào chỗ nào để có thể dùng tính năng tạo video bằng Veo?".


Veo là một model và do đó, chúng ta cần một giao diện để có thể tạo video. Google đang triển khai Veo trong 3 dịch vụ mà họ phát hành gồm:
  • Ngay trong chat bot Gemini: có thể truy cập từ nhiều nước, bao gồm cả Việt Nam. LINK
  • Trong ứng dụng tạo animate Whisk: có thể truy cập từ nhiều nước, bao gồm cả Việt Nam. LINK
  • Trong ứng dụng tạo video qua Flow: hiện chỉ mới triển khai tại Mỹ. LINK

Bên dưới, mình sẽ dùng thử nhanh tính năng tạo video bằng Gemini và Flow, còn Animate mình sẽ dành 1 bài khác để chia sẻ về nó kỹ hơn nha.



Đây là cách đơn giản nhất để tạo video với Veo. Chỉ cần vào chat bot quen thuộc là Gemini.google.com, bấm vào nút Video ở khung nhập prompt, sau đó nhập mô tả nội dung video muốn tạo vào và đợi là xong.

Như đã nói ở trên, tùy vào tài khoản của người dùng mà có thể truy cập vào Veo 2 hoặc Veo 3.


Đây là mình vào bằng tài khoản Pro, khi bấm vào video sẽ hiện là Veo 2.


Còn đây là vào bằng tài khoản Ultra, khi bấm vào video sẽ hiện là tạo video bằng Veo 3 (preview).

Mình sẽ thử nhập vào cùng một prompt ở 2 tài khoản để tạo thử cho mọi người xem chất lượng luôn nha. Prompt này sẽ mô tả video, thông số camera, các góc máy mong muốn, rồi cả thoại của nhân vật.

Về prompt, bạn nào muốn thử có thể dùng mẫu như mình dùng ở đây và thay các nội dung mà các bạn muốn. Prompt cần là tiếng Anh để mô tả cụ thể các thuật ngữ và để model hiểu rõ hơn ý định trả về video đúng ý đồ của chúng ta hơn. Về làm sao để tạo ra một prompt giống như thế này thì mình giải thích ở một bài viết khác ha.

SPECS: 50mm lens, handheld, shallow depth of field, cinematic lighting, NO CAPTIONS OR TEXT.
ÔNG HẢI (65, graying hair, deep wrinkles, light blue long-sleeved shirt) slowly sips black coffee at a street-side café in District 3, Saigon. The rain falls outside, gently tapping on the awning above.
WIDE SHOT: A quiet corner café with plastic stools, wet pavement reflecting neon signs, occasional motorbikes passing by under umbrellas. Ông Hải sits alone near the edge, coffee steam rising in front of him.
MEDIUM SHOT: He gazes out toward the street, one hand wrapped around a warm cup. A small notebook sits open on the table, next to an old fountain pen.
CLOSE-UP: His worn hands holding the cup tightly. Drops of rain trickle down the plastic canopy above him.
ÔNG HẢI says with old man voice, slow, reflective, slightly raspy, in Vietnamese
“Không có người đàn ông nào hiểu biết về phụ nữ nhiều như tôi. Còn tôi thì không biết gì về họ.”
EXTREME CLOSE-UP: His eyes – clouded, yet glinting with memory – staring past the falling rain.
[Brief description of environmental movement or lighting change]: The wind pushes a curtain of rain closer to the café edge, a passing motorbike splashes water onto the street. A flicker of lightning briefly brightens the scene.
AUDIO: Soft rain, distant thunder, traffic hum, slow breathing, the gentle clink of ceramic on the table.
KEY ELEMENTS: Rainy Saigon street, old man in solitude, coffee steam, poetic inner monologue, city nostalgia.


Đây là kết quả từ Veo 2 trong tài khoản Pro. Cảnh quay cũng khá ổn, nhưng do bản chất Veo 2 chưa hỗ trợ tạo video có âm thanh nên không có tiếng rồi. Để ý kỹ hơn sẽ thấy lỗi nhiều, điển hình như xe máy chạy ngang đều có che dù, nhưng thực tế đâu có được như vậy.


Và đây là kết quả từ Veo 3 trong tài khoản Ultra. Khá bất ngờ trước kết quả tạo ra, mọi thứ đều rất mượt mà, các góc máy tuân thủ như yêu cầu của mình trong prompt, đặc biệt là giọng nói được đồng bộ với cử động của khuôn mặt, đặc biệt là phần miệng. Tất nhiên để ý kỹ thì phần miệng nhép vẫn chưa thật lắm với giọng nói, giọng nói cũng chưa đúng ý mình.

Thêm một prompt khác:
SPECS: Handheld camera, 35mm lens, neon night lighting, urban realism, NO CAPTIONS OR TEXT.
SCENE DESCRIPTION:
A vibrant night street in Bùi Viện, Ho Chi Minh City – bustling with energy. Colorful neon signs flash in Vietnamese (quán bar, ốc đêm, bia tươi). Loud music from nearby bars, locals and tourists passing by, buzzing scooters in the background.
A Vietnamese male interviewer, early 30s, wearing a casual blue Uniqlo t-shirt, stands confidently holding a microphone. In front of him are two young Vietnamese women, both in trendy black outfits with light makeup and bold streetwear vibes. They’re standing close together, visibly amused.
DIALOGUE (in Vietnamese):
Interviewer (cheerful, playful tone):
“Em nghĩ sao nếu anh rủ em đi dạo dưới ánh đèn neon Bùi Viện nè?”
Girl 1 (grinning, confident):
“Em thà dắt chó đi dạo còn hơn á!”
Girl 2 (laughs, nodding):
“Chuẩn luôn đó!”
CAMERA MOVEMENT:
The camera subtly zooms in on their faces as they laugh, catching the vivid reflections of neon signs in their eyes. Behind them, the glow of red and blue lights pulses off the wet pavement.
AUDIO: Background club music, distant street vendors calling, motorbike engine hums, laughter from the girls clearly audible above the ambient noise.
KEY ELEMENTS: Bùi Viện nightlife, playful street interview, Vietnamese youth culture, authentic local attitude, expressive body language, neon ambiance.


Đây là kết quả từ Veo 2 trong Gemini Pro


Và đây là kết quả từ Veo 3 trong Gemini Ultra

Với cách tạo video trong Gemini thì ưu điểm chính là tiện lợi, chỉ cần prompt và đợi 1-2 phút là có kết quả đầu ra. Rõ ràng là Veo 2 và Veo 3 có sự khác biệt cực kỳ rõ về chất lượng video đầu ra, đặc biệt là nội dung bên trong nó và giọng nói, âm thanh do AI tạo ra đồng bộ với nhân vật trong video.

Tuy nhiên, nhược điểm sẽ là chất lượng của file tạo ra chỉ là 720 chứ chưa lên được 1080, mỗi video chỉ dài tối đa 8 giây và mỗi ngày chỉ được tạo tối đa 5 video với Veo 3, đồng thời việc điều khiển chi tiết các cú máy, độ dài video cũng phức tạp hơn nhiều qua prompt.

Để khai thác hết toàn bộ Veo 3, chúng ta cần dùng Flow với nhiều công cụ điều khiển được góc máy, nội dung hơn, đặc biệt là video đầu ra 1080 và có thể kéo dài thời gian ra nhiều hơn.


Đây là công cụ do Google phát triển và đang được cho dùng ở chế độ labs - thử nghiệm. Công cụ này hiện tại chỉ triển khai cho người dùng Mỹ đăng ký gói Pro hoặc Ultra, tương ứng với các mức tín dụng khác nhau. Đây có thể nói là trình tạo video bằng Veo mạnh nhất, nhiều công cụ nhất, cho phép điều chỉnh cả những cú máy, đường dây video theo story board chi tiết như phim luôn. Một số người dùng đã tạo hẳn phim ngắn trên này.


Đây là giao diện chính của Flow. Mọi người có thể bấm vào Flow TV ở phía trên để vào giao diện xem các video mẫu.


Trong Flow TV, chúng ta sẽ có thể coi được rất nhiều những ý tưởng tạo video, kèm theo prompt tạo ra video đó để chúng ta tham khảo.


Ngoài ra còn coi được rất nhiều phong cách video khác nhau để có thể hình thành ý tưởng dễ dàng hơn. Ở tab phim ngắn còn hẳn những video do người dùng tạo và được feature lên.


Rồi giờ bắt tay vào tạo video, chúng ta bấm nút tạo một dự án mới. Ở tab nhập prompt bên dưới, bạn sẽ thấy 3 chế độ mà Flow hỗ trợ tạo video lần lượt là:
  • Tạo video từ văn bản - text to video: cái này là đơn giản nhất, chúng ta nhập prompt vào và hệ thống sẽ tạo ra video cho chúng ta.
  • Tạo video từ các khung hình và văn bản: tùy chọn này không chỉ cho chúng ta nhập prompt dạng text vào mà cả cho upload frame hình đầu và cuối của video để định hướng video tốt hơn.
  • Tạo video từ các thành phần: cái này sẽ cho phép chúng ta tạo tải storyboard lên tùy ý, cho phép điều khiển tuần tự các góc máy, nội dung ở từng cảnh quay,… Với cái này thì làm phim ngắn theo đúng ý đồ dược luôn.


Ở góc bên phải sẽ có biểu tượng Setting, trong đó cho phép chúng ta tùy chỉnh chất lượng và số lượng của video đầu ra, mình sẽ chọn cao nhất do Veo 3 tạo ra.

Đầu tiên mình thử tạo bằng text, nhập prompt như bên dưới vào và đợi chút, video sẽ tạo ra bên dưới.

SPECS: Handheld camera, 35mm lens, neon night lighting, urban realism, NO CAPTIONS OR TEXT.
SCENE DESCRIPTION:
At a street vendor selling grilled squid in Đà Nẵng night market. A young man in white shirt and glasses interviews a confident woman in leather pants and a crop hoodie while she's chewing.
DIALOGUE:
Interviewer (translate to Vietnamese and say):
“If I buy you all this grilled squid stall, will you go out with me?”
Girl (munching, translate to Vietnamese and say): “I only go out with squid, squid is more loyal.”


Vậy là đã có kết quả là một video dài 8 giây, với đầy đủ thoại như thế này.


Bây giờ chỉ cần di chuột vào góc trên bên phải, tải về với tùy chọn 720, 1080 hoặc nhờ nó tạo ảnh GIF rồi tải về.


Giờ muốn tạo cảnh quay khác, dạng phim ngắn, chúng ta có thể bấm vào nút trên bên trái "Thêm vào cảnh"


Một giao diện sẽ hiện ra như thế này. Bây giờ chúng ta tiếp tục prompt để tạo video cho cảnh tiếp theo, từ đó tạo ra độ dài không giới hạn luôn.

Thêm một vài thí dụ khác:




Mình thử upload một ảnh lên thì hiện tại Flow chưa cho xài Veo 3 tạo video từ hình. Thay vào đó, nó trả về tạo bằng Veo 2 và chất lượng chưa ngon lắm. Bên dưới là bài thí dụ.



Nguồn:tinhte.vn/thread/huong-dan-tao-video-bang-ai-google-veo-phan-biet-cac-tai-khoan-prompt-tao-video-cac-luu-y.4021770/
💬 bình luận

Bình luận

Trở thành viên của itcctv — Đăng ký
Thủ thuật tin học văn phòng Thủ thuật Word Thủ thuật Excel
Cuộn