Grok Imagine V1.5 lên ZOOOP: image-to-video của xAI cuối cùng đã giữ được khung hình

Grok Imagine V1.5 lên ZOOOP: image-to-video của xAI cuối cùng đã giữ được khung hình

Thông báoXuất bản trên

Grok Imagine V1.5 giờ đã dùng được trực tiếp trên ZOOOP. Đây là phiên bản image-to-video mới nhất của xAI, và so với 1.0 thì những cải thiện thực chất khá đơn giản: hình ảnh giữ được tổng thể, và chuyển động trông tự nhiên hơn. Ở bản preview, nó thậm chí dẫn đầu bảng xếp hạng image-to-video công khai. Dưới đây là điểm mới và cách bắt đầu.

Grok Imagine V1.5 thực sự làm gì

Trước hết là phạm vi. Grok Imagine V1.5 là mô hình chuyên về image-to-video: bạn đưa cho nó một ảnh tĩnh làm điểm xuất phát, viết một câu mô tả chuyển động, và nó làm khung hình đó động thành một clip ngắn. Nó không tạo ảnh tĩnh và không làm text-to-video; nó làm đúng một việc, "làm cho ảnh này chuyển động". Bạn tìm thấy nó trong tạo video bằng AI trên ZOOOP.

Nó đến từ cùng một dòng với Grok Imagine gốc, nên nền tảng được giữ lại. Điều V1.5 thực sự khắc phục là những chỗ gồ ghề gây khó chịu nhất ở phiên bản trước.

Điểm lớn nhất: hình ảnh cuối cùng đã đứng vững

Grok Imagine gốc bị chê nhiều nhất về độ ổn định: khuôn mặt trôi, chủ thể đi lạc, các yếu tố cảnh đổi từ khung này sang khung khác. Đó chính xác là điều V1.5 cải thiện: suốt cả clip, chủ thể, khuôn mặt và cảnh giữ được nhất quán, không méo hay trượt.

Với image-to-video, điều này quan trọng hơn vẻ đẹp đơn thuần. Một clip cứ biến dạng thì vô dụng dù từng khung sắc nét đến đâu; còn clip giữ mạch lạc từ đầu đến cuối thì mới thực sự dùng được. Bước nhảy mà Grok Imagine V1.5 tạo ra ở đây thấy được bằng mắt thường.

Chuyển động tốt hơn, và một vị trí dẫn đầu

Ngoài độ ổn định, chất lượng chuyển động cũng tốt hơn: việc một ảnh tĩnh duy nhất tiếp nối trung thực thành một cú máy động được xử lý thuyết phục hơn 1.0, bớt đi cái vẻ "giả".

Nói cho công bằng: Grok Imagine V1.5 đã đạt vị trí số một trên Image-to-Video Arena công khai trong giai đoạn preview. Bảng xếp hạng chỉ là một tín hiệu, không có nghĩa mô hình thắng ở mọi tình huống — nhưng nó cho thấy phiên bản này nằm ở nhóm đầu trong việc biến một ảnh tĩnh thành cú máy động.

Âm thanh vẫn đi kèm sẵn

Một lưu ý: âm thanh không phải điểm mới của V1.5. Từ thế hệ trước, Grok Imagine đã xuất video với âm thanh tạo ra cùng hình ảnh — thoại, tiếng nền, hiệu ứng, kèm khớp khẩu hình cho nhân vật nói. Phiên bản mới chỉ đơn giản giữ lại.

Lợi ích vẫn rất thật. Trước đây, làm một clip ngắn có tiếng nghĩa là ba lượt: tạo hình ảnh, thêm giọng bằng công cụ riêng, rồi xử lý hiệu ứng đè lên. Ở đây một câu lệnh cho bạn một clip vốn đã có tiếng, tiết kiệm thời gian và đỡ phải khớp đầu ra của nhiều công cụ với nhau.

Thông số nhanh: làm được gì và không làm được gì

Vài con số thực dụng:

  • Xuất ở 720p hoặc 480p
  • 1 đến 15 giây, mặc định 5 giây
  • Chỉ image-to-video — bạn cần một ảnh khởi đầu trước

Thế mạnh thì rõ: làm động một cảnh hoặc một cú máy sản phẩm kèm tiếng nền, làm clip dọc cho mạng xã hội, hoặc thổi hồn vào một ảnh ý tưởng chỉ để kiểm tra nhịp.

Cũng nên nói rõ giới hạn. Grok Imagine V1.5 dừng ở 720p — không phải mô hình hoàn thiện 1080p / 4K; nó làm động một cú máy, không cắt chuyển nhiều cú máy; và không nặn ra hình ảnh từ con số không. Nếu chưa có khung để làm động, hãy tạo một cái bằng tạo ảnh bằng AI rồi đưa vào. Để có độ phân giải cao hơn hoặc dựng nhiều cú máy, các mô hình video nặng hơn như Kling V3, Seedance V2.0, Veo 3.1… là đích nhắm phù hợp hơn.

Điều này có ý nghĩa gì với người sáng tạo

Tính thử là thấy hợp lý. Làm một clip ngắn có tiếng buộc phải nhảy qua lại giữa tạo cảnh quay, lồng tiếng và thêm hiệu ứng — tệ hơn, chỉ một khung méo có thể làm hỏng cả take. Grok Imagine V1.5 rút ngắn chuỗi đó và củng cố độ ổn định, tức là thời gian thực sự tiết kiệm được cho người tung ra nhiều clip ngắn có tiếng.

Đây không phải mô hình làm được mọi thứ. Thế mạnh của nó là "làm cho ảnh này chuyển động — ổn định và có tiếng": đầu người nói, chuyển động sản phẩm, clip mạng xã hội, xem nhanh. Khi bạn cần bản hoàn thiện độ phân giải cao hoặc dựng phức tạp, hãy giao cú máy cho mô hình khác. Cách phân vai đó là một phần lý do khiến Grok Imagine V1.5 rất dễ dùng trong làn của nó.

Bắt đầu trên ZOOOP thế nào

Trong tạo video bằng AI trên ZOOOP, chọn Grok Imagine V1.5, tải lên một ảnh khởi đầu (nó trở thành khung đầu tiên), viết một câu lệnh mô tả chuyển động, đặt độ phân giải và thời lượng, rồi tạo.

Trên ZOOOP mọi mô hình dùng chung một loại tín dụng, và tín dụng không bao giờ hết hạn — nên bạn có thể nhảy qua lại giữa các mô hình mà không sợ chọn nhầm lãng phí. Muốn xem trước thông số và ví dụ, hãy ghé trang mô hình Grok Imagine V1.5.

Chia sẻ