Grok Imagine V1.5 এখন ZOOOP-এ: xAI-এর image-to-video অবশেষে স্থির থাকে

Grok Imagine V1.5 এখন ZOOOP-এ: xAI-এর image-to-video অবশেষে স্থির থাকে

ঘোষণাপ্রকাশিত

Grok Imagine V1.5 এখন ZOOOP-এ সরাসরি ব্যবহার করা যায়। এটি xAI-এর image-to-video-এর সর্বশেষ সংস্করণ, আর 1.0-এর তুলনায় আসল লাভগুলো সহজ: ছবি একসঙ্গে টিকে থাকে, আর গতি আরও স্বাভাবিক দেখায়। প্রিভিউয়ে এটি এমনকি সর্বজনীন image-to-video লিডারবোর্ডে শীর্ষেও উঠেছিল। নিচে রইল কী নতুন আর কীভাবে শুরু করবেন।

Grok Imagine V1.5 আসলে কী করে

প্রথমে পরিধি। Grok Imagine V1.5 একটি নিবেদিত image-to-video মডেল: আপনি শুরুর বিন্দু হিসেবে একটি স্থির ছবি দেন, গতি বর্ণনা করে একটি বাক্য লেখেন, আর এটি সেই ফ্রেমটিকে একটি ছোট ক্লিপে প্রাণ দেয়। এটি স্থির ছবি বানায় না, text-to-video-ও করে না; এটি একটিই কাজ করে, "এই ছবিটিকে নড়াচড়া করানো"। ZOOOP-এ আপনি এটি পাবেন AI ভিডিও জেনারেশন-এ।

এটি মূল Grok Imagine-এর একই ধারা থেকে এসেছে, তাই ভিত্তিটা বয়ে চলে। V1.5 আসলে যা ঠিক করে, তা হলো সেই খসখসে কিনারাগুলো যা আগের সংস্করণে সবচেয়ে বেশি বিরক্ত করত।

সবচেয়ে বড় কথা: ছবি অবশেষে স্থির থাকে

মূল Grok Imagine সবচেয়ে বেশি সমালোচিত হয়েছিল স্থিরতার জন্য: মুখ সরে যেত, বিষয় ঘুরে বেড়াত, দৃশ্যের উপাদান ফ্রেম-থেকে-ফ্রেমে বদলে যেত। V1.5 ঠিক এটিই উন্নত করে: পুরো ক্লিপ জুড়ে বিষয়, মুখ ও দৃশ্য সঙ্গতিপূর্ণ থাকে, বিকৃত বা সরে না গিয়ে।

image-to-video-এর জন্য এটি নিছক সৌন্দর্যের চেয়ে বেশি গুরুত্বপূর্ণ। যে ক্লিপ গলে যায় তা অকেজো, প্রতিটি ফ্রেম যতই ধারালো হোক; যেটি শুরু থেকে শেষ পর্যন্ত সঙ্গতিপূর্ণ থাকে সেটিই আসলে কাজে লাগে। Grok Imagine V1.5 এখানে যে লাফ দেয়, তা খালি চোখেই দেখা যায়।

আরও ভালো গতি, আর একটি প্রথম স্থান

স্থিরতার বাইরে, গতির মানও আরও ভালো: একটি একক স্থির ছবি কতটা বিশ্বস্তভাবে একটি চলমান শটে এগিয়ে যায়, তা 1.0-এর চেয়ে আরও বিশ্বাসযোগ্যভাবে সামলানো হয়েছে, সেই "নকল" ভাবটা কমিয়ে।

সততার খাতিরে: Grok Imagine V1.5 তার প্রিভিউয়ের সময় সর্বজনীন Image-to-Video Arena-তে প্রথম স্থানে পৌঁছেছিল। লিডারবোর্ড কেবল একটি সংকেত, এর মানে এই নয় যে মডেলটি সব পরিস্থিতিতেই জেতে — তবে এটি বলে যে স্থির ছবিকে চলমান শটে রূপ দেওয়ার ক্ষেত্রে এই সংস্করণটি প্রথম সারিতে আছে।

শব্দ এখনও সঙ্গে আগে থেকেই থাকে

একটি কথা যোগ করি: অডিও V1.5-এ নতুন নয়। আগের প্রজন্ম থেকেই Grok Imagine ছবির সঙ্গে তৈরি হওয়া শব্দসহ ভিডিও দিয়ে আসছে — সংলাপ, পরিবেশ-শব্দ, প্রভাব, আর কথা বলা চরিত্রে ঠোঁট-মেলানো সমেত। নতুন সংস্করণ কেবল সেটি ধরে রাখে।

লাভটা এখনও বাস্তব। শব্দসহ একটি ছোট ক্লিপ বানানো আগে মানে ছিল তিন ধাপ: ছবি বানাও, আলাদা টুল দিয়ে কণ্ঠ যোগ করো, তারপর তার ওপর প্রভাব সামলাও। এখানে একটি প্রম্পটই আপনাকে এমন ক্লিপ দেয় যাতে আগে থেকেই শব্দ থাকে, যা সময় বাঁচায় আর বিভিন্ন টুলের আউটপুট মেলানোর ঝামেলাও।

এক নজরে স্পেক: কী পারে আর কী পারে না

কয়েকটি ব্যবহারিক সংখ্যা:

  • আউটপুট 720p বা 480p
  • ১ থেকে ১৫ সেকেন্ড, ডিফল্ট ৫ সেকেন্ড
  • শুধু image-to-video — আগে একটি শুরুর ছবি লাগবে

এর শক্তির জায়গা স্পষ্ট: পরিবেশ-শব্দসহ কোনো দৃশ্য বা পণ্যের শট প্রাণবন্ত করা, সোশ্যালের জন্য উল্লম্ব ক্লিপ বানানো, কিংবা কেবল ছন্দ যাচাইয়ের জন্য কোনো কনসেপ্ট ছবি নাড়িয়ে দেখা।

সীমাও বলা দরকার। Grok Imagine V1.5 সর্বোচ্চ 720p — এটি 1080p / 4K-এর ফিনিশিং মডেল নয়; এটি একটি একক শট নাড়ায়, একাধিক শটের মধ্যে কাট করে না; আর শূন্য থেকে কোনো ছবি গড়ে না। নাড়ানোর মতো ফ্রেম এখনও না থাকলে, আগে AI ইমেজ জেনারেশন দিয়ে একটি বানিয়ে সেটি দিন। উচ্চতর রেজোলিউশন বা মাল্টি-শট এডিটের জন্য Kling V3, Seedance V2.0, Veo 3.1… এর মতো ভারী ভিডিও মডেলই বেশি উপযুক্ত লক্ষ্য।

নির্মাতাদের জন্য এর অর্থ কী

হিসাব কষলেই বোঝা যায়। শব্দসহ একটি ছোট ক্লিপ বানানো মানে ছিল ফুটেজ তৈরি, ডাবিং আর প্রভাব যোগের মধ্যে লাফালাফি — আরও খারাপ, একটিমাত্র বিকৃত ফ্রেম গোটা টেক নষ্ট করে দিতে পারত। Grok Imagine V1.5 সেই শৃঙ্খল ছোট করে আর স্থিরতা মজবুত করে, যা শব্দসহ অনেক ছোট ক্লিপ বের করেন এমন কারও জন্য সত্যিকারের সময় বাঁচায়।

এটি সব-কাজের মডেল নয়। এর শক্তি হলো "এই ছবিটিকে নাড়াও — স্থিরভাবে, আর শব্দসহ": কথা বলা মুখ, পণ্যের গতি, সোশ্যাল ক্লিপ, দ্রুত প্রিভিউ। যখন উচ্চ-রেজোলিউশন ফাইনাল বা জটিল এডিটিং দরকার, শটটি অন্য মডেলের হাতে তুলে দিন। এই কাজ-বণ্টনই অংশত সেই কারণ, যার জন্য Grok Imagine V1.5 তার নিজের লেনে এত কাজের।

ZOOOP-এ কীভাবে শুরু করবেন

ZOOOP-এ AI ভিডিও জেনারেশনে Grok Imagine V1.5 বেছে নিন, একটি শুরুর ছবি আপলোড করুন (সেটিই প্রথম ফ্রেম হয়), গতি বর্ণনা করে একটি প্রম্পট লিখুন, রেজোলিউশন ও দৈর্ঘ্য সেট করুন, এবং জেনারেট করুন।

ZOOOP-এ সব মডেল একই ক্রেডিট ভাগ করে, আর ক্রেডিট কখনও মেয়াদ-উত্তীর্ণ হয় না — তাই ভুল বাছাইয়ে অপচয়ের ভয় ছাড়াই আপনি মডেলের মধ্যে আসা-যাওয়া করতে পারেন। আগে প্যারামিটার ও উদাহরণ দেখতে চাইলে, Grok Imagine V1.5 মডেল পেজ দেখুন।

শেয়ার করুন