Grok Imagine V1.5 يصل إلى ZOOOP: تحويل الصورة إلى فيديو من xAI يثبت أخيرًا

أصبح Grok Imagine V1.5 متاحًا للاستخدام مباشرة على ZOOOP. إنه أحدث إصدار من تحويل الصورة إلى فيديو من xAI، ومقارنةً بالإصدار 1.0 فإن المكاسب الحقيقية بسيطة: الصورة تتماسك، والحركة تبدو أكثر طبيعية. وفي المعاينة تصدّر حتى لوحة الصدارة العامة لتحويل الصورة إلى فيديو. إليك ما الجديد وكيف تبدأ.

ماذا يفعل Grok Imagine V1.5 فعليًا

أولًا النطاق. Grok Imagine V1.5 نموذج مخصص لتحويل الصورة إلى فيديو: تعطيه صورة ثابتة كنقطة بداية، وتكتب جملة تصف الحركة، فيحوّل ذلك الإطار إلى مقطع قصير. لا يولّد صورًا ثابتة ولا يقوم بتحويل النص إلى فيديو؛ يفعل شيئًا واحدًا، «تحريك هذه الصورة». تجده داخل توليد الفيديو بالذكاء الاصطناعي على ZOOOP.

يأتي من السلالة نفسها للإصدار الأصلي Grok Imagine، لذا تبقى الأسس قائمة. ما يصلحه V1.5 فعلًا هو الحواف الخشنة التي أزعجت أكثر ما أزعجت في الإصدار السابق.

الأهم: الصورة تثبت أخيرًا

كان أكثر ما يُنتقد به Grok Imagine الأصلي هو الثبات: الوجوه تنزاح، والعناصر تتجول، ومكونات المشهد تتغير من إطار إلى آخر. وهذا تحديدًا ما يحسّنه V1.5: عبر المقطع كله يبقى الموضوع والوجه والمشهد متسقين، دون تشوّه أو انزلاق.

في تحويل الصورة إلى فيديو، هذا أهم من مجرد الجمال. المقطع الذي يتشوّه غير صالح مهما كانت حدة كل إطار؛ أما الذي يبقى متماسكًا من البداية إلى النهاية فيمكن استخدامه فعلًا. القفزة التي يحققها Grok Imagine V1.5 هنا تُرى بالعين المجردة.

حركة أفضل، ومركز أول

إلى جانب الثبات، تحسّنت أيضًا جودة الحركة: كيف تمتد صورة ثابتة واحدة بأمانة إلى لقطة متحركة جرت معالجته بإقناع أكبر من 1.0، مع تقليل ذلك المظهر «المصطنع».

وللإنصاف: بلغ Grok Imagine V1.5 المركز الأول في Image-to-Video Arena العامة خلال معاينته. لوحة الصدارة مجرد إشارة، ولا تعني أن النموذج يفوز في كل سيناريو، لكنها تدل على أن هذا الإصدار في الصف الأول حين يتعلق الأمر بتحويل صورة ثابتة إلى لقطة متحركة.

الصوت ما زال مدمجًا

ملاحظة: الصوت ليس جديدًا في V1.5. منذ الجيل السابق، يقدّم Grok Imagine فيديو بصوت يُولَّد مع الصورة — حوار وأصوات محيطة ومؤثرات، مع مزامنة الشفاه للشخصيات المتحدثة. والإصدار الجديد يبقي عليه فحسب.

تبقى الفائدة حقيقية. كان صنع مقطع قصير بصوت يتطلب سابقًا ثلاث مراحل: توليد الصورة، ثم إضافة صوت بأداة منفصلة، ثم معالجة المؤثرات فوقها. هنا يمنحك أمر واحد مقطعًا يحمل صوته أصلًا، ما يوفّر الوقت وعناء مواءمة مخرجات أدوات مختلفة.

المواصفات بلمحة: ما يفعله وما لا يفعله

بعض الأرقام العملية:

إخراج بدقة 720p أو 480p
من 1 إلى 15 ثانية، و5 ثوانٍ افتراضيًا
تحويل الصورة إلى فيديو فقط — تحتاج أولًا إلى صورة بداية

نقطة قوته واضحة: تحريك منظر طبيعي أو لقطة منتج مع صوت محيط، أو صنع مقاطع عمودية لوسائل التواصل، أو بثّ الحياة في صورة مفهوم لمجرد التحقق من الإيقاع.

تستحق الحدود الذكر أيضًا. يتوقف Grok Imagine V1.5 عند 720p — وليس نموذج إنهاء بدقة 1080p / 4K؛ يحرّك لقطة واحدة لا قطعات متعددة اللقطات؛ ولا يخلق صورة من العدم. إن لم تكن لديك بعد صورة لتحريكها، أنشئ واحدة عبر توليد الصور بالذكاء الاصطناعي ثم مرّرها إليه. وللدقة الأعلى أو المونتاج متعدد اللقطات، فإن نماذج فيديو أثقل مثل Kling V3 وSeedance V2.0 وVeo 3.1… هي الخيار الأنسب.

ماذا يعني هذا للمبدعين

احسبها تتضح الصورة. كان صنع مقطع قصير بصوت يفرض التنقل بين توليد اللقطات والدبلجة وإضافة المؤثرات — والأسوأ أن إطارًا واحدًا مشوّهًا قد يفسد اللقطة كلها. يختصر Grok Imagine V1.5 هذه السلسلة ويعزّز الثبات، أي وقت حقيقي مُوفَّر لمن ينتج كثيرًا من المقاطع القصيرة بصوت.

ليس نموذجًا يفعل كل شيء. نقطة قوته هي «تحريك هذه الصورة — بثبات ومع صوت»: الوجوه المتحدثة، وحركة المنتجات، ومقاطع التواصل، والمعاينات السريعة. وحين تحتاج إلى نهائي عالي الدقة أو مونتاج معقد، سلّم اللقطة إلى نموذج آخر. هذا التقسيم في العمل جزء من سبب كون Grok Imagine V1.5 عمليًا جدًا في مساره.

كيف تبدأ على ZOOOP

في توليد الفيديو بالذكاء الاصطناعي على ZOOOP، اختر Grok Imagine V1.5، وارفع صورة بداية (تصبح الإطار الأول)، واكتب موجّهًا يصف الحركة، واضبط الدقة والمدة، ثم ولّد.

على ZOOOP تتشارك كل النماذج الأرصدة نفسها، والأرصدة لا تنتهي صلاحيتها أبدًا — فبإمكانك التنقل بين النماذج دون خوف من اختيار مهدور. ولاستكشاف المعطيات والأمثلة أولًا، اطّلع على صفحة نموذج Grok Imagine V1.5.