أعلنت شركة جوجل توسيع نطاق إتاحة نموذجها الجديد لإنتاج الفيديوهات عبر الذكاء الاصطناعي Veo 3، ليشمل المستخدمين في 71 دولة إضافية حول العالم، باستثناء دول الاتحاد الأوروبي التي لم تُدرج ضمن المرحلة الحالية من الإطلاق.
ويُمثّل هذا النموذج أحد أكثر ابتكارات جوجل انتشاراً في مجال المحتوى المرئي المولّد بالذكاء الاصطناعي.
وفقاً لما أعلنته الشركة، فإن مستخدمي باقة Gemini Pro المدفوعة بات بإمكانهم تجربة النموذج من خلال إنشاء ما يصل إلى 10 فيديوهات عبر واجهة الويب، وتُمنح هذه كفرصة تجريبية لمرة واحدة.
أما المشتركون في باقة Ultra، التي تُقدّر بـ250 دولاراً شهرياً، فيتمتعون بالحد الأقصى من عدد الفيديوهات التي يمكن إنشاؤها باستخدام Veo 3، بما في ذلك إمكانية إعادة التحديث اليومي لرصيد الفيديوهات.
كما يحصل هؤلاء المشتركون على 125 فيديو شهرياً في خدمة Flow، المصممة خصيصاً لصنّاع الأفلام والمحتوى الإبداعي، بينما يحصل مشتركو Pro في الخدمة نفسها على 10 فيديوهات شهرياً.
قيود على الاستخدام
ورغم التوسع، إلا أن استخدام نموذج Veo 3 ما يزال محصوراً في واجهة الويب الخاصة بـGemini Pro، مع دعم حالي للغة الإنجليزية فقط في المخرجات الصوتية، وإن كانت بعض اللغات الأخرى قد تظهر أحياناً بشكل غير رسمي.
كما أن خدمة Flow لا تدعم إخراج الصوت عندما يقوم المستخدم برفع صور من جهازه لاستخدامها ضمن الفيديو.
مزايا Veo 3
ويُعد Veo 3 ثاني تجربة تحقق انتشاراً واسعاً لجوجل في مجال المحتوى التوليدي بعد أداة NotebookLM Audio Overviews التي طُرحت العام الماضي.
ويشهد النموذج تفاعلاً واسعاً عبر منصات التواصل الاجتماعي، حيث ينشر المستخدمون فيديوهات تجريبية تبرز مدى الدقة في تنفيذ الأوامر النصية، بالإضافة إلى جودة الصوت والصورة المدمجين، ما رفع من سقف توقعات الجمهور بشأن معايير المحتوى المولّد بالذكاء الاصطناعي.
مخاطر محتملة
ورغم الإمكانيات التقنية المتقدمة، إلا أن Veo 3 يثير القلق من إمكانية استخدامه في إنتاج محتوى زائف يبدو حقيقياً، وظهر هذا جلياً في أحد الفيديوهات التي أنشأها مستخدمون لمحاكاة مقابلة تلفزيونية وهمية في برنامج خيالي عن السيارات، وهو سيناريو يمكن إسقاطه بسهولة على إنتاج مشاهد احتجاجات مزيفة أو محتويات مضللة أخرى.
هذا الواقع يؤكد المخاوف المتزايدة بشأن دور تقنيات الذكاء الاصطناعي التوليدي في نشر معلومات مضللة.
في الوقت الذي كانت فيه تقنيات التزييف العميق (Deepfake) تتطلب سابقاً ساعات من العمل ومهارات تقنية عالية لتغيير ملامح الوجه في فيديو واحد، أصبح بالإمكان اليوم توليد مشاهد واقعية كاملة بالصوت والصورة من خلال سطر نصي واحد فقط، وهو ما يجعل من الضروري التحلي بالوعي والتدقيق عند التعامل مع المحتوى المرئي من مصادر غير موثوقة.