ميتا تفصل "Horizon Worlds" عن نظارات "Quest": تحول استراتيجي نحو الهواتف والذكاء الاصطناعي
ثورة الذكاء الاصطناعي التوليدي: وداعاً للكاميرات ومرحباً بمقاطع الفيديو بالوصف النصي
يشهد عالم التكنولوجيا تحولاً جذرياً بفضل الذكاء الاصطناعي التوليدي (Generative AI)، الذي تجاوز حدود النصوص والصور ليقتحم مجال توليد مقاطع فيديو معقدة وواقعية اعتماداً فقط على وصف نصي بسيط. هذه القفزة النوعية تعد بفتح آفاق جديدة للمبدعين والشركات لخفض تكاليف الإنتاج البصري وتسريع وتيرته بشكل غير مسبوق، مقدمة جودة بصرية مذهلة تتحدى القيود التقليدية للتصوير.
تعتمد النماذج الحديثة لإنشاء الفيديو، كما ذكر تقرير متخصص عبر موقع The Verge، على شبكات عصبية ضخمة تم تدريبها على ملايين الساعات من المحتوى المرئي. هذا التدريب مكّنها من استيعاب فيزياء الحركة، ديناميكيات الإضاءة، وتفاعل العناصر في المشاهد، مما يسمح للأنظمة بتوليد مشاهد غير موجودة في الواقع بدقة فائقة، وهو ما يمثل نقلة نوعية في محاكاة الإبداع البشري الحاسوبي.
من الناحية التقنية، تعتمد هذه الأدوات على ما يعرف بنماذج الانتشار (Diffusion Models). تبدأ العملية بتكوين إطار عشوائي مليء بـ "الضوضاء البصرية" (Visual Noise)، ثم يقوم النظام بتنقية هذه الضوضاء خطوة بخطوة وتحويلها إلى صورة واضحة ومطابقة للوصف النصي المُدخل (Text Prompt). تتكرر هذه العملية بسرعة فائقة لإنتاج سلسلة متتابعة من الإطارات التي تشكل الفيديو النهائي.
أبرز مزايا هذه التقنية هي كفاءتها في توفير الوقت والجهد؛ فبدلاً من الحاجة إلى طواقم تصوير كاملة ومواقع فعلية، يمكن الآن توليد إعلانات تجارية أو مشاهد سينمائية في دقائق. كما توفر مرونة هائلة في التعديل، حيث يمكن تغيير تفاصيل مثل زاوية الكاميرا أو حالة الطقس في المشهد عبر تعديل بضع كلمات فقط في الوصف النصي.
للراغبين في خوض هذه التجربة، تتلخص الخطوات الأساسية في اختيار منصة موثوقة لتوليد الفيديو، كتابة وصف نصي دقيق ومفصل يشمل كل تفاصيل المشهد المطلوب، تحديد الإعدادات الخاصة مثل نسبة العرض والدقة، ثم الضغط على زر "التوليد" والانتظار حتى يتم معالجة الطلب. بعد المراجعة، يمكن للمستخدم تحسين الوصف وإعادة التوليد حتى الوصول إلى النتيجة المرجوة.