جوجل تطلق Gemini Embedding 2: ثورة في فهم النصوص والصور والفيديو معاً

جوجل تطلق Gemini Embedding 2: ثورة في فهم النصوص والصور والفيديو معاً

أعلنت جوجل رسميًا عن إطلاق نموذجها الجديد Gemini Embedding 2، وهو أول نموذج تضمين متعدد الوسائط بالكامل قادر على تحليل النصوص والصور والصوت والفيديو ضمن نظام موحد لفهم البيانات.


النموذج الجديد يهدف إلى ربط كافة أنواع المحتوى ضمن مساحة تضمين واحدة، مما يمكّن الذكاء الاصطناعي من فهم المفاهيم بغض النظر عما إذا كانت مقدمة ككلمات، صوت، صور، أو فيديوهات. وتؤكد جوجل أن هذه التقنية ستسهل على نماذج اللغة الكبيرة (LLMs) فهم المعلومات بشكل أكثر تكاملاً وتنفيذ مهام أعقد مقارنة بالأنظمة السابقة.


يمثل Gemini Embedding 2 الجيل التالي من نماذج التضمين، وهو خليفة للنموذج السابق الذي كان يركز على النصوص فقط. هذا التحديث يجعله قادرًا على فهم المعاني والسياق الدلالي عبر أكثر من 100 لغة مختلفة. النموذج متاح حاليًا للمعاينة العامة عبر واجهة برمجة تطبيقات Gemini API ومنصة Vertex AI السحابية.


تقليديًا، كانت نماذج الذكاء الاصطناعي تتعامل مع البيانات عبر أنظمة منفصلة؛ نظام للنصوص، وآخر للصور، وثالث للصوتيات والفيديو. هذا الفصل يجعل فهم السياق صعبًا، حيث يتم التعامل مع كلمة "قطة" في نص بشكل مختلف عن ظهورها في صورة أو فيديو. يكسر Gemini Embedding 2 هذه العزلة بتقديم بنية موحدة تعالج جميع أنواع البيانات في نظام واحد.


هذا النظام الموحد يسمح للنموذج بتحليل مستند يجمع بين النصوص والصور في آن واحد، محاكيًا بذلك طريقة فهم البشر للمعلومات المتعددة المصادر. ومن التطبيقات المتوقعة للنموذج تحسين تقنيات (RAG) للحصول على إجابات أدق، وتعزيز البحث الدلالي، وتنظيم البيانات المعقدة.


من الناحية التقنية، يدعم Gemini Embedding 2 نافذة سياق نصية تصل إلى 8192 رمز إدخال، ويمكنه تحليل ما يصل إلى ست صور (PNG, JPEG) أو مقاطع فيديو تصل مدتها إلى 120 ثانية (MP4, MOV) في الطلب الواحد. بالإضافة إلى ذلك، يتميز بقدرته على معالجة الملفات الصوتية مباشرة دون الحاجة لتحويلها إلى نص، كما يدعم تضمين ملفات PDF تصل إلى ست صفحات.

جوجل تطلق Gemini Embedding 2: ثورة في فهم النصوص والصور والفيديو معاً الخبر السابق

جوجل تطلق Gemini Embedding 2: ثورة في فهم النصوص والصور والفيديو معاً

الذكاء الاصطناعي يُشعل سباق التسلح السيبراني في الشرق الأوسط: هجمات فائقة التعقيد تضع الأمن تحت الضغط الخبر التالي

الذكاء الاصطناعي يُشعل سباق التسلح السيبراني في الشرق الأوسط: هجمات فائقة التعقيد تضع الأمن تحت الضغط