أعلنت جوجل في مؤتمر Mobile World Congress (MWC) عن جاهزية ميزات Gemini AI طويلة الانتظار للطرح الرسمي، بعد عام تقريبًا من الإعلان الأوّلي. ويأتي Gemini Live كأبرز تحسين، حيث ستسمح قريبًا بعرض الفيديو المُباشر ومشاركة الشاشة، وهي ميزات سبق عرضها تحت اسم Project Astra.
حاليًا، يعالج الذكاء الاصطناعي مُتعدد الوسائط من جوجل النصوص والصور والمُستندات بكفاءة، لكن قدرته على تحليل الفيديو ما زالت غير مُستقرة. ففي بعض الأحيان يمكنه تلخيص فيديو على يوتيوب، بينما يفشل في بعض المًُحاولات دون أسباب واضحة.
مع التحديث المُقرّر في مارس لتطبيق Gemini على أندرويد، سيتغيّر هذا الوضع جذريًا، حيث سيتمكن المُستخدمون من تشغيل الكاميرا لبث فيديو مُباشر أو مُشاركة الشاشة، وطرح أسئلة على الذكاء الاصطناعي حول ما يراه.
ميزات Gemini Live الجديدة
مشاركة الشاشة “ScreenShare”
تتيح أداة مشاركة الشاشة “ScreenShare” للمستخدمين مُشاركة مُحتوى شاشة هواتفهم مع المساعد جيميناي لتحليله والرد على استفساراتهم بناءً عليه.
وضّحت الشركة آلية العمل عبر فيديو توضيحي يُظهر مُستخدمًا يُشارك صورة لبنطال ويطلب من Gemini اقتراح ملابس تتناسب معه.
تهدف الميزة إلى تبسيط المهام اليومية، مثل البحث عن معلومات مُحدّدة، عبر دمج الذكاء الاصطناعي في التفاعلات البصرية.
تحليل الفيديو المُباشر عبر Gemini Live
تسمح هذه الوظيفة الجديدة للمُساعد بتحليل المحتوى المرئي المُلتقط عبر كاميرا الهاتف في الوقت الفعلي. وفي مثالٍ عرضته جوجل، وجّه مستخدم الكاميرا نحو مزهرية وطلب من Gemini اقتراح ألوان تتناسب مع تصميمها، في خطوة تفتح الباب أمام استخدامات عملية في مجالات مثل الديكور أو التسوق.
خلال فعاليات Google I/O 2024، أثار عرض Project Astra إعجاب الحضور بتقديمه تفاعلات طبيعية مع الذكاء الاصطناعي. في الفيديو التوضيحي، أظهرت جوجل قدرة Gemini Live على الإجابة عن الأسئلة أثناء تحريك الهاتف في الغرفة، مثل تحليل الأكواد البرمجية على الشاشة، أو شرح طريقة عمل السماعات، وحتى تذكُّر مكان نظارات المُستخدم التي ظهرت في مشهد سابق.
رغم ذلك، لا يزال من المُبكر معرفة ما إذا كانت النسخة المُدمجة في التطبيق ستكون بنفس قوة النموذج التجريبي.
تؤكّد جوجل أن ترقية Gemini 2.0 ستحوله إلى “مساعد حقيقي” قادر على إجراء حوارات تفاعلية أثناء استكشاف الأماكن الجديدة، أو تقديم نصائح تسوق عبر مشاركة الشاشة. لكن تحقيق هذه الطموحات يتطلب موارد تقنية هائلة، إذ إن معالجة بث فيديو مستمر ستستهلك طاقة حوسبة أعلى بكثير من مُعالجة النصوص.
تكلفة استخدام ميزات Gemini Live
ستُطرح هذه المزايا قريبًا ضمن خطة Google One AI Premium، التي تشمل أيضًا:
الوصول إلى الإصدار المتقدم من مساعد Gemini Advanced.
سعة تخزين سحابي تصل إلى 2 تيرابايت.
تُعد هذه الخطوة جزءًا من استراتيجية جوجل لتوسيع قدرات مساعدها الذكي، وتعزيز تنافسيته في سوق الذكاء الاصطناعي عبر دمج تقنيات متعددة الوسائط تُحسّن تجربة المستخدمين في الحياة اليومية.