تاريخ النشر: 22 أيار (مايو) 2025
يغيّر الذكاء الاصطناعي طريقة مطوّري الويب في إنشاء المواقع الإلكترونية وتطبيقات الويب. في مؤتمر Google I/O لعام 2025، شاركنا ما عملنا عليه على مدار العام الماضي، وشرحنا كيف يستخدم شركاؤنا الذكاء الاصطناعي على الويب، وأعلنّا عن واجهات برمجة تطبيقات جديدة مدمجة للذكاء الاصطناعي.
هل فاتك الحدث؟ يسرّنا إعلامك بأنّه يمكنك الآن مشاهدة المحادثات عند الطلب.
ميزات ذكاء اصطناعي عملية ومضمّنة باستخدام Gemini Nano في Chrome
مهمتنا الأساسية هي تحسين Chrome والويب لجميع المطوّرين وجميع المستخدمين. في هذه المحادثة، يشارك "توماس شتاينر" آخر المعلومات حول الذكاء الاصطناعي المضمّن وحالات الاستخدام العملية ويلقي نظرة على المستقبل.
تعمل تكنولوجيات الذكاء الاصطناعي المدمجة على تشغيل النماذج من جهة العميل في المتصفّح، ما يحقّق العديد من المزايا:
- الوضع الخاص: تظل بيانات المستخدمين الحسّاسة على الجهاز، ولا يلزم مغادرة المتصفّح مطلقًا.
- بلا إنترنت: يمكن للتطبيقات الوصول إلى إمكانات الذكاء الاصطناعي، حتى بدون اتصال بالإنترنت.
- الأداء: تحقّق واجهات برمجة التطبيقات هذه أداءً ممتازًا بفضل ميزة "تسريع الأجهزة".
اطّلِع على عيّنات الرموز البرمجية لكلّ من واجهات برمجة تطبيقات الذكاء الاصطناعي المضمّنة، واطّلِع على آخر المعلومات المتعلّقة بحالتها، وتعرَّف على الشركات التي تطبّق هذه التكنولوجيا.
واجهات برمجة التطبيقات للوسائط المتعددة
نحن نعمل على واجهات برمجة تطبيقات جديدة تمامًا متعددة الوسائط. وهذا يعني أنّه يمكنك أن تسأل Gemini Nano عن ما "يرى"ه في المحتوى المرئي أو ما "يسمعه" في المحتوى الصوتي. على سبيل المثال، يمكنك الحصول على اقتراحات لنص بديل للصور المحمَّلة على منصة مدونة، ويمكن للمستخدمين تحسينها وتعديلها. يمكنك أيضًا أن تطلب من Gemini Nano كتابة أوصاف أو نصوص مسجّلة لبرامج البودكاست.
الذكاء الاصطناعي المختلط
يواجه المطوّرون تحديًا واحدًا في الذكاء الاصطناعي من جهة العميل، وهو أنّ بعض المنصات و المتصفّحات لا تستوفي متطلبات الأجهزة لتشغيل نموذج على الجهاز. عقدت Gemini و Firebase شراكة لبناء حزمة تطوير البرامج (SDK) لمنصّة Firebase على الويب لكي تتمكّن من الرجوع إلى Gemini Nano على خادم في حال عدم توفّر عمليات التنفيذ من جهة العميل.
العمل معك
يسرّنا أنّنا تعاونّا مع العديد من المطوّرين على واجهات برمجة تطبيقات الذكاء الاصطناعي المضمّنة. لا يمكننا بذل جهودنا بدونك.
- برنامج معاينة الإصدارات المبكرة: انضم أكثر من 16,000 مطوّر إلى EPP، واختبروا واجهات برمجة تطبيقات جديدة وتعرّفوا على حالات استخدام جديدة وقدّموا ملاحظاتهم لإنشاء تكنولوجيات الذكاء الاصطناعي الأفضل على الويب.
- الأحداث البرمجية المكثّفة: استضفنا حدثَي برمجة مكثّفَين، وأنشأت بعض المواقع الإلكترونية والإضافات الرائعة.
لم ينتهِ عملك بعد. يُرجى مواصلة مشاركة ملاحظاتك واختبار واجهات برمجة التطبيقات المضمّنة الجديدة، وسنواصل إجراء التحسينات. يمكنك أيضًا المساعدة في توحيد واجهات برمجة التطبيقات هذه من خلال الانضمام إلى مجموعة منتدى تعلُّم الآلة على الويب في W3C.
مستقبل إضافات Chrome باستخدام Gemini في المتصفّح
تضاعف عدد الإضافات المستندة إلى الذكاء الاصطناعي في العامَين الماضيَين. في الواقع، تستخدِم نسبة% 10 من جميع الإضافات المثبَّتة من "سوق Chrome الإلكتروني" الذكاء الاصطناعي. في هذه المحادثة، يقدّم "سيباستيان بينز" أمثلة عملية على سبب فعّالية تركيبة "إضافات Chrome" وGemini.
تشمل الأمثلة كيفية جعل المتصفّح أكثر فائدة من خلال استخراج البيانات من المواقع الإلكترونية ومعالجتها على العميل باستخدام واجهة برمجة التطبيقات التي تم إطلاقها مؤخرًا في Chrome.
توضيح إمكانات الوظائف الجديدة المتعدّدة الوسائط لواجهة برمجة التطبيقات لطلبات Chrome في إضافات Chrome لتسهيل وصول المستخدمين إلى الصوت والصور
للاطّلاع على مستقبل التصفّح من خلال شرح كيفية استخدام Project Mariner من Google DeepMind لإضافات Chrome وأحدث واجهات برمجة تطبيقات Gemini Cloud لإنشاء وكيل متصفّح كامل
استكشِف إمكانات استخدام Gemini في السحابة الإلكترونية أو في المتصفّح في إضافات Chrome لإنشاء تجارب تصفّح جديدة وجعل المتصفّح أكثر فائدة.
حالات استخدام الذكاء الاصطناعي على الويب واستراتيجياته في العالم الحقيقي
سلطت كلّ من "يوريكو هيروتا" و"سويتا جوبالاكريشنان" الضوء على أمثلة واقعية لشركات تستخدم الذكاء الاصطناعي على الويب لتحسين تجربة المستخدمين ونشاطها التجاري.وسواء كان الحلّ يستخدم نماذج من جهة العميل أو من جهة الخادم أو حلًّا مختلطًا، فإنّ المهم هو الوظائف والميزات الجديدة والمشوّقة التي تتيحها لمستخدميك الآن.
أضافت منصة BILIBILI ميزة جديدة إلى بثّات الفيديوهات لزيادة تفاعل المستخدمين معها، وهي التعليقات على الشاشة. وتعرض هذه الميزة تعليقات المستخدمين في الوقت الفعلي في الفيديو، ويتم عرضها خلف المتحدّث. ولإجراء ذلك، يستخدمون ميزة "تقسيم الصور"، وهو مفهوم معروف جيدًا في مجال تعلُّم الآلة. نتيجةً لذلك، زادت مدّة الجلسة بنسبة 30%. خفّضت منصة Tokopedia من الصعوبات التي تواجه البائعين في عملية إثبات هويتهم باستخدام نموذج لرصد الوجوه، وذلك لتقييم جودة الصور التي يتم تحميلها. نتيجةً لذلك، تمّ خفض الموافقات اليدوية بنسبة %70 تقريبًا.
Vision Nanny هي منصة ويب للأطفال المصابين بضعف البصر الدماغي (CVI)، وهي تهدف إلى تنمية البصر من خلال أنشطة مستندة إلى الذكاء الاصطناعي. وتستخدم هذه الميزة مكتبات MediaPipe متعددة، بما في ذلك نموذج رصد معالم اليد الذي يحدِّد مواضع النقاط الرئيسية لليدين في صورة أو فيديو أو في الوقت الفعلي. أثبتت تجربة تجريبية أجريت على 50 طفلاً أنّ ميزة "الحاضنة المرئية" قدّمت استجابات أسرع بخمس مرات من الأنشطة اليدوية التي تهدف إلى تحفيز البصر. أفاد المعالجون بتوفير ثلاث ساعات في المتوسط لكل جلسة من خلال إزالة الإعداد اليدوي.
تتضمّن خدمة Google Meet العديد من الميزات المستندة إلى الذكاء الاصطناعي، بدءًا من تحسين الإضاءة وحتى تقليل التمويه في الفيديوهات. يكمن التحدي الأكبر في أنّ هذه الميزات يجب أن تعمل في الوقت الفعلي. وهنا يأتي دور WebAssembly (Wasm) للاستفادة من إمكانات وحدة المعالجة المركزية (CPU) بالكامل في جهاز الكمبيوتر وتفعيل معالجة الفيديو في الوقت الفعلي.
في ما يلي بعض الأمثلة الواقعية على الذكاء الاصطناعي على الويب. جرّبت عدة شركات أخرى واجهات برمجة التطبيقات المضمّنة للذكاء الاصطناعي، وشاركت بعض الشركات عملها في دراسات الحالة.
وكلاء الذكاء الاصطناعي على الويب من جهة العميل لإنشاء تجارب مستقبلية أكثر ذكاءً للمستخدمين
شرح جايسون ماييز مستقبل الإنترنت: برامج الوكيل الذكية على الويب. تمتلك الويب مستقبلًا فعّالاً، حيث توفّر إمكانات الذكاء الاصطناعي مباشرةً في المتصفّح لتنفيذ مهام مفيدة نيابةً عنك، باستثناء إمكانات النماذج اللغوية الكبيرة (LLM).
من خلال نهج الجهة العميلة، يتم تحسين الخصوصية وتقليل وقت الاستجابة وتحقيق وفورات كبيرة محتملة في التكلفة. يسمح لك موظّفو الدعم بترقية موقعك الإلكتروني الحالي لتنفيذ المهام بشكل مستقل للمستخدم، واختيار الأدوات المعروضة واستخدامها بشكل ديناميكي، وربما بشكل متكرّر، ما يسمح لموظّف الدعم بإكمال المهام التي قد تكون معقّدة أو متعددة الخطوات.
يمكن لموظّفي الدعم إجراء ما يلي:
- التخطيط للمهام الفرعية وتقسيمها، ومعالجة المشاكل الأكثر تعقيدًا من خلال التخطيط المتعدد الخطوات لتقسيم المهمة إلى خطوات منطقية لإكمالها
- اختَر أفضل الأدوات، سواء كانت دوالّ أو استخدام واجهة برمجة التطبيقات أو الوصول إلى قاعدة بيانات المعرفة الأساسية لنموذج اللغة المحسّن، ثم نفِّذ الإجراءات في العالم الخارجي.
- الاحتفاظ بالذاكرة المستندة إلى السياق، استنادًا إلى النتائج السابقة التي قدّمها موظّف الدّعم أو الأدوات الخارجية تعمل الذاكرة قصيرة المدى مثل مخزن مؤقت للأولوية القصوى لسجلّ السياق حتى حجم نافذة السياق في النموذج، في مقابل الذاكرة طويلة المدى التي يمكن فيها استخدام قاعدة بيانات متجهات لتخزين المعلومات التي يمكن استرجاعها حسب الحاجة من جلسات المحادثات السابقة أو مصادر البيانات الأخرى بالكامل.
تم تصميم وكلاء الذكاء الاصطناعي على الويب للدمج في تقنيات الويب الحالية في JavaScript. في النهاية، من المهم أن نواصل تسريع معالجة الأجهزة لتشغيل النماذج على النحو الأمثل في المتصفّح. في المستقبل، ستبدأ تكنولوجيات مثل WebNN في لعب دور رئيسي في تحسين تنفيذ النماذج على CPUs وGPUs وNPUs. ومع الاتجاه نحو استخدام نماذج لغوية كبيرة أصغر حجمًا وتطويرها باستمرار، ستتعزّز هذه الميزة في المستقبل.
ننصحك باستخدام نهج مختلط يجمع بين المعالجة على الجهاز وطلبات استراتيجية للسحابة الإلكترونية، حتى تتمكّن من إنشاء تجربتَي مستخدمين ذكية وسريعة الاستجابة ومخصّصة في المتصفّح الآن. من المفترض أن تحقّق قريبًا عائدًا من استثمارك في نهج الذكاء الاصطناعي على الويب، وذلك عندما تصبح الأجهزة أكثر قدرة على تشغيل النماذج اللغوية الكبيرة.
الاطّلاع على آخر الأخبار من مؤتمر Google I/O لعام 2025
لقد طرحنا جميع محاضرات مؤتمر Google I/O 2025، مع قائمة تشغيل مخصّصة لمطوّري الويب. يمكنك مشاهدة المزيد من المحتوى على io.google/2025.