Please reload

التدوينات الحديثة

الجوانب التي يجب التركيز عليها في التعلم الآلي أو الذكاء الاصطناعي في عام 2018

للكاتب: فيجاي سرينيفاس 

تتناول هذه المقالة الاتجاهات الحديثة في علم البيانات أو تعلم الآلة أو الذكاء الاصطناعي وتقترح مجموعات

  مجالات فرعية بحاجة إلى التركيز عليها.

 

 

العملية الانتاجية لتعلم الآلة

 

سيكون التركيز الأكبر والأهم في عام 2018 على هذا المجال. أثبتت معظم الشركات المفاهيم المرتبطة بتعلم الآلة وتتطلع إلى تحقيق القيمة الكاملة لبياناتها مع تطبيقات الإنتاج الكاملة للخوارزميات. ويمكن أن تكون التقنيات الرئيسية في هذا المجال مرتبطة بـنظام  Clipper. فهو نظام يتميز بأحدث التطورات المتعلقة بتعلم الآلة من رايز لابز ، بجامعة بيركلي. ويَستخدم مفاهيم الحوسبة الموزعة لمقياس النماذج وتستخدم نشر نموذج المعبأ في حاويات لتتعامل مع النماذج المنشأة في أي منصة، وكذلك تنفيذ التخزين المؤقت من خلال إطار البنية المتوازية مثل وحدات معالجة الرسوميات. وأخيراً، يمكن لنظام Clipper أيضاً تنفيذ تركيبة نموذج الإطار المتقاطع باستخدام تقنيات تعلم الآلة مثل آله القمار.

 

وهناك تقنية مثيرة للاهتمام متعلقة باختيار النموذج، والتي يشار إليها بتعلم الآلة التلقائي، المشابهة لمنصة Michelangelo من شركة أوبر .Uber و برزت العديد من المصادر المفتوحة كـ TPot و AutoSKLearn التي تساعد في البحث التلقائي عن مساحة متعددة للنماذج ذات معاملات غير اعتيادية وتختار النموذج الأفضل للمهمة المطلوبة. تعرّف إدارة النماذج بأنها القدرة على متابعة مئات النماذج في الإنتاج بما فيها سُلاسة النماذج\التحليلات –  الأشياء كالمقاييس التي تم تقييمها لكل نموذج على ما حددت البيانات وما وصلت إليه، وخاصةً الدورة الكاملة لتطوير النموذج وإعادة التدريب والتحديث… إلخ. ويعد نموذج دي بي (ModleDB) هو الخيار الوحيد الممكن في هذا المجال.

 

والعمل الآخر المشوق في هذا المجال صُدر من شركة ماب-أر MapR- وهو عمل يدور حول لوجستيات تعلم الآلة، ويعتبر مبدأه الأساسي هو بنية رونديفو “Rendezvous “. وتتضمن العناصر الأساسية لبنية “رونديفو“ جدول يستند على الخدمات الدقيقة والحاويات بالإضافة إلى أسلوب تصميم DataOps داتا-أوبس والذي يسهل نموذجيّ الكناريز Canaries والديكويز .Decoys حيث أن ديكويز يعتبر نموذج لا ينفذ أي عملية على البيانات المدخلة — ويُستخدم لمواصلة نسخة من تيارات المدخلات. أما الكناري Canary  فهو نموذج يوفر مرجع أو خط أساس يمكن مقارنتة بالنماذج الأخرى. وتسمح بنية رونديفو “Rendezvous “ بأن تكون النماذج مراقبة إلى حد كبير وتسمح أيضاً بقياس نموذج الانحراف مما يسمح بتبني النماذج الأحدث ببطء وسلاسة.

 

التعلم العميق موجود وسيتمر

 

كشفت بعض الابحاث الحديثة عن القيود المفروضة على التعلم العميق بما في ذلك مقالة غاري ماركوس المعروفة والتي توجد في موقع KDNuggets حيث يناقش غاري بأن قيود التعلم العميق ظهرت أساساً من البيانات المحدودة الخاضعة للتدريب، وفي حين أنها قد تحتاج إلى بيانات غير محدودة من أجل التعميم المثالي. وتوضح مقالة KDNuggets كيف يمكن لشبكات التعلم العميق المدربة للتصنيف الانخداع بسهولة من خلال الاضطرابات في الصور المدخلة وأيضا من خلال الصور العشوائية (التي بلا معنى) مما ينتج عنها خطأ في التصنيفات بثقة عالية.

 

ومع ذلك، فقد أثبت فريق قوقل ديب مايند (Google Deep Mind) الذي استخدم التعلم العميق بجانب التعلم المعزز لنظام لعبة أتاري (Atari) أو نظام لعبة ألفاقو (AlphaGo)، فنظام لعبة (Go) يتكون من التعلم العميق بالإضافة إلى شجرة البحث مونتكارلو (MonteCarlo)، فالتعلم العميق مفيد جداً ويمكن دمجه ايضاً مع تقنيات تعلم الآلة الأخرى المعروفة للمساهمة في تحقيق النتائج الرائعة.

 

أحد المشاكل الشائعة في استخدام التعلم العميق مرتبطة بضبط الوسيط أو المعلم المفرط، وقد أظهرت الدراسة الأخيرة كيف يمكن لأسلوب التعلم المعزز أن يؤلف أشكالًا معينة من الشبكات المتكررة التي يمكنها التفوق على الأنظمة الحالية من خلال عامل مُهم.

 

وأشارت دراسة حديثة بأنه يمكن استخدام التعلم العميق للتنبؤ بالخصائص الميكانيكية الكمية للجزيئات الصغيرة— وأثبتت الدراسة بأن التعلم العميق (شكل معين من التعلم العميق عُرف كرسالة مرور للشبكات العصبية) يمكن تطبيقه على الرسم البياني للبيانات المنظمة وهو غير ثابت لتشابه الرسم البياني .

 

 

 

مصدر الصورة: unsplash

 

 

الفرق بين الإشارات الضمنية والصريحة

 

يكذب الأشخاص، وخصوصاَ في الاستبيانات. إذاً يبدو أن الطريقة التقليدية في فهم واستيعاب سلوك المستخدم باستخدام الاستبيان غير مجديه، حيث كان ذلك واضحاً على موقع نتفلكس Netflix عندما وجدوا أن المستخدمين قد قيموا الأفلام الكلاسيكية بتقييم عالي جداً في حين أنها لم تشاهد بالفعل. وهذا كان واضحاً أيضاً على عمليات البحث على قوقل وكان هو الموضوع في الكلمة الافتتاحية لمؤتمر ستراتا داتا (Strata Data). فأوضح الباحث العلمي لشركة قوقل في استبيان لخريجي ولاية ميريلاند بأن 2٪ فقط ذكروا بأن معدلهم التراكمي أقل من 2.5 بينما في الواقع 11٪ من الخريجين معدلهم التراكمي أقل من 2.5. وفي استبيان أخر ذكر 40٪ من المهندسين في مؤسسة ما بأنهم ضمن أفضل 5٪ من المهندسين في الشركة. عمليات البحث على قوقل هي المصل الرقمي الحقيقي، حيث يكون الأشخاص أكثر صدقاً من أي استبيانات أو منصات أخرى. وهذا بدوره يخبرنا أنه علينا البحث عن الاشارات الضمنية، (على سبيل المثال: ما يرونه الأشخاص في الواقع على موقع نتفلكس)، بدلاً عن الاعتماد على النتائج الظاهرة بشكل صريح خلال الاستبيانات لفهم سلوك الزبون. وهذا يوضح أيضاً بعض نظم المقترحة التي طورتها شركة بنترست (Pinterest) كما هو موثق في المحاضرة الافتتاحية. استخدموا الاشارات الضمنية في كيفية تفاعل المستخدمين مع الصور (حفظها، إعادة إرسال صور المستخدمين الأخرين، البحث عن صور وبالإضافة إلى الاقتراحات التي لا تعجب المستخدمين أو يتجاهلونها) ويمكنها بأن تقترح محتوى شخصي مناسب للمستخدمين معتمدةً على الرسم البياني الذي يعتمد على اقتراحات محرك البحث.

 

تفسير النموذج

 

تفسير النموذج أو شرحه يعني قدرة خوارزميات التعلم الآلي على شرح كيفية التنبؤ بطريقة معينة، ويمكن أن يكون ذلك بسبب الحالات التي شوهدت في بيانات التدريب على عمليات الاحتيال، فمن المحتمل أن يستنتج النظام بأن تلك تعد حالة من عمليات الاحتيال. أصبح تفسير النماذج مهماً كلما وضعت نماذج التعليم الآلي للإنتاج في العديد من المجالات مثل التمويل، والتأمين، والبيع بالتجزئة وحتى الرعاية الصحية. وتتضمن التقنيات الناشئة في هذا المجال سكيتير Skater ولايم Lime من بين الأخرين.

 

الذكاء الصناعي خلف التعلم العميق

 

ليبراتوس، هو نظام حديث للعب يتألف من توازن ناش (Nash equilibrium) ونظرية اللعبة لحل معلومات الألعاب غير الكاملة مثل لعبة البوكر. ومع التطبيقات في التسعير الديناميكي المتميز وتحسين ملف المنتج، تشمل المكونات الرئيسية الثلاثة لنظام ليبراتوس (Libratus):

 

1- مُختصر اللعبة— حيث يوضح الفكرة من اللعبة والتي تعد أصغر وأسهل للحل وهو يحسب أيضاً الاستراتيجيات النظرية للعبة.

2- تبني وحدة القياس الثانية خُلاصة بالغة الدقة من اللعبة الفرعية (وهي حالة اللعبة بعد عدة جولات) وتحلها باستخدام تقنية تسمى حل متداخل للألعاب الفرعية.

3- وحده القياس الثالثة هي المطور الذاتي، وينتج استراتيجية مخططة للعبة، يملئ اجزاء المخطط النظري ويحصي اسلوب العبة النظرية لتلك الفروع.

 

التعليم المعزز يعد أداة مهمة أخرى في حقيبة بيانات العالِم. والتي اتحدت الآن مع التعلم العميق لتطوير شبكات التعليم المعزز العميق مثل الذي تملكه شركة قوقل

 

الخصوصية هي عمر التعلم الآلي

 

خصوصية البيانات والقوانين الناشئة عن حماية البيانات بالإضافة الى نظام حماية البيانات العامة (GDPR) تعد مهمة في هذا الموضوع، فعلى سبيل المثال لدى نظام حماية البيانات العامة قوانين والتي تنص على أهمية موافقة المستخدم لجمع البيانات الشخصية. ويحق أيضاً للمستخدمين بالسؤال عن البيانات التي تجمع أو تعدل أو تحذف أو الاعتراض على استخدام البيانات الشخصية بغرض/نية الاستهداف إذا كانت لديهم الرغبة في ذلك. ولمعالجي البيانات التزامات/تعهدات معينة حسب قوانين نظام حماية البيانات العامة. وبدورها ستؤثر في تصميم جميع منتجات البيانات في عام 2018.

 

ليس من المهم حفظ أو تحصين انابيب البيانات والبنية التحتية ولكن من المهم أيضاً تحصين الامتداد الخاص بالعنوانين الإلكترونية، (BI) والتحليلات، وهنا تكون خصوصية الحفاظ على التحليلات مرتبطة وستزداد اهميتها في عام 2018. التكنولوجيا المتعلقة بتحصين وحفظ البي أي (BI) هو عمل حديث مشترك بين شركة أوبر (Uber) ورايز لابس (Rise Labs)، في جامعة بيركيلي. وتضمن الخصوصية التفاضلية لاستعلامات إس كيو إل (SQL لغة الاستعلامات البنيوية) والتي تعتمد على ما يسمى” بالحساسية المرنة “التي تجمع بين تقنية الحساسية المحلية مع الصلات العامة.

 

وهنا تتحقق خصوصية الحفاظ التحليلات وخصوصاً لنماذج التعلم العميق باستخدام تقنية تسمى التعلم المتحد والتي تستخدمها شركة Google. وتعتمد على خادم وسيط/معلم مركزي وهو بدوره يجمع جميع المعلمات المطلوبة للتعلم. باستطاعة كل جهاز تحميل وسيط، استخدم البيانات المحلية لتطور النموذج وقم بإنشاء رسالة تحديث قصيرة وأعد إرسالها إلى خادم الوسيط. سيجمع الخادم التحديثات من مختلف الجوالات ويقوم بتحديث وسائط النموذج مركزياً. الجزء المثير للدهشة في التعليم المتحد هو أن جميع البيانات محلية، بينما التعلم عالمي. كل جوال يحدث النموذج باستخدام بياناته المحلية وتنفيذ مكوناته محلياً— فصل التعلم الآلي عن تخزين البيانات على السحابة، يتم استخدام هذا في لوحة مفاتيح قوقل (Google Keyboard) على أنظمة الاندرويد (Andriod).

 

التدريب على النموذج الفردي السابق باستخدام التعلم المتحد يواجه تحديات مثل ارتفاع الاتصالات العامة، والمتطرفين والاستجابة للخطأ بالإضافة إلى التحديات الاحصائية للنموذج المناسب للبيانات. وقد تم تناول هذا الموضوع في عمل حديث، بجامعة سنترال متشجن CMU، باستخدام التعلم متعدد المهام المتحد والذي يتناول التحديات الإحصائية باستخدام نماذج متعددة وتحديثها في وقت واحد بينما يتم التعامل مع تحديات النظام من قِبل، (MOCHA) وهو نموذج التحسين الموزع.

المصدر

Share on Facebook
Share on Twitter
Please reload

تابعنا
ابحث بالتاق
Please reload

الارشيف
  • Black Instagram Icon
  • Black Twitter Icon

Riyadh, Saudi Arabia

  • Black Instagram Icon
  • Black Twitter Icon

الرياض، المملكة العربية السعودية