الرأي - رصد

عادة ما يعتمد الذكاء الاصطناعي على البيانات، أما اليوم -وفي أغلب الحالات- تحتاج هذه البيانات إلى أن يتم تصنيفها البمن قبل شر.

وقال الكاتب جيرمي خان في تقريره -الذي نشره موقع "فورتيون" الأميركي- إن هذا الأمر يعد صحيحا، خاصة عند استخدام الرؤية الحاسوبية لتحديد الأورام في التصوير التشخيصي الطبي، أو القدرة على التمييز بين ما إذا كان الجسم الذي تلمحه أثناء قيادة السيارة مجرد كيس بلاستيكي أو امرأة تدفع عربة طفلها، كما ينطبق الأمر نفسه على برنامج التعرف على الكلام.

الذكاء الاصطناعي يحتاج بيانات صحيحة

أفاد الكاتب بأن تصنيف البيانات للتعلم الآلي ساهم في إيجاد صناعة جديدة كليا، حيث تعتبر الشركات التي تعمل على تصنيف بيانات الأعمال التجارية من بين أهم الأعمال الاستثمارية لرؤوس الأموال المجازفة الذين يسعون للاستفادة من قيمة الذكاء الاصطناعي.

وذكر الكاتب أن شركة "لايبل بوكس" -وهي شركة ناشئة في سان فرانسيسكو تدير منصة برمجية لمساعدة الشركات على إدارة مهام تصنيف البيانات الخاصة بها- أعلنت أنها تلقت 25 مليون دولار كتمويل إضافي لرأس المال الاستثماري.

وفي الواقع، تتأتى هذه الأموال من شركة "آندرسن هورويتز" الاستثمارية الشهيرة التي انضم شريكها الإداري بيتر ليفين إلى مجلس إدارة شركة "لايبل بوكس" التي تعد بدورها صندوق رأس المال الاستثماري التابع لشركة غوغل.

وأشار الكاتب إلى أن شركة "لايبل بوكس" تتنافس مع عدد من شركات تصنيف البيانات الأخرى، مثل "سكيل للذكاء الاصطناعي"، وهي منصة أخرى لتصنيف البيانات في سان فرانسيسكو جمعت 122 مليون دولار منذ تأسيسها قبل ثلاث سنوات.

من جهته، قال المؤسس والرئيس التنفيذي لشركة "سكيل للذكاء الاصطناعي" ألكساندر وانغ (23 عاما) -الذي عمل مع عدد من شركات السيارات ذاتية القيادة- إن "السر" الكامن وراء الذكاء الاصطناعي يتطلب كمية كبيرة من البيانات عالية الجودة على أرض الواقع، لكي تحصل على برنامج يعمل بشكل جيد"، مضيفا أن الذكاء الاصطناعي يقيم حسب حيادية البيانات وجودتها وشموليتها والجدل الذي تثيره.

معلومات دقيقة تحتاج وظائف خاصة

وأشار الكاتب إلى أن توفير التصنيفات قد يكون عملا يتطلب مهارات محدودة نسبيا يؤديها الآلاف من المتعاقدين في مراكز الاستعانة بمصادر خارجية معهودة، مثل الهند أو رومانيا أو الفلبين.

في المقابل، يمكن أن يتطلب هذا العمل مهارات عالية من خلال الوظيفة التي يؤديها اختصاصي الأشعة (لتحديد الخطوط الدقيقة للورم باستعمال التصوير التشخيصي الطبي) أو المحامين (لتحديد شرط غير منافس في العقد).

وفضلا عن ذلك، غالبا ما تحتاج الشركات إلى وضع تصنيفات عامة وأكثر خبرة، وتوظيف مجموعة من شركات الاستعانة بمصادر خارجية وأصحاب الأعمال الحرة والخبراء الداخليين لتثبيتها.

ونقل الكاتب عن وانغ أنه مع العملية المعقدة لسير العمل تعتبر حوكمة البيانات -التي تشير إلى كيفية تعقب الشركات للبيانات التي تستخدمها وهوية مستخدميها وأغراض استخدامها- أمرا في غاية الأهمية.

وأضاف وانغ أن الشركات التي تحاول نشر التعلم الآلي غالبا ما تعمل بشكل بطيء، لأنها لا تملك أنظمة قائمة لإدارة تصنيف البيانات بكفاءة.

"سكيل" و"لابل بوكس" وتعليم الذكاء الاصطناعي

توفر كل من شركتي "سكيل للذكاء الاصطناعي" و"لابل بوكس" أدوات لمساعدة فرق التعلم الآلي وعلم البيانات في الشركات على تحليل البيانات بمجرد تصنيفها، مما يتيح لها تحديد نقاط الضعف والتحيزات.

فعلى سبيل المثال، هل يكون تمثيل الرجال تمثيلا زائدا في بيانات الأشعة السينية تحيزا؟ أو هل تستخدم الشركة عددا قليلا من القطط التي تركض في الطريق لتدريب خوارزمية القيادة الذاتية للدوس على المكابح لاكتشاف النقطة العمياء؟

ويرى مانو شارما المؤسس المشارك المدير التنفيذي لشركة "لابل بوكس" أن "كل شركة ذكاء اصطناعي تحتاج إلى أدوات لتحرير وإدارة التصنيفات ومراجعتها".

وأضاف الكاتب أن مايكل فيليب نائب رئيس التكنولوجيا في شركة "ليتكس" -وهي شركة يقع مقرها في سان دييغو تبيع الأنظمة التي تسمح لشركات النقل بتقييم وتتبع سلوك السائقين من خلال استخدام الكاميرات وبيانات المستشعر- أن الأمر يستغرق حوالي 10 آلاف ساعة من مقاطع الفيديو المصنفة التي تمتد على 20 ثانية لتدريب النموذج الأولي لنظام الذكاء الاصطناعي للكشف عن مصادر تشتيت انتباه السائق.

في المقابل، أشار فيليب إلى أن وضع هذا النظام في الإنتاج الفعلي يتطلب من أربعة إلى خمسة ملايين ساعة من مقاطع الفيديو.

من جهته، قال جون إسحاق كلارك -وهو الرئيس التنفيذي لشركة "أرتورو. آي أي" المتفرعة من شركة "أميركان فاميلي إنشورنس" المختصة في برامج التعلم الآلي لتحليل الصور -بما في ذلك التصوير بالأقمار الصناعية والتصوير الجوي- إن "مجموعات البيانات الضخمة المصنفة بشكل جيد تكتسي أهمية بالغة لتدريب برامج الذكاء الاصطناعي على تحديد الحالات غير العادية أو النادرة بشكل صحيح.