يثق رأس المال في القليل من الخوارزميات

by Ayesha Al Jaber
Confiance algorithmes

يثق. كم عدد الشخصيات الموجودة على غلاف الألبوم الشهير الرقيب. فرقة نادي Pepper’s Lonely Hearts البيتلز؟ يمكنك إعطاء تقدير بالعين المجردة ، على سبيل المثال ، بين 40 و 60. الآن ، تخيل أن خوارزمية رؤية الكمبيوتر تصدر حكمها وتعلن 70. من المحتمل أنك ستقع في حب الخبرة من البرنامج. أجرى ثلاثة باحثين في إدارة نظم المعلومات بجامعة جورجيا بالولايات المتحدة سلسلة من هذه التجارب لإثبات أن الأشخاص يميلون بالفعل إلى متابعة الاستجابة التي توفرها خوارزمية بدلاً من استجابة الأطراف الثالثة التي قد تسعى إلى مساعدتك. ظهر مقالهم في 13 أبريل 2021 في مجلة Scientific Reports طبيعة.

لا يتعب برنامج الكمبيوتر ، ولا يظهر أبدًا سوء نية ، وليس لديه تحيزات ويظل عقلانيًا في جميع الظروف. على أية حال ، بناءً على هذه الحجج ، بشكل أو بآخر ، فإن هذه الثقة قائمة. والأكثر من ذلك أنه عندما يتعلق الأمر بعملية تبدو محايدة مثل العد.

خوارزمية خيالية تم تدريبها على 5000 صورة

صمم الفريق ثلاث تجارب على أساس نفس المبدأ: مطالبة المشاركين المعينين من منصة Amazon Mechanical Turk بتقييم عدد الأشخاص الموجودين في عشر صور ، التمرين يتراوح من أبسط (15 شخصًا) إلى أصعب (5000 شخص) . يعطي المشاركون رقما. ثم قدم الباحثون تقديرين ، أحدهما من المفترض أن يكون من خوارزمية ، والآخر متوسط ​​التقديرات التي قدمها 5000 شخص آخر. وسأل الباحثون المشاركين عما إذا كانوا يلتزمون بردهم الأولي أو يعتمدون على أحد الاقتراحين.

يعرف المشاركون شيئًا واحدًا فقط عن الخوارزمية: تم تدريبها على أساس 5000 صورة. لكنهم لا يعرفون ما هي قاعدة البيانات هذه ، ومن هم المطورون ، ومدى كفاءة الخوارزمية. “لم نستخدم خوارزمية في الواقع لإنشاء الاقتراحات ، بل تظاهرنا أننا فعلنا ذلك ، نفس لتقديرات من المفترض أن تأتي من أشخاص آخرين “، يحدد لـ العلم والمستقبل إريك بوجيرت ، مدرس وباحث ومؤلف مشارك لهذا البحث.

في التجربة الأولى ، تم تقسيم مجموعة من 530 شخصًا إلى نصفين. استفاد أحدهما من تقييم الخوارزمية ، واستفاد الآخر من التقدير البشري. والنتيجة واضحة: في النصف الأول ، زادت بنسبة 11٪ عن النصف الثاني لتعديل تقديرهم. وعندما يصبح التمرين معقدًا ، مع زيادة عدد الأشخاص في الصور ، فإن أولئك الذين يثقون في الخوارزمية هم أكثر عرضة بنسبة 14.6٪ من أولئك الذين يعتمدون على الاقتراحات البشرية.

وتستهدف التجربة الثانية 514 مشاركًا آخر. هذه المرة ، يتلقى الجميع التقديرين ، الخوارزمية لـ 5 صور والبشر لـ 5 آخرين. “النتائج تعزز نتائج التجربة الأولى” ، اكتب الباحثين في مقالتهم. “هناك تأثير واضح لتقدير الخوارزمية ولكن هذا التأثير يرجع بالكامل إلى الاعتماد على الخوارزميات عندما يتعلق الأمر بالمشكلات التي يصعب حلها “.

وضع جودة المشورة الخوارزمية على المحك

“لهذين التجارب الأولى ، الاقتراحات المقدمة تتوافق دائمًا مع العدد الصحيح للأشخاص في الصورة ، محسوبًا بواسطة محرر قاعدة البيانات ، أكمل إريك بوجيرت. هذا التحيز سمح لنا بعدم الاعتماد على أداء الخوارزمية “.

من ناحية أخرى ، فإن متغير جودة الاقتراح هو الذي تم اختباره في التجربة الثالثة. قام الباحثون مرة أخرى بتقسيم المشاركين إلى مجموعتين ، أولئك الذين تلقوا استجابة تم إنشاؤها بواسطة الخوارزمية وأولئك الذين تلقوا استجابة من أشخاص آخرين. داخل كل مجموعة ، كان نصف الاقتراحات صحيحًا ، والنصف الآخر عبارة عن تقييمات مبالغ فيها بنسبة 100٪ (ضعف عدد الأشخاص الموجودين في الصورة بالفعل). بمعنى آخر: كان خطأ التقييم واضحًا تقريبًا.

ومع ذلك ، مرة أخرى ، تم تأكيد الثقة في الخوارزمية. مع مزيد من الفروق الدقيقة ، ومع ذلك. المشاركون الذين يختارون الوثوق بالخوارزمية يكونون أكثر عددًا عندما يعطي البرنامج الإجابة الصحيحة أكثر من عندما يعطي الإجابة الخطأ. الأكثر إثارة للاهتمام: الفجوة بين عدد أولئك الذين يثقون في الافتراضات الخاطئة وأولئك الذين يتابعون الإجابات الصحيحة تكون أكبر عندما يتعلق الأمر باقتراح الخوارزمية. “الأشخاص يعاقبون الخوارزميات لكونها نصيحة سيئة” ، يلخص الفريق.

بالنسبة للنظرية كما هي ، يشير هذا العمل إلى استخدام الخوارزميات في حالات حقيقية. “على سبيل المثال ، إذا كنت أخطط لشراء منزل ، فسأقارنه بما يخبرني به أصدقائي عن الأماكن التي يجب أن أعيش فيها ، بينما [un site d’immobilier]، الذي يستخدم خوارزمية ، سيخبرني أن هذا المنزل “بالنسبة لي”. وبالمثل ، توصي Spotify بموسيقى جديدة لاكتشافها ، وكذلك يفعل أصدقائي “، تفاصيل إيريك بوجيرت.

يُظهر هذا البحث ثقة مفرطة في هذه الأدوات ، وإيمانًا بفعاليتها عند تضمين مهمة معقدة ، على الرغم من أنها يمكن أن يكون لها تأثير على وجود بعض الأشخاص. كما أنه ليس من المؤكد أن الخوارزمية ستكون قادرة على التمييز بين وجود 71 حرفًا على الغلاف الوفير لـ الرقيب. فرقة نادي Pepper’s Lonely Hearts.

Related Articles

Leave a Comment