صحيفة المثقف

الذكاء الاصطناعي من DeepMind

د. جواد بشارة

نشر بتاريخ: 24 كانون1/ديسمبر 2020

جواد بشارة يحل أحد أكبر تحديات علم الأحياء على اليمين

إعداد وترجمة د\ز جواد بشارة

تركيب الإنزيم المحول للأنجيوتنسين 2 (ACE2). قامت شركة DeepMind البريطانية المتخصصة في الذكاء الاصطناعي - المملوكة لشركة Google منذ عام 2014 - بتطوير نسخة جديدة من الذكاء الاصطناعي تسمى AlphaFold، قادرة على التنبؤ ببنية البروتينات بدقة كبيرة! وهو إنجاز يمكن أن يساعد بشكل ملحوظ في فهم الأمراض بشكل أفضل وتطوير عقاقير جديدة. لماذا توقع بنية البروتينات؟ يمكن اعتبار البروتين على أنه شريط من الأحماض الأمينية، والذي ينحني وينثني ليشكل تشابكًا معقدًا. تحدد هذه البنية المعينة دور البروتين. ومع ذلك، فإن فهم عمل البروتينات أمر ضروري لفهم آليات الحياة. ضع في اعتبارك مثالًا ملموسًا: حاليًا، يركز البحث في لقاحات COVID-19 على ذروة بروتين الفيروس التاجي. تعتمد كيفية ارتباط الأخير بالخلايا البشرية وتكاثرها على شكل هذا البروتين وشكل بروتينات المستقبل على سطح الخلية. هذا هو السبب في أهمية تحديد هياكلها. يحتوي جسم الإنسان على عشرات الآلاف من البروتينات المختلفة ولا نعرف حتى الآن هيكل كل منهم. مستوى من الدقة على المستوى الذري خلال التقييم النقدي لتنبؤ بنية البروتين (CASP) 2020، كشف AlphaFold عن قدراته الرائعة. بدأت هذه المسابقة في عام 1994، وتقام كل عامين وتهدف إلى تحفيز تطوير أدوات أكثر كفاءة لرسم خرائط البروتينات. يقوم المنظمون بإصدار حوالي مائة تسلسل من الأحماض الأمينية المقابلة للبروتينات التي تم تحديد شكلها مسبقًا في المختبر (ولكن لم يتم الإعلان عنها). بعد ذلك، تتنافس فرق من الباحثين من جميع أنحاء العالم، كل منهم عبر برنامج خاص به، للعثور على الشكل الدقيق لهذه المركبات (أو على الأقل، لتكون أقرب ما يمكن). في إصدار 2020 هذا، تنبأ AlphaFold ببنية عشرات البروتينات بهامش خطأ 1.6 أنجستروم فقط، أو 0.16 نانومتر، وهو بُعد بالمقياس الذري. وبالتالي يتجاوز هذا الذكاء الاصطناعي IA جميع طرق الحساب الأخرى. في غضون أيام قليلة فقط، يمكنه تحديد شكل البروتين بدقة مكافئة للتقنيات التجريبية الأخرى لرسم خرائط للبروتينات (الفحص المجهري الإلكتروني، والرنين المغناطيسي النووي، وعلم البلورات بالأشعة السينية، وما إلى ذلك)، وهي طرق أبطأ بكثير وأكثر تكلفة. وبالتالي يمكن أن يساعد هذا الذكاء الاصطناعي العلماء على تصميم الأدوية وفهم الأمراض بشكل أفضل. على المدى الطويل، يمكن أن يساعد في تطوير البروتينات الاصطناعية، مثل الإنزيمات القادرة على هضم النفايات أو إنتاج الوقود الحيوي. باختصار، يعد AlphaFold خطوة كبيرة إلى الأمام للعديد من مجالات البحث. "اختراق جوهري"، "شيء ضخم"، "إنجاز مذهل"، هذه هي ردود الفعل على هذا الذكاء الاصطناعي داخل المجتمع العلمي. لماذا يصعب تحديد بنية البروتين؟

2106 الذكاء الاصطناعي

في الواقع، من السهل نسبيًا العثور على تسلسل الأحماض الأمينية التي يتكون منها بروتين معين ؛ ولكن الأمر الأكثر تعقيدًا هو تحديد الشكل الدقيق للشريط الذي يشكلونه. ولسبب وجيه: يوجد عدد فلكي من الأشكال الممكنة لكل تسلسل! يتصارع العلماء مع هذه المشكلة منذ عام 1972، عندما فاز عالم الكيمياء الحيوية الأمريكي كريستيان بوهمر أنفينسن (مع باحثين آخرين) بجائزة نوبل في الكيمياء لإثبات أن تسلسل الأحماض الأمينية للبروتين يحدد هيكلها. عندما يتجاوز التنبؤ التجريبي في عام 2018، حيث قدمت DeepMind نسختها الأولى من AlphaFold ؛ كانت هذه أول مشاركة للشركة في CASP. بالفعل في ذلك الوقت، أظهرت الخوارزمية وعدًا خاصًا. لم تكن دقيقة، لكنها تجاوزت منافستها بالفعل. منذ ذلك الحين، استوحى الكثير من الذكاء الاصطناعي من هذا الذكاء الاصطناعي المتطور: استخدم أكثر من نصف المرشحين في عام 2020 نظام التعلم العميق. لذلك، كانت الدقة الإجمالية التي لوحظت في إصدار 2020 أعلى من ذلك بكثير. كيف يتم تقييم طرق الحساب المختلفة؟ يتم تسجيل النتائج التي تم الحصول عليها من قبل الفرق المختلفة باستخدام اختبار المسافة العالمي، والذي يشير، على مقياس من 0 إلى 100، قرب الهيكل المتوقع من الشكل الفعلي للبروتين. هذا العام، حدد AlphaFold ببراعة شكل جميع البروتينات المعروضة، وسجل أكثر من 90 لحوالي ثلثيهم! ومع ذلك، فإن هذه الدرجة العالية تعني أن الاختلافات التي لوحظت بين التنبؤ والهيكل الفعلي يمكن أن تكون بسبب أخطاء تجريبية حدثت في المختبر بدلاً من خطأ في البرنامج. قد يعني أيضًا أن الهيكل المتوقع هو بديل صالح لتلك الهايكل المحددة في المختبر. محمد القريشي، عالم أحياء الأنظمة في جامعة كولومبيا، والذي شارك أيضًا في CASP، منبهر حقًا: "هذا شيء لم أكن أتوقعه، ليس بهذه السرعة. إنه أمر مروع بطريقة ما ". يعتقد المتخصص أن هناك حاجة إلى ما يقرب من عشر سنوات من البحث للانتقال من نتائج AlphaFold لعام 2018 إلى النتائج غير العادية التي تم تحقيقها هذا العام. ويضيف: "هذا قريب من الحد المادي للدقة التي يمكنك الحصول عليها". لاحظ أن الخوارزمية التي طورها فريق القريشي، وهي نظام يسمى الشبكة الهندسية المتكررة، أسرع بكثير من AlphaFold: يمكنها تقديم نتيجة في ثوانٍ، بينما يستغرق المنافس أيامًا. لكن اتضح أنها أقل دقة. لكن مصممه يشير إلى أنه بالنسبة لبعض التطبيقات، قد تكون السرعة أكثر أهمية. سيتم تحديد ما يقرب من 15000 بنية بروتينية بشرية اعتمد DeepMind لتطوير هذا الإصدار الجديد من AlphaFold بناءً على عمل مئات الباحثين حول العالم وعلى شبكة كبيرة من الخبراء. لم يتم الإفراج عن تفاصيل كيفية عملها. يعتمد النظام على شبكة الانتباه، وهي تقنية تعليمية عميقة تسمح للذكاء الاصطناعي بالتدريب من خلال التركيز على الأجزاء المختلفة لمشكلة أكبر. وهكذا قارن عدة متواليات، لا سيما من خلال البحث عن أزواج من الأحماض الأمينية التي توجد غالبًا بالقرب من بعضها البعض في الهياكل المطوية. تسمح له هذه البيانات بعد ذلك بالتنبؤ بالمسافة بين أزواج الأحماض الأمينية في هياكل غير معروفة وتقييم دقة تنبؤاته. تم تدريب البرنامج على ما يقرب من 170000 بروتين، جميعها من قاعدة البيانات المرجعية. استمر التدريب بضعة أسابيع وتطلب قوة حوسبة تعادل 100-200 وحدة معالجة رسومات. تم تطوير العديد من الأدوية بناءً على محاكاة ثلاثية الأبعاد لبنيتها الجزيئية: نحن نبحث عن طرق لإدخال هذه الجزيئات في البروتينات المستهدفة. لكن لا يمكن التفكير في هذه التقنية إلا إذا كانت بنية هذه البروتينات معروفة ... ومع ذلك، حتى الآن، لا يعرف العلماء سوى ربع حوالي 20000 بروتين بشري. وبالتالي، فإن العديد من أهداف الأدوية المحتملة غير مستغلة اليوم، ومن المفترض أن يتيح AlphaFold سد هذه الفجوة. تخطط DeepMind للتركيز على الأمراض المدارية (الملاريا ومرض النوم وما إلى ذلك) كأولوية، لأنها تنطوي على العديد من هياكل البروتين غير المعروفة. ينتظر المجتمع العلمي الآن بفارغ الصبر تفاصيل كيفية عمل هذه الخوارزمية، والتي سيتم نشرها هذا الأسبوع في مؤتمر CASP ثم في مجلة Proteins العام المقبل.