نظام ذكاء اصطناعي يترجم إشارات الدماغ
لقد اعتاد العالم قوة وتطور المساعدين الافتراضيين الذين صنعتهم شركات مثل أمازون وغوغل، التي يمكنها فك شفرة خطابنا المنطوق بدقة غريبة مقارنة بما كانت التكنولوجيا قادرة عليه قبل بضع سنوات قصيرة فقط.
مع ذلك، في الحقيقة، قد تكون العلامة الفارقة الأكثر إثارة للإعجاب لم تظهر بعد؛ ما يجعل التعرف إلى الكلام يبدو وكأنه لعب أطفال تقريباً: أنظمة الذكاء الاصطناعي «AI» التي يمكن أن تترجم نشاط دماغنا إلى نص كامل التكوين، دون سماع نطق كلمة واحدة.
نظام جديد
ابتكر مهندسو أعصاب من جامعة كولومبيا الأمريكية نظاماً يترجم الأفكار إلى كلام مفهوم؛ تراقب التقنية نشاط الدماغ البشري لتعيد صياغة الكلمات التي يسمعها الشخص بوضوح غير متوقع، قد يقود هذا التطور الذي يعزز موقف الأجهزة المنتجة للكلام والذكاء الاصطناعي إلى ابتكار طرائق جديدة تساعد الحواسيب في الاتصال مباشرةً مع الدماغ، ويضع الابتكار أيضاً حجر الأساس لغير القادرين على الكلام ممن يعانون من التصلب الجانبي الضموري أو الذين يتعافون من السكتة الدماغية لمساعدتهم على استعادة القدرة على الكلام مجدداً والتفاعل مع البيئة المحيطة، وقد نشر المهندسون نتائجهم في دورية ساينتفك ريبروتس، بحسب موقع مرصد المستقبل الإماراتي.
وقال الدكتور نيما ميسغاراني كاتب الورقة الرئيس والباحث الأساسي لدى معهد مورتيمر بي. زوكرمان لسلوكيات الدماغ: «تساعدنا أصواتنا في الاتصال مع عائلتنا وأصدقائنا والعالم المحيط بنا، وهذا يفسر الإحباط الشديد الذي يُصاب به فاقدو القدرة على الكلام بسبب مرض ما أو إصابة»، وأضاف: «قد تساعد دراستنا في استعادة هذه القدرة؛ إذ أثبتنا أن استخدام التقنية الصحيحة يساعد في ترجمة الأفكار إلى كلام مفهوم».
وكشفت عقود من البحث أن الدماغ يظهر أنماطاً نشطةً عند تحدث البشر أو تفكيرهم بالكلام. تندمج أنماط إشارات مميزة وقابلة للتعرف حينما نستمع إلى الحديث أو نفكر به، ويستشرق الخبراء الذين يسعون إلى تسجيل هذه الأنماط وترجمتها مستقبلاً ألا تبقى فيه الأفكار محبوسةً داخل الدماغ، بل تُترجم إلى حديث مفهوم عند الحاجة.
تحديات لترجمة نشاط الدماغ
وكان تطوير هذه التقنية حافلاً بالتحديات؛ إذ ركزت الجهود الأولية لترجمة إشارات الدماغ للدكتور ميسغاراني وفريقه على نماذج حاسوبية بسيطة حللت التخطيط الطيفي، وهو تمثيلات بصرية لترددات الصوت، لكن فشل هذه المقاربة في إنتاج حديث مفهوم دفع الفريق إلى الاستعانة بفوكودر، وهو خوارزمية حاسوبية تنتج الكلام بعد تدريبها على تسجيلات لبشر يتحدثون.
قال د. ميسغاراني، وهو أيضاً أستاذ مساعد في الهندسة الكهربائية لدى كلية الهندسة والعلوم التطبيقية في جامعة كولومبيا: «هذه التقنية ذاتها التي تستخدم في إيكو لأمازون وسيري لآبل، والتي تجيب صوتياً عن أسئلتنا».
تعاون ميسغاراني مع الدكتور أشيش دينيش ميهتا الجراح العصبي من معهد نورثويل الصحي للعلوم العصبية والكاتب المساعد في الدراسة لتعليم فوكودر ترجمة نشاط الدماغ، يعالج د. ميهتا مرضى الصرع الذين يحتاجون إلى تدخلات جراحية.
وأضاف: «بالتعاون مع د. ميهتا، طلبنا من مرضى الصرع الذين خضعوا للجراحة الاستماع إلى جمل مسجلة لأشخاص مختلفين وقسنا في هذه الأثناء أنماط النشاط الدماغي». وأضاف: «دربت هذه الأنماط فوكودر»، ثم طلب الباحثون من المرضى أنفسهم الاستماع إلى أشخاص يلفظون الأعداد بين 0 و9 مع تسجيل إشارات دماغهم لتشغيلها باستخدام فوكودر، حلل الباحثون الصوت الصادر عن فوكودر استجابةً لهذه الإشارات باستخدام الشبكات العصبية، وهي نوع من الذكاء الاصطناعي يحاكي بنية الخلايا العصبية في الدماغ الحيوي، كانت النتيجة صوتاً روبوتياً يرتل تتابع أرقام، وطلب د. ميسغاراني من المرضى سماع التسجيل وكتابة ما سمعوه للتأكد من دقة التسجيل.
وأكد د. ميسغاراني: «وجدنا أن 75% من المرضى استطاعوا فهم التسجيلات وإعادتها، وهي نسبة أعلى من نسب المحاولات السابقة»، وكان تحسن جودة الصوت ملحوظاً عند مقارنته بالتسجيلات القديمة المعتمدة على التخطيط البصري. وأضاف د. ميسغاراني: «قدم فوكودر الحساس والشبكات العصبية القوية الأصوات التي سمعها المرضى تقديماً دقيقاً مذهلاً».
ويخطط د. ميسغاراني وفريقه لاختبار كلمات أكثر تعقيداً وجمل، ويعتزمون إجراء الاختبارات ذاتها لإشارات الدماغ الصادرة عن تكلم الشخص أو تفكيره بالكلام. ويأملون أن يصبح نظامهم جزءاً من زرعة شبيهة بتلك التي يمتلكها بعض مرضى الصرع؛ ليترجم أفكار المتحدث مباشرةً إلى كلمات مسموعة، وقال د. ميسغاراني: «إذا فكر صاحب الزرعة بحاجته إلى كوب ماء، فسيستقبل نظامنا الإشارات المتولدة من هذه الفكرة ويحولها إلى كلام مركب مسموع»، وأضاف: «قد يقلب هذا النظام الموازين؛ فقد يمنح فاقدي القدرة على الكلام فرصةً جديدةً لإعادة الاتصال مع العالم المحيط».