شعار قسم ميدان

"نظام سيري".. من أقبية الاستخبارات الأمريكية إلى أجهزة آبل

midan - siri
لم يكن الكشف عن هواتف (آي فون 4 أس – iPhone 4S) في شهر أكتوبر/تشرين الأول من عام 2011 أمرًا عاديًا أبدًا. صحيح أن الهاتف جاء بنفس تصميم سلفه (آي فون فور – iPhone 4)، لكن حرف (S-إس) الموجود بعد الرقم 4 حمل معانٍ كثيرة، لا يُعرف حجم صحّتها حتى هذه اللحظة.

 

إطلاق الهاتف الجديد وقتها لم يكن عاديًا لأنها المرّة الأولى التي تكشف فيها آبل عن هاتف جديد دون أن يكون (ستيف جوبز – Steve Jobs) هو من يُزيح الستار عنه. ومن هنا يعتقد البعض أن وجود الحرف S بعد الرقم 4 يدل على ستيف الذي فارق الحياة بعدها بيوم واحد فقط. إضافة إلى ذلك، يعتقد البعض أن الحرف S يرمز إلى (السرعة – Speed)، وهي الدلالة التي استُخدمت في هواتف (آيفون 3 جي أس – iPhone 3GS). لكن بين هذا وذاك هناك دلالة أعمق للحرف، لأن أجهزة آيفون 4 أس  قدّمت للعالم ولأول مرّة مُساعد شخصي رقمي حمل اسم (سيري – Siri)، وهو مساعد قادر على إجراء حوار كامل مع المستخدم، وكأن نبوءة (جون سكولي – John Sculley) الرئيس التنفيذي لشركة آبل في ثمانينات القرن الماضي رأت النور.

 

سكولي وخلال إدارته لشركة آبل -بعد طرد جوبز منها- توجّه إلى (جورج لوكاس – George Lucas) مُخرج سلسلة (حرب النجوم – Star Wars) الشهيرة، طالبًا منه إخراج فيديو لفكرة جديدة تحمل اسم (مستكشف المعرفة – Knowledge Navigator). هذا المستشكف هو عبارة عن جهاز يُشبه حاسب iPad اللوحي يظهر على شاشته مساعد شخصي رقمي على هيئة إنسان يُخبر المستخدم عن المواعيد والالتزامات[1]. في تلك الحقبة الزمنية كان وجود مساعد رقمي شخصي ذكي أمر من الخيال، حاله حال الكثير من التقنيات التي نستخدمها يوميًا ولا نُدرك قيمتها في الوقت الراهن. وبالتالي ظلّت هذه الفكرة حبيسة الخيال على هيئة مقطع فيديو في شركة آبل كل تلك المدّة حتى ظهر "آي فون 4 أس" لأول مّرة عام 2011.

 

في الحقيقة، لم تساهم شركة آبل تقريبًا في تحويل حلم رئيسها التنفيذي -سكولي- إلى حقيقة، فهي أُعجبت بالمساعد الرقمي سيري عام 2010 وقامت بشراء الشركة التي قامت بتطويره لتقوم فيما بعد بتضمينه داخل نظام (آي أو أس – iOS) الذي تعمل به أجهزة الشركة الذكية، آي فون، وآي باد بالإضافة إلى (آيباد توتش – iPod Touch)، ومؤخرًا في نظام (ماك أو أس – macOS) المُشغّل لحواسب آبل، وأنظمة (ووتش أو أس – watchOS)، و (تي في أو أس-  tvOS) المُشغّلة لساعة آبل الذكية وجهاز (آبل تي في – Apple TV) على الترتيب.

 

كل شيء بدأ من وكالة مشاريع الأبحاث الأمريكية
انتقل سيري من كونه مُحاكاة لخيال أحد رؤساء شركة آبل، إلى مساعد رقمي في هواتف (آي فون - iPhone) بعدما مرّ على وكالة مشاريع الأبحاث الأمريكية.
انتقل سيري من كونه مُحاكاة لخيال أحد رؤساء شركة آبل، إلى مساعد رقمي في هواتف (آي فون – iPhone) بعدما مرّ على وكالة مشاريع الأبحاث الأمريكية.
 
في كل مرّة نتحمّس فيها لدراسة مادّة جديدة من مواد التقنية، أو نشرع فيها لتعلّم شيء تقني جديد، لابد لنا من قراءة تلك المُقدّمة التي تتحدث عن أهمية شبكة الإنترنت وتاريخها. وبكل تأكيد مُصطلح DARPA هو أكثر مُصطلح غير تقني يرد في تلك المقدمات التي تتحدث عن تاريخ الشبكة العنكبوتية.

 

ولأن (وكالة مشاريع الأبحاث الأمريكية -DARPA) لم تُطوّر شبكة الإنترنت بالصدفة، فهي أيضًا أشرفت على تطوير تقنيات كثيرة نستخدمها في مجالات مُختلفة في حياتنا اليومية، لكن ما يجهله الكثيرون أن سيري هي وليدة الوكالة نفسها التي طوّرت شبكة الإنترنت، إضافة إلى تقنيات كثيرة في مجال الاتصالات والشبكات.

 

في عام 2003 قررت الوكالة بدء العمل على مساعد رقمي شخصي يقوم بدراسة بعض الملفات ومن ثم أرشفتها وترتيب المعلومات الموجودة فيها لتسهيل الوصول إليها. تعاونت الوكالة مع شركة SRI، وهي مؤسسة غير ربحية مهتمة بأمور الذكاء الاصطناعي، من أجل تطوير مشروع لمدة خمس سنوات قادر على أرشفة 500 ملف لأشخاص مختلفين على أن تُساهم خوارزميات الذكاء الاصطناعي في هذا المشروع في تسهيل الوصول إلى جميع البيانات، بحيث يُسأل النظام عن شيء مُحدد، ليقوم بعرض إجابة مُفصّلة مع ربط التفاصيل والأحداث؛ أو بمعنى آخر، مُحرك بحث مع خوارزميات ذكاء اصطناعي عالية. أُطلق على المشروع وقتها [2]CALO، وهو اختصار للمساعد الرقمي القادر على التعلّم والترتيب، ومن هنا بدأت مؤسسة SRI بتطوير النظام لتقديمه لوكالة مشاريع الأبحاث الأمريكية.

 

وبعد خمس سنوات قررت المؤسسة إيقاف العمل على المشروع دون معرفة فيما إذا وصلت لغايتها مع وكالة الدفاع، أم أن نظام آخر حلّ مكان CALO. وقررت مؤسسة SRI أن تُطلق على النظام اسم سيري نسبة إلى اسمها -SRI- لكن مع إضافة حرف صوتي من أجل تسهيل نطق الكلمة، والتي شاءت الأقدار أن تحمل معنى "المرأة الجميلة التي تقود إلى النصر" في اللغة النرويجية.

 

في عام 2010 أطلقت شركة SRI نظام "سيري" على هيئة تطبيق منفصل للأجهزة الذكية العاملة بنظام "آي أو أس"، على أن يصل نفس التطبيق لنظامي أندرويد وويندوز في وقت لاحق، وقامت بربطه مع خدمات على الإنترنت تسمح بطلب سيارات الأجرة، أو جلب تقييمات الأفلام، أو حتى بيانات المطاعم، لكن استخدامه كان يتم عبر سماع جملة المستخدم والإجابة عليها على هيئة نصوص، أي أن المساعد لا يقوم بالحديث أو نطق الإجابة للمستخدم.

 

وبكل تأكيد، لن تترك آبل أو غيرها من الشركات إنجاز مثل هذا يمر مرور الكرام، لكن شغف جوبز كان أكبر من الجميع واستحوذ على سيري مقابل مبلغ يقال أنه يتراوح ما بين 150 و250 مليون دولار أمريكي[3]، على أن ينتقل فريق العمل إلى شركة آبل للاستفادة من هذه التقنية داخل أنظمة تشغيل شركة آبل التي كانت وقتها تقتصر على "ماك أو أس" و"آي أو أس" فقط.

عندما استعرضت آبل سيري للمرّة الأولى كانت ردود الفعل لا تُصدّق، وكأن خيالات وأحلام سبيعنات، وثمانينات القرن الماضي بدأت بالظهور.
عندما استعرضت آبل سيري للمرّة الأولى كانت ردود الفعل لا تُصدّق، وكأن خيالات وأحلام سبيعنات، وثمانينات القرن الماضي بدأت بالظهور.
جوبز ركّز منذ اليوم الأول على تحويل ردود سيري إلى ردود مسموعة عوضًا عن كونها مكتوبة فقط. فهو استعان بفنّانة اسمها (سوزان بينيت – Susan Bennett) وهي اختصاصية في تسجيل الأصوات وتقليدها، هذا عام 2005 تقريبًا، حيث ذكرت بينيت أن جوبز اتصل بها وطلب منها العمل على تسجيل أصوات لشركة آبل دون معرفة المشروع أبدًا. وعندما خرج سيري للنور، اتصل أصدقاؤها -أصدقاء بينيت- بها ليستفسروا فيما إذا كان صوتها المستخدم، لتجيب أنها غير متأكدة لأنها عملت على مشروع مع آبل منذ فترة طويلة، دون أن تعرف اسم المشروع أبدًا[4].

 

وبالفعل تمكّن جوبز في الأيام الأخيرة من حياته من تحويل ردود سيري إلى ردود صوتية، لكنه عمد إلى التخلّص من بعض الوظائف التي كان التطبيق الأساسي قادرًا على القيام بها. فتطبيق سيري الذي ظهر عام 2010 قبل استحواذ آبل عليه كان قادرًا على الاتصال بخدمات على الإنترنت، في حين أن جوبز قرر التركيز على دمج سيري مع خدمات آبل الأساسية مثل نظام الخرائط، والتقويم، والرسائل، على أن تتم إضافة الميّزات والإمكانيات بشكل تدريجي.

 

وعندما استعرضت آبل سيري للمرّة الأولى خلال الكشف عن هاتف "آي فون 4 أس"، كانت ردود الفعل لا تُصدّق، وكأن خيالات وأحلام سبيعنات، وثمانينات القرن الماضي بدأت بالظهور، فالآن أصبح بإمكان المستخدمين الحديث مع أجهزتهم الذكية وتنفيذ مهام مختلفة دون الحاجة إلى كتابة كلمة واحدة. وهكذا انتقل سيري من كونه مُحاكاة لخيال أحد رؤساء شركة آبل، إلى مساعد رقمي في هواتف "آي فون" دما مرّ بكل تأكيد على وكالة مشاريع الأبحاث الأمريكية.

 

آلية العمل
(رويترز)
(رويترز)

عندما يبدأ المستخدم بالحديث يسلك هذا الكلام مسريين مختلفين تمامًا، ففي المسرى الأول يتم تحويل صوته إلى إشارات رقمية بترميز يفهمه الحاسب أو نظام المعالجة، أما المسرى الثاني يتم فيه تحول الكلام إلى نصوص عبر "مفسّر آلي للحديث Automatic Speech Recognition"، وهو ما يُعرف اختصارًا بـ "ASR". بعدها وفي كلا المسريين يبدأ تحليل اللغة الطبيعية "NLP" لفهم نوع الكلمات فيما إذا كانت سؤالًا، أو استفسارًا ، أو أمرًا للجهاز مع الاستعانة أيضًا بمعالجات لفهم المقصود من الكلام[5].

 

بعد هذه المرحلة تبدأ المعالجة باستخدام نظام خاص موجود داخل الجهاز نفسه، مع الاتصال بخوادم آبل من أجل معالجة البيانات من طرفها، لكن وقبل إرسال البيانات لها، يتأكد المعالج داخل الجهاز فيما إذا كان الأمر المطلوب يمكن تنفيذه دون الحاجة للاستعانة بخوادم خارجية، فإذا كان الوضع كذلك، يتم إهمال الاتصال بالخوادم وتنفيذ الأمر داخليًا، أما إذا كان الأمر غير معروف، يتم تحويله فورًا إلى الخادم الذي يقوم بالاتصال بالخدمة المطلوبة وجلب الإجابة للمستخدم.

 

وكمثال حي عندما يقوم المستخدم بطلب الاتصال بوالده باستخدام سيري، سيقوم النظام بتحويل الصوت إلى إشارة رقمية ثم إخطار الخوادم وفي نفس الوقت تحليل الطلب، وبما أن الأمر هو الاتصال بوالد المستخدم فلا داعي لاستخدام خادم خارجي لأن والد المستخدم معروف بالنسبة للنظام الداخلي فقط، والرقم موجود داخل جهات الاتصال، وهنا يتم إهمال الاتصال بالخادم ويقوم الجهاز بالاتصال بوالد المستخدم بشكل فوري.

 

أما لو طلب المستخدم من سيري معلومات حول مواعيد الرحلات من مدينة الدوحة إلى مدينة أنقرة، فهنا لن يفهم المُفسّر الداخلي هذا الطلب وسيقوم بإخطار الخوادم بضرورة معالجة الطلب لأنه لم يتمكّن من فهمه، وهنا تقوم الخوادم بالبحث باستخدام مُحركات مثل ياهو أو Bing للوصول إلى أفضل النتائج وعرضها للمستخدم، مع استخدام نظام تحويل "النصوص إلى كلام Text-To-Speech" وبالتالي نطق الإجابة للمستخدم.

الذكاء الاصطناعي داخل سيري قادر على فهم الحالات الغامضة وطرح اسئلة على المستخدم تمامًا مثلما يحصل في الحوارات بين البشر.
الذكاء الاصطناعي داخل سيري قادر على فهم الحالات الغامضة وطرح اسئلة على المستخدم تمامًا مثلما يحصل في الحوارات بين البشر.
ما يقوم به المُفسّر الداخلي والخوادم هو مقارنة الإشارات الناتجة عن المسرى الأول مع إشارات أو نماذج مُخزّنة سابقًا، فعوضًا عن اكتشاف كل كلمة لوحدها، تتم مقارنتها بنماذج سابقة واختصار الوقت. وبكل تأكيد لن تكون جميع الكلمات مفهومة مع اختلاف طُرق النطق واللهجات، لكن المُفسّر يقوم بتقريب الكلمة إلى أقرب نموذج مفهوم واعتماده في عملية البحث.

 

بعد فهم الكلمات بشكل كامل تبدأ عملية تحليل المعنى المطلوب؛ فمثلًا سؤال سيري "هل يجب أن اجلب مظلّة معي يوم الغد" لن يعني أي شيء لسيري كونه مساعد رقمي، لكن الذكاء الاصطناعي يفهم المعنى من هذا السؤال ويقوم بجلب حالة الطقس في اليوم التالي[6].

 

الذكاء الاصطناعي داخل سيري قادر على فهم الحالات الغامضة وطرح اسئلة على المستخدم تمامًا مثلما يحصل في الحوارات بين البشر، وهنا تبرز أهمية وقوّة خوارزميات الذكاء الاصطناعي والتعلّم الذاتي للآلة، وهناك أمثلة كثيرة على هذا الذكاء ليس في سيري فقط، بل موجودة أيضًا في محرك بحث جوجل.

 

هذا ليس كل شيء بكل تأكيد، فنحن نتحدّث على المستوى الأول المباشر مع المستخدم، لكن ما يحصل في الخفاء داخل الخوادم أو حتى داخل معالجات الكلام هو أمر خاص بالشركة نفسها، لن تقوم بمشاركته مع أحد لأن البراعة تكمن في خوارزميات الذكاء الاصطناعي وآلية معالجتها للطلبات والتعلّم منها بأسرع وقت ممكن لتحسين النتائج مع مرور الوقت.

 

ماذا عن خصوصية بيانات المستخدم؟
(رويترز)
(رويترز)

ذكرنا أن البيانات تُرسل إلى خوادم آبل لتحليلها والعودة بالإجابة الصحيحة، وهنا يبدأ القلق حول مدى سرّية هذه البيانات، وكيف تقوم آبل بمعالجتها.

 

لسنوات طويلة لم تقم آبل أبدًا بتخزين البيانات الواردة على خوادمها، كما أنها استعانت بتفسير النظام الداخلي لكلام المستخدم من أجل الإجابة على الأسئلة. بمعنى آخر، عندما يبدأ الحديث مع الجهاز يتم تحليل الحديث وفهمه بالكامل ثم إرسال الاستفسار إلى خوادم آبل لتجيب بدورها عن السؤال، دون معرفة صاحب السؤال أو حتى موقعه الجغرافي.

 

لكن ولآن الذكاء الاصطناعي والتعلّم الذاتي للآلة يتطلبان كمية كبيرة من البيانات، فإن آبل لجأت لمفهوم "الخصوصية التفاضلية [7] Differential Privacy"، وهو مفهوم تقوم من خلاله بإضافة بيانات عشوائية على البيانات الأصلية لكي لا تُعطي وقتًا كافٍ للخوادم للاحتفاظ بالبيانات الواردة. فعندما يسأل المستخدم عن حالة الطقس في مدينته، يقوم النظام بإضافة بيانات عشوائية فوق السؤال نفسه وفوق اسم المدنية، وكذلك أي معلومة ثانية قد تدل على المستخدم صاحب السؤال، وهنا ولأن الآلة ستنشغل بالمهمة الأصلية القائمة على جلب درجة الحرارة في المدنية المطلوبة، فهي لا تملك الوقت الكافي لتحليل جميع البيانات وإزالة البيانات العشوائية التي لا معنى لها، وبالتالي الحفاظ على خصوصية المستخدم.

 

وذكر تيم كوك، الرئيس التنفيذي الحالي لشركة آبل، أن المُفاضلة ما بين خصوصية بيانات المستخدمين وتطوير الذكاء الاصطناعي وخوارزمياته هو مُجرّد حجج واهية تذكرها بعض الشركات لتبرير الاحتفاظ ببيانات المستخدمين وعمليات البحث التي يقومون بها عبر المساعدات الرقمية[8].

 

سيري الآن موجود على جميع أجهزة آبل الذكية التي تعمل بنظام "آي أو أس 5" وما بعده، فهي دعمت اللغة الإنكليزية والألمانية منذ الإصدار الأول، ثم بدأت بإضافة دعم للغات كثيرة منها اللغة العربية المتوفرة في "آي أو أس 9.2" وما بعده، إضافة إلى نظام macOS Sierra بكل تأكيد.

 

وإذا لم تُجرّب سيري حتى الآن، فأنصحك بتفعيلها من داخل إعدادات الجهاز والبدء بالحديث معها من خلال الضغط بصورة مُطوّلة على الزر الرئيس Home في هواتف "آيفون" وحواسب "آي باد" اللوحية. وإذا ما شعرت أن مستوى الذكاء عالي جدًا في مساعد آبل الرقمي، فأنصحك أن تعيد النظر في هذا الشعور لأن القائمين على سيري وبعد تركهم للعمل في شركة آبل طوّروا مساعدًا رقميًا جديدًا حمل اسم Viv عملت شركة سامسونج على الاستحواذ عليه مؤخرًا، وهو مساعد قادر على فهم الحوارات المُركّبة والمُعقّدة مع البشر وإتمامها باحترافية عالية.

المصدر : الجزيرة