استخدام ML Kit للذكاء الصناعي في تطبيقات أندرويد

في منشور سابق تحدثت عن مكاتب الذكاء الصناعي الجاهزة ومنها ML Kit

هذه المكتبة من شركة Google والمخصصة للأندرويد، تحوي العديد من الأدوات المدمجة مثل التعرف على النصوص واكتشاف الوجوه وأدوات معالجة اللغة الطبيعية مثل التعرف على اللغة والترجمة بالإضافة إلى مسح الباركود وتتبع الأجسام وتصنيف الصور

تطورت ML Kit بشكل كبير خلال السنوات الأخيرة. أول مرة قمت باستخدامها عام 2018 في مشروع برمجي كان يتطلب قراءة بيانات من الهوية الكويتية. في ذلك الوقت كانت النتيجة سيئة جدًا مما اضطرني لاستخدام حل أكثر تعقيدًا (Tesseract).

اليوم قمت بتجربة مشابهة باستخدام ML Kit وكان الأداء جيداً جداً خصوصًا عند التعامل مع اللغة الإنجليزية. الدقة في استخراج النصوص كانت عالية والزمن المستغرق للاستجابة قصير جدًا مما يجعلها خيار ممتاز للتطبيقات التي تعتمد على الكاميرا بشكل مباشر

يمكن الاستفادة من هذه المكتبة في العديد من السيناريوهات العملية مثل

تطبيق سكانر للفواتير أو الإيصالات لاستخراج النصوص وتحليلها

التعرف على النصوص من لوحات السيارات أو الوثائق

بناء تطبيق ترجمة فورية يعتمد على الكاميرا

تطبيقات أمنية أو تعليمية تعتمد على كشف الوجوه وتتبع الحركات

تصنيف الصور والتعرف على المحتوى داخلها بشكل مباشر دون الحاجة للاتصال بالسيرفر

تطبيقات للأطفال للتفاعل مع الكاميرا والتعرف على الأشياء حولهم

أصبحت ML Kit اليوم أكثر نضجًا وسهولة في الدمج ضمن التطبيقات دون الحاجة لبناء نموذج مخصص أو استخدام خوادم ذكاء صناعي خارجية

طبعاً خرج المكتبة بحاجة إلى معالجة مثل استخراج المعلومات بشكل مفصل (الاسم, تاريخ الميلاد…الخ) أيضاً محاولة تصحيح الاخطاء إن وجدت

رابط المشروع على github

https://github.com/mutasemhajhasan/mlkit-ocr-sample