كيف يعمل محرك التعرف الضوئي على الحروف (OCR)؟

كيف يعمل محرك التعرف الضوئي على الحروف (OCR)
شاركها الان
الإنتقال السريع

قد يكون استخراج البيانات وإعادة استخدامها من المستندات الممسوحة ضوئيًا وصور الكاميرا وملفات PDF التي تحتوي على صور فقط أمرًا صعبًا. 

ومع ذلك، فإن محرك OCR المتطور القائم على التعلم الآلي يمكنه تنفيذ المهمة بكفاءة.

ستناقش هذه المقالة كيفية عمل محرك التعرف الضوئي على الأحرف (OCR) ولماذا قد يكون برنامج تطوير برامج التعرف الضوئي على الأحرف (OCR SDK) هو الخيار الأمثل لاحتياجاتك. 

ما هو التعرف الضوئي على الحروف (OCR)؟

التعرف الضوئي على الحروف - التعرف الضوئي على الحروف - تحويل صورة النص إلى تنسيق نصي قابل للقراءة آليًا باستخدام الذكاء الاصطناعي. 

تتمتع تقنية التعرف الضوئي على الحروف (OCR) بفوائد هائلة مقارنة بالمسح الضوئي البسيط، حيث لا يمكنك تحرير الكلمات في ملف الصورة أو البحث عنها أو حسابها باستخدام محرر نصوص. 

ومع ذلك، يمكن لـOCR تحويل الصورة إلى مستند نصي، وتخزين محتوياتها كبيانات نصية.

ما هي أهمية محرك التعرف الضوئي على الحروف (OCR)؟

اليوم، تعتمد معظم سير عمل الشركات على تلقي المعلومات من وسائل الإعلام المطبوعة. وتُعدّ الفواتير، والنماذج الورقية، والوثائق القانونية الممسوحة ضوئيًا، والعقود المطبوعة جزءًا من عمليات الأعمال. 

يستغرق تخزين وإدارة هذه الكميات الكبيرة من المستندات الورقية الكثير من الوقت والمساحة. 

هنا، توفر تقنية التعرف الضوئي على الحروف (OCR) فوائد إدارة المستندات بدون ورق مقارنة بالتدخل اليدوي، الذي يعد مرهقًا وبطيئًا.

تحل تقنية التعرف الضوئي على الحروف (OCR) المبنية على الذكاء الاصطناعي المشكلة عن طريق تحويل الصور النصية إلى بيانات نصية يمكن تحليلها بواسطة برامج أعمال أخرى. 

ويتم بعد ذلك دمج البيانات المعالجة لإجراء التحليلات وتبسيط العمليات وأتمتتها، مما يؤدي في النهاية إلى تحسين الإنتاجية.

كيف يعمل محرك التعرف الضوئي على الحروف (OCR)؟

الحصول على الصور

تُعدّ عملية التقاط الصور الخطوة الأولى، حيث يقوم الماسح الضوئي بقراءة المستندات وتحويلها إلى بيانات ثنائية. ويصنف المناطق الفاتحة كخلفية والمناطق الداكنة كنص لتحليل الصورة الممسوحة ضوئياً.

معالجة الصور

عملية الالتقاط مصحوبة بالأوساخ والأخطاء. لذلك، يقوم مُحرك التعرف الضوئي على الحروف (OCR) أولًا بتنظيف الصورة والتخلص من الأخطاء قبل قراءتها.

هذه تقنيات التنظيف:

  • تفصيل or إمالة:إصلاح مشكلات المحاذاة أثناء الفحص.
  • القذارة: قم بإزالة أي بقع صور رقمية تعمل على تنعيم حواف الصور النصية.
  • يتم تنظيف المربعات والخطوط في الصورة.
  • التعرف على النص باستخدام تقنية التعرف الضوئي على الحروف (OCR) متعددة اللغات.

التعرف على النص

يعدّ كل من مطابقة الأنماط واستخراج الميزات النوعين الرئيسيين من خوارزميات التعرف الضوئي على الأحرف (OCR) التي يستخدمها برنامج التعرف الضوئي على الأحرف بشكل أساسي للتعرف على النصوص.

نمط مطابقة

الخطوة التالية هي مطابقة النمط عن طريق فصل صورة شخصية تسمى الصورة الرمزية ومقارنتها برمز مخزن بشكل مماثل. 

تعمل هذه العملية فقط عندما يكون للرمز المخزن خط ومقياس مماثل للرمز المدخل.

ميزة استخراج

الخطوة التالية هي استخراج السمات. تُقسّم هذه العملية أو تُحلّل الحروف إلى سمات مثل الخطوط، والحلقات المغلقة، واتجاهات الخطوط، وتقاطعاتها. 

تعمل هذه الميزات على العثور على أفضل تطابق أو أقرب جار بين الحروف الرسومية المخزنة المختلفة.

المعالجة البعدية

وأخيرًا، بعد التحليل، يقوم النظام بتحويل بيانات النص المستخرجة إلى ملف حاسوبي.

ما هي حالات استخدام OCR النموذجية؟

  • البنوك والمصارفتُساعد تقنية التعرف الضوئي على الحروف (OCR) القطاع المصرفي على معالجة المستندات والتحقق منها، بما في ذلك مستندات القروض وشيكات الإيداع وغيرها من المعاملات المالية. وقد حسّنت هذه التقنية من إجراءات منع الاحتيال وعززت أمان المعاملات.
  • قطاع الرعاية الصحيةأحدث نظام OCR ثورةً في قطاع الرعاية الصحية. فهو يُعالج سجلات المرضى، بما في ذلك العلاجات والفحوصات وسجلات المستشفيات ومدفوعات التأمين. وقد ساهم مؤخرًا في تبسيط سير العمل وتقليل العمل اليدوي في المستشفيات مع الحفاظ على تحديث السجلات باستمرار.
  • الوثائق القانونيةتُسهّل تقنية التعرف الضوئي على الحروف (OCR) مسح المستندات القانونية المهمة والمعتمدة وحفظها في قاعدة بيانات إلكترونية لسهولة استرجاعها. كما يُمكن الاطلاع على هذه المستندات ومشاركتها بين العديد من الأشخاص.
  • لخدمات اللوجستيةكان قطاع الخدمات اللوجستية أقل كفاءة قبل تقنية التعرف الضوئي على الحروف (OCR). ففي السابق، كان الإدخال اليدوي لمستندات الأعمال يستغرق وقتًا طويلاً ويحتمل الأخطاء. وبفضل تقنية الاستشراف، كان على الموظفين إدخال البيانات في أنظمة محاسبية متعددة. تستخدم شركات الخدمات اللوجستية تقنية التعرف الضوئي على الحروف (OCR) لتتبع ملصقات الطرود والفواتير والإيصالات وغيرها من المستندات بكفاءة أكبر. مع Amazon Textract، يمكن لبرنامج Foresight قراءة الأحرف بدقة أكبر عبر العديد من التنسيقات المختلفة، مما يزيد من كفاءة الأعمال.

ما هي الطرق الرئيسية التي تساعد بها محركات التعرف الضوئي على الحروف الشركات اليوم؟

  • أتمتة سير العمل
  • تحويل الملفات للقراءة فقط إلى نص قابل للتحرير
  • إنشاء ملفات مسموعة
  • ترجمة اللغات الأجنبية
  • إدارة النماذج والاستبيانات
  • تحقيق إدخال البيانات بشكل أسرع وأكثر دقة

كيف يمكنك دمج SDK OCR؟

تساعد مجموعة أدوات OCR SDK الخاصة بـ FileStack في رقمنة المستندات واستخراج البيانات وتنظيمها من بطاقات الائتمان وجوازات السفر ورخص القيادة وإيصالات الضرائب دون تحريك إصبع. 

ينظم OCR من FileStack عملية التقاط البيانات ويبسطها، حتى لا تضطر إلى القيام بذلك بنفسك. 

لاستخراج النص الموجود داخل المستندات المعقدة في الصور، يحتوي FileStack على حلين مختلفين يعتمدان على التعلم الآلي ويعملان بدقة. 

  1. التعلم غير الخاضع للإشراف باستخدام معالجة الصور الذكية
  2. التجزئة الخاضعة للإشراف

تعد أدوات الكشف عن المستندات ومعالجتها المسبقة المتقدمة أحدث إضافة إلى FileStack والتي يمكنها زيادة الدقة. 

أولاً، تقوم واجهة برمجة تطبيقات FileStack بتحميل الصور إلى قواعد بياناتها. ثم تُحوّلها إلى تنسيق موحد، وتُغيّر حجمها إلى حجم قياسي. 

بعد ذلك، تُدخل هذه البيانات في أدوات كشف المستندات ومعالجتها المسبقة لجعل الصورة أكثر وضوحًا لمحرك التعرف الضوئي على الحروف (OCR). تُولّد النتائج استجابة JSON تحتوي على جميع معلومات النصوص المستخرجة في الصورة الأصلية.

في واجهة برمجة التطبيقات (API) للمعالجة، يتوفر التعرف الضوئي على الحروف (OCR) كعملية متزامنة. باتباع هذه المهمة:

التعرف الضوئي على الحروف

وعليه فإن الرد:

{
    "وثيقة": {
        “مناطق النص”: [
            {
                “الصندوق المحيط”: [
                    {
                        "x": 834،
                        "ي": 478
                    },
                    {
                        "x": 3372،
                        "ي": 739
                    },
                    {
                        "x": 3251،
                        "ي": 1907
                    },
                    {
                        "x": 714،
                        "ي": 1646
                    }
                ],
                "الخطوط": [
                    {
                        “الصندوق المحيط”: [
                            {
                                "x": 957،
                                "ي": 490
                            },
                            {
                                "x": 3008،
                                "ي": 701
                            },
                            {
                                "x": 2977،
                                "ي": 1009
                            },
                            {
                                "x": 925،
                                "ي": 797
                            }
                        ],
                        "النص": "يمكن لـ Filestack الكشف عن ذلك"،
                        "كلمات": [
                            {
                                “الصندوق المحيط”: [
                                    {
                                        "x": 957،
                                        "ي": 490
                                    },
                                    {
                                        "x": 1833،
                                        "ي": 580
                                    },
                                    {
                                        "x": 1802،
                                        "ي": 888
                                    },
                                    {
                                        "x": 925،
                                        "ي": 797
                                    }
                                ],
                                "النص": "Filestack"
                            },
                            {
                                “الصندوق المحيط”: [
                                    {
                                        "x": 1916،
                                        "ي": 589
                                    },
                                    {
                                        "x": 2266،
                                        "ي": 625
                                    },
                                    {
                                        "x": 2235،
                                        "ي": 932
                                    },
                                    {
                                        "x": 1884،
                                        "ي": 896
                                    }
                                ],
                                "النص": "يمكن"
                            },
                            {
                                “الصندوق المحيط”: [
                                    {
                                        "x": 2336،
                                        "ي": 632
                                    },
                                    {
                                        "x": 3008،
                                        "ي": 701
                                    },
                                    {
                                        "x": 2977،
                                        "ي": 1009
                                    },
                                    {
                                        "x": 2304،
                                        "ي": 939
                                    }
                                ],
                                "النص": "الكشف"
                            }
                        ]
                    },
                    {
                        “الصندوق المحيط”: [
                            {
                                "x": 860،
                                "ي": 858
                            },
                            {
                                "x": 3330،
                                "ي": 1049
                            },
                            {
                                "x": 3301،
                                "ي": 1421
                            },
                            {
                                "x": 831،
                                "ي": 1229
                            }
                        ],
                        "النص": "مطبوع ومكتوب بخط اليد"،
                        "كلمات": [
                            {
                                “الصندوق المحيط”: [
                                    {
                                        "x": 860،
                                        "ي": 858
                                    },
                                    {
                                        "x": 1550،
                                        "ي": 912
                                    },
                                    {
                                        "x": 1521،
                                        "ي": 1283
                                    },
                                    {
                                        "x": 831،
                                        "ي": 1229
                                    }
                                ],
                                "النص": "مطبوع"
                            },
                            {
                                “الصندوق المحيط”: [
                                    {
                                        "x": 1677،
                                        "ي": 922
                                    },
                                    {
                                        "x": 2047،
                                        "ي": 951
                                    },
                                    {
                                        "x": 2018،
                                        "ي": 1321
                                    },
                                    {
                                        "x": 1648،
                                        "ي": 1292
                                    }
                                ],
                                "النص": "و"
                            },
                            {
                                “الصندوق المحيط”: [
                                    {
                                        "x": 2107،
                                        "ي": 954
                                    },
                                    {
                                        "x": 3330،
                                        "ي": 1049
                                    },
                                    {
                                        "x": 3301،
                                        "ي": 1421
                                    },
                                    {
                                        "x": 2078،
                                        "ي": 1326
                                    }
                                ],
                                "النص": "مكتوب بخط اليد"
                            }
                        ]
                    },
                    {
                        “الصندوق المحيط”: [
                            {
                                "x": 749،
                                "ي": 1305
                            },
                            {
                                "x": 2504،
                                "ي": 1486
                            },
                            {
                                "x": 2469،
                                "ي": 1826
                            },
                            {
                                "x": 714،
                                "ي": 1645
                            }
                        ],
                        "النص": "النصوص باستخدام التعرف الضوئي على الحروف"،
                        "كلمات": [
                            {
                                “الصندوق المحيط”: [
                                    {
                                        "x": 749،
                                        "ي": 1305
                                    },
                                    {
                                        "x": 1233،
                                        "ي": 1355
                                    },
                                    {
                                        "x": 1198،
                                        "ي": 1695
                                    },
                                    {
                                        "x": 714،
                                        "ي": 1645
                                    }
                                ],
                                "النص": "النصوص"
                            },
                            {
                                “الصندوق المحيط”: [
                                    {
                                        "x": 1317،
                                        "ي": 1364
                                    },
                                    {
                                        "x": 1910،
                                        "ي": 1425
                                    },
                                    {
                                        "x": 1875،
                                        "ي": 1765
                                    },
                                    {
                                        "x": 1282،
                                        "ي": 1704
                                    }
                                ],
                                "النص": "استخدام"
                            },
                            {
                                “الصندوق المحيط”: [
                                    {
                                        "x": 1972،
                                        "ي": 1431
                                    },
                                    {
                                        "x": 2504،
                                        "ي": 1486
                                    },
                                    {
                                        "x": 2469،
                                        "ي": 1826
                                    },
                                    {
                                        "x": 1937،
                                        "ي": 1771
                                    }
                                ],
                                "النص": "التعرف الضوئي على الحروف"
                            }
                        ]
                    }
                ],
                "text": "يمكن لبرنامج Filestack اكتشاف النصوص المطبوعة والمكتوبة بخط اليد باستخدام التعرف الضوئي على الحروف"
            }
        ]
    },
    "text": "يمكن لبرنامج Filestack اكتشاف النصوص المطبوعة والمكتوبة بخط اليد باستخدام التعرف الضوئي على الحروف"،
    النسبة المئوية لمساحة النص: 23.40692449819434
}

اعتمادًا على معلمات الاستجابة، يمكنك الحصول على استجابة OCR على صورتك كما يلي:

https://cdn.filestackcontent.com/security=p:<POLICY>,s:<SIGNATURE>/ocr/<HANDLE>

يمكنك استخدام تقنية التعرف الضوئي على الأحرف (OCR) في سلسلة مع مهام أخرى، مثل الكشف عن المستندات:

https://cdn.filestackcontent.com/security=p:<POLICY>,s:<SIGNATURE>/doc_detection=coords:false,preprocess:true/ocr/<HANDLE>

استخدم أيضًا OCR مع عنوان URL خارجي:

https://cdn.filestackcontent.com/<FILESTACK_API_KEY>/security=p:<POLICY>,s:<SIGNATURE>/ocr/<EXTERNAL_URL>

أخيرًا، استخدم OCR مع أسماء التخزين البديلة:

https://cdn.filestackcontent.com/<FILESTACK_API_KEY>/security=p:<POLICY>,s:<SIGNATURE>/ocr/src://<STORAGE_ALIAS>/<PATH_TO_FILE>

الأسئلة الشائعة

لم يتم العثور على بيانات

بلوق وظائف ذات الصلة

الإنتقال السريع
الإنتقال السريع