OCR تقنية التعرف على الحروف العربية

OCR -حروف-حروف

OCR التقنيات الحديثة في التعرف الضوئي على حروف

OCR -حروف-حروف

OCR سيوفر لك هذا الدليل الشامل للتعرف الضوئي على حروف

وجميع المعلومات التي تحتاجها لفهم ما هو التعرف الضوئي وما هي ميزته وكيفية تحقيق أقصى استفادة من هذه التكنولوجيا في سياق الأعمال

OCR ما هو التعرف الضوئي لحروف

إن التعرف الضوئي على الحروف هو تحويل إلكتروني، للصور النصية المكتوبة؛ أو المكتوبة بخط اليد؛ أو المطبوعة إلى نص مشفر آليًا؛ OCR وباستخدام التعرف الضوئي على الحروف.

والتي تتم من خلال قراءة الوثيقة بشكل آلي عند مسحها بجهاز السكانر

ويمكن تحويل عدد كبير من المستندات الورقية؛ عبر لغات وتنسيقات متعددة إلى نص يمكن قراءته آليًا. مما لا يجعل التخزين أسهل فحسب، بل يجعل أيضًا البيانات التي تعذر الوصول إليها مسبقًا متاحة لأي شخص بنقرة واحدة

دليل حروف ORC

فكر فقط في كمية صناديق الأرشيف المليئة بالورق الموجودة في مدينة أو قبو حكومي. حيث يمكن مسح هذه الصور والمستندات كمستند أو صورة مستند أو صورة مشهد. (مثل: نص على اللافتات واللوحات الإعلانية)

OCR كيف يعمل التعرف الضوئي على حروف

فإنه يجب معالجة الصورة مسبقًا حتى تكون الصورة جاهزة “للقراءة”. يجب توضح الخطوط والطرق المختلفة لكتابة حرف واحد. ويتم OCR تحديد هذه المشكلة أولاً لحلها. قبل تحديد خوارزمية

O-C-R

OCR ما قبل المعالجة حروف

غالبًا ما تقوم البرامج بمعالجة الصور مسبقًا، لتعزيز فرص التعرف عليها

OCR التقنيات التي تشمل معالجة حروف

أولاً: إزالة الانحراف –

إذا لم تتم محاذاة المستند بشكل صحيح عند مسحه ضوئيًا. فقد يلزم إمالته بضع درجات في اتجاه عقارب الساعة، أو عكس اتجاه عقارب الساعة.  لإنشاء خطوط نص أفقية أو رأسية تمامًا

   ثانياً: ديسبيكل –

إزالة البقع الإيجابية والسلبية، وتنعيم الحواف

    ثالثاً: ثنائية –

تحويل صورة إلى أبيض وأسود (تسمى “صورة ثنائية” لأن هناك لونين). ويتم تنفيذ مهمة الترميز الثنائي كطريقة سهلة ودقيقة لتمييز النص، (أو أي عنصر صورة آخر مطلوب) عن الخلفية

  رابعاً: إزالة الخط –

ينظف المربعات والخطوط غير الرسومية

    خامساً: تحليل التخطيط أو تقسيم المناطق –

يحدد الأعمدة والفقرات والتعليقات التوضيحية، وما إلى ذلك على أنها كتل. مفيدة بشكل خاص في التخطيطات والجداول متعددة الأعمدة

 سادساً: كشف الخط والكلمة –

إنشاء خط أساسي لأشكال الكلمات والحرف، وتقسيم الكلمات عند الحاجة

   سابعاً: التعرف على النص –

في المستندات متعددة اللغات، قد يتحول البرنامج النصي على مستوى الكلمة، وبالتالي فإن تحديد البرنامج النصي أمر حيوي قبل استخدام التعرف الضوئي على الحروف ذي الصلة لإدارة البرنامج النصي المعين

  ثامناً: عزل الشخصية أو التجزئة –

OCR بالنسبة إلى أحرف التعرف الضوئي على الحروف

، يجب تقسيم الأحرف المختلفة المرتبطة بالتحف المصورة، ويجب ربط الأحرف الفردية المقسمة إلى عدة قطع قائمة على القطع الأثرية

  تاسعاً: تسوية –

تسوية نسبة العرض إلى الارتفاع والحجم

OCR ميزة استخراج حروف

OCR هناك طريقتان رئيسيتان لاستخراج الميزات في حروف

الطريقة الأولى: تحدد خوارزمية الحروف لاكتشاف المميزات عن طريق تقييم خطوطها وحدودها

الطريقة الثانية: يعمل التعرف على الأنماط من خلال تحديد الحرف بالكامل

 OCR الدليل الشامل للتعرف على حروفOCR

يمكننا التعرف على سطر من النص من خلال البحث عن صفوف بكسل بيضاء بها بكسلات سوداء بينهما. وبالمثل، وبذلك يمكننا التعرف على المكان الذي تبدأ فيه وأين تنتهي

توضح الصور التالية تصور هذه الطرق على التوالي

حروف
الأولى – الكشف عن الميزة
حروف
الثانية – التعرف على الأنماط في صف من النص
حروف ORC
الثالثة – التعرف على الأنماط على حرف واحد

وبعد ذلك، نقوم بتحويل صورة الحرف إلى مصفوفة ثنائية حيث تكون البكسلات البيضاء 0 ثانية والبكسل الأسود 1 ثانية كما هو موضح في الصورة التالية

ORC حروف
عينة من مصفوفة ثنائية

بعد ذلك، باستخدام صيغة المسافة، يمكننا إيجاد المسافة من مركز المصفوفة إلى الأبعد 1

حروف ORC
صيغة المسافة

وثم نقوم بإنشاء دائرة بهذا الشعاع ونقسمها إلى أقسام أكثر دقة في هذه المرحلة. حيث يتم مقارنة خوارزمية كل قسم فرعي بقاعدة بيانات، من المصفوفات التي تمثل أحرفًا بخطوط مختلفة لتحديد الشخصية التي تشترك فيها أكثر من الناحية الإحصائية

وكل ذلك يجعل من السهل إدخال الوسائط المطبوعة إلى العالم الرقمي من خلال القيام بذلك لكل سطر

ORC
قارن كل قسم فرعي بقاعدة بيانات المصفوفة

OCR المعالجة البعدية لحروف

يمكن تحسين دقة التعرف الضوئي على الحروف إذا كان الإخراج محدودًا بمفردات، (قائمة الكلمات المسموح بها في المستند). على سبيل المثال، يمكن أن يكون هذا هو كل الكلمات باللغة الإنجليزية. أو معجم أكثر تقنية لحقل معين

قد تكون هذه الطريقة أقل فعالية إذا كان المستند يحتوي على كلمات غير موجودة في المعجم. مثل: أسماء العلم

لحسن الحظ، لتحسين الدقة، هناك مكتبات متاحة على الإنترنت مجانًا. تستخدم مكتبة قاموسها للتحكم في تقسيم الأحرف

يمكن أن يكون دفق الإخراج عبارة عن سلسلة واحدة أو ملف حرف. لكن أنظمة التعرف الضوئي على الحروف الأكثر تقدمًا تحتفظ PDFبهيكل الصفحة الأصلية. على سبيل المثال: قم بإنشاء ملف

يحتوي على كل من صفحات الصور الأصلية وصورة نصية قابلة للبحث

OCR تصحيح الاخطاء في

يمكن أن يستخدم الترددات للتواجد المشترك لتصحيح الأخطاء. من خلال ملاحظة أن بعض الكلمات قد شوهدت معًا. على سبيل “Washington DOC”المثال: “واشنطن العاصمة” أكثر انتشارًا في اللغة الإنجليزية من

قواعد

يمكن أن تساعد القواعد النحوية أيضًا في تحديد اللغة التي يتم مسحها ضوئيًا، على سبيل المثال. من المحتمل أن تكون الكلمة فعلًا أو اسمًا، مما يوفر دقة أعلى

OCR في المعالجة اللاحقة لـــــــ

Levenshtein Distance غالبًا ما تُستخدم خوارزمية

OCR API لزيادة تعظيم نتائج

OCR حالات استخدام التعرف الضوئي على حروف

تم تطوير المحركات إلى مجموعة من تطبيقات الخاصة بالمجال. بما في ذلك الإيصال والفواتير والتحقق والمستند القانون

OCR يمكن اكتشاف المزيد من حالات استخدام حروف

إدخال البيانات لوثائق الأعمال، على سبيل المثال الشيكات وجوازات السفر والفواتير والكشوف المصرفية والإيصالات –

التعرف التلقائي على لوحة الترخيص

في المطارات، التعرف على جوازات السفر واستخراج المعلومات –

استخراج معلومات مفتاح وثيقة التأمين التلقائي –

استخراج معلومات بطاقة العمل في قائمة جهات الاتصال –

قم بعمل نسخ رقمية من مستند مطبوع ضخم. على سبيل المثال مسح الكتاب –

اجعل الصور الإلكترونية للمستندات المطبوعة قابلة للبحث. على سبيل المثال كتب جوجل –

تحويل الكتابة اليدوية في الوقت الفعلي للتحكم في الكمبيوتر (الحوسبة بالقلم) –

(OCR) حالة استخدام التعرف الضوئي على حروف

الخدمات المصرفية

OCR تعد الصناعة المصرفية مستهلكًا مهمًا لـ

إلى جانب القطاعات الاقتصادية الأخرى مثل التأمين والأوراق المالية

OCR الاستخدام الأكثر شيوعًا هو إدارة الشيكات بشكل صحيح لـحروف

يتم فحص الشيك المكتوب بخط اليد ضوئيًا –

تفاصيله تتحول إلى نص رقمي –

تم التحقق من صحة التوقيع –

يتم مسح الشيك في الوقت الحقيقي –

كل ذلك بدون تدخل بشري

على الرغم من دقة فحوصات الطباعة بنسبة 100 ٪ تقريبًا. (يتطلب التحقق من التوقيع فقط مطابقة قاعدة بيانات موجودة مسبقًا). إلا أن الاستقلالية الكاملة لعناصر التحكم المكتوبة بخط اليد لا تزال طويلة

OCR ومع ذلك. مع أساليب التعلم العميق للذكاء الاصطناعي المطابقة للكتابة اليدوية على .

وقد لا يكون غير قابل للحل كما قد يبدو

حروف ORC
عينة من حالات استخدام البنك للتعرف الضوئي على الحروف

OCR الصناعة القانونية وحروف

هناك عدد قليل من الصناعات التي تولد الكثير من الأعمال الورقية مثل: الصناعة القانونية، وبالتالي فإن التعرف الضوئي على الحروف له تطبيقات متعددة هنا

ويمكن إجراء عمليات التحويل الرقمي والتخزين وقاعدة البيانات والبحث باستخدام أبسط قارئات التعرف الضوئي على الحروف في جميع المستندات المطبوعة: الإقرارات الخطية، والأحكام، والملفات، والبيانات، والوصايا، وما إلى ذلك

هذه التقنية متاحة أيضًا للتسجيلات باللغات الصينية والعربية والنصوص الأخرى، مع توسيع تقنية التعرف الضوئي على الحروف لتشمل اللغات التي لا تستخدم النص الروماني

من المؤكد أن الوصول السريع إلى المستندات القانونية من ملايين الحالات السابقة له ميزة للصناعة التي تعتمد بشكل كبير على الماضي

OCR الرعاية الصحية وحروف

الصناعة الأخرى التي تعمل بشكل جيد مع هي الرعاية الصحية. يمكن مسح السجل الطبي بالكامل وتخزينه على جهاز كمبيوتر. التقارير والأشعة السينية، والأمراض السابقة والعلاجات أو التشخيصات، والاختبارات وسجلات المستشفى ومدفوعات التأمين، وما إلى ذلك. كل هذه الأمور متاحة في مكان واحد ويمكن البحث فيها

تمثل حقيقة تخزين سجل المستشفى بالكامل رقميًا أيضًا ميزة كبيرة لعلم الأوبئة. وأيضًا للخدمات اللوجستية. (الحفاظ على مخازن الأدوية المناسبة، والمعدات، والمنتجات الاستهلاكية الأخرى)

تتلخص هذه السجلات في العديد من المستشفيات في جميع أنحاء المنطقة. التي توفر قاعدة بيانات هائلة للسياسة والتشريعات الصحية وتوفيرها على أساس البيانات

ORC
التعرف الضوئي على الحروف في المستحضرات الصيدلانية

OCR الموردين واستخدام حروف

في صناعات الأغذية والمشروبات والأدوية ومستحضرات التجميل، تعد مراقبة الجودة من خلال كل مرحلة من مراحل العملية أمرًا بالغ الأهمية في الامتثال لقوانين السلامة ومكافحة التزييف

يجب أن تكون العناصر موجودة داخل سلسلة التوريد في أي لحظة محددة، مع توثيق معلومات واضحة عن منشأها وموقعها

على الرغم من أن تتبع المنتج غالبًا ما يُعتبر تطبيقًا للشفرات الشريطية، فإن التعرف الضوئي على الحروف يسمح لك بقراءة رموز الدُفعة، ورموز الدُفعات، وتواريخ انتهاء الصلاحية، والأرقام التسلسلية لمتابعة منتج في جميع مراحل دورة التعبئة ، من وضع العلامات على العبوة إلى تغليف اللوحة إلى عملية التحميل على منصات نقالة

.OCR لمقارنة النص الحالي بالسلسلة المتوقعة، كما هو محدد في قاعدة البيانات.يمكنك برمجة تطبيق

OCR ووضع علامة على الأرقام التسلسلية المفقودة أو خارج التسلسل، غالبًا ما يتم استخدام الرموز الشريطية وحروف

. معا لزيادة دقة جمع المعلومات

S

OCR فوائد التعرف الضوئي على حروف

إمكانية البحث

.doc، .rtf، .txt، pdf.يمكنك ايضاً حفظ الملف الممسوح ضوئيًا في شكل

وما إلى ذلك بعد تحويل الملف الممسوح ضوئيًا إلى نص يمكن قراءته، يمكن بعد ذلك البحث في هذه الملفات بسهولة باستخدام أي نظام تقريبًا

OCR قابلية التحرير باستخدام حروف

OCR قد ترغب في تعديل عقد قديم كتبته منذ سنوات أو مراجعة وصية قديمة، بعد رقمنة المستند الخاص بك باستخدام

.يمكنك تحريره بسهولة باستخدام معالج النصوص بدلاً من كتابة المستند بأكمله

إمكانية الوصول

بمجرد إتاحة الوصول إلى مستند ممسوح ضوئيًا، باستخدام تقنية التعرف الضوئي على الحروف على قاعدة بيانات مشتركة. يصبح في متناول أي شخص لديه إمكانية الوصول إلى قاعدة البيانات هذه. هذا مفيد بشكل خاص للبنوك التي يمكنها التحقق من السجل الائتماني السابق للعميل؛ في أي وقت وفي أي مكان يمكن أن يكون الاستخدام الآخر هو إتاحة المحفوظات الحكومية، بحيث يمكن العثور على سجل ملكية الأراضي والممتلكات أو شهادة ميلاد جدك على الفور من أي مكان.

الاستقرار

تقلل الرقمنة المساحة المطلوبة للتخزين من غرفة بأكملها، وإن لم يكن “غرف”. إلى وحدات بايت على الخادم للسماح بمزيد من الإنتاجية. أيضًا؛ يمكن الآن إعادة تدوير أرشيف الورق عديم الفائدة (الآن)

النسخ الاحتياطية

بدلاً من الاحتفاظ بنسخ ورقية مكررة، وثلاث نسخ في شكل ورقي. يمكن عمل نسخ احتياطية رقمية بثمن بخس وربما غير محدود

بالإضافة إلى ذلك، يوفر التعرف الضوئي على الحروف مزيدًا من الاستدامة في إدارة الوثائق

الترجمة

يمكن إدارة عدد كبير من اللغات، من العربية إلى الهندية إلى الصينية. هذا يعني أنه يمكن البحث عن ورقة، بلغة واحدة، ورقمنتها Unicode Standard وترجمتها بأي لغة أخرى تم تبسيط هذا العمل باستخدام

(Google على سبيل المثال: الترجمة من )وبرنامج ترجمة الكمبيوتر استنادًا إلى التعلم الآلي

لذلك، يمكننا تقريبًا التخلص من الحاجة إلى مترجمين محترفين

OCR في مجال العمل كيف يساعد التعرف الضوئي على حروف

يتميز بالعديد من المزايا باعتباره خطوة نحو الرقمنة. في مجال الأعمال التجارية، غالبًا ما يكون هناك حجم كبير جدًا من البيانات والمستندات، سواء كانت متعلقة بالعقود، أو قسائم الشحن، أو النماذج الحكومية، أو التراخيص، أو الشهادات، أو جداول التعريفات، أو الكتالوجات، إلخ

بعد الرقمنة، يمكنك مقارنتها بالعديد من المستندات الرقمية الأخرى، حتى تتمكن من الحصول على أفضل الأسعار والخدمات والشروط والأحكام، وما إلى ذلك بسهولة عن طريق مقارنة المستندات

ويمكنك التحقق من الشروط والأحكام الأصلية في العقد الموقع. ويمكن أيضًا التحقق من الشيكات للكمية المناسبة، ومقارنة الفواتير، إلخ

وأيضًا، من خلال تحويل المستندات رقميًا، يمكنك جعلها في المتناول لإجراء تحليل أكثر تقدمًا، والذي يمكن أن يطلعك على التحسينات طويلة المدى في عملك. يمكنك اكتشاف مقدار الخسائر، والتهرب الضريبي، أو المدفوعات الزائدة، وغير ذلك الكثير، مما يسمح بتوفير كبير في السعر؛ وهذه حقًا مزايا الرقمنة، لكن التعرف الضوئي على الحروف يعد مرحلة أولى حاسمة في تحويل السجلات التناظري