كثير جدا من مستخدمي الحديثأنظمة الكمبيوتر ، أو بالأحرى ، المصممين ، واجهت مشكلة بطريقة ما عندما تكون هناك حاجة لجعل التعرف على الخط من النص الوارد في بعض الصور. الآن سننظر في بعض الخيارات البسيطة لكيفية القيام بذلك بأقل وقت وجهد.
لنبدأ ، ربما ، بحقيقة أنه ، بشكل عام ، هو ساذجالاعتقاد بأن تعريف الخط هو نفس تعريف النص. خلق OCR في أي محرر أو طباعتها ببساطة على الآلات الكاتبة القديمة، انها مجرد حالة خاصة من تعريف أعم. وحتى مثل برنامج قوي كما ABBYY قارئ الجميلة، فإنه لا يصلح دائما. بالطبع، يمكن فصلها عن شظايا النص الصورة المطلوبة، ومع ذلك، فإن التحليل في معظم الحالات، يتم حصرا على أساس الخطوط القياسية التي هي حقوق عالمية لجميع أنواع برامج تحرير النصوص ومتكاملة بحرية في هذا النوع من التطبيق، ويمكن استخدامها حتى بشكل مستقل عن منصة برمجيات الرئيسية.
ولكن ما يجب القيام به عند الحاجة إلى الاعترافخط تم إنشاؤه يدويًا ، على سبيل المثال ، في تطبيق رسومي أو بشكل عام مرسومة باليد؟ احكم بنفسك ، لأن الفنان يمكن أن يصور أي رسالة كما تريد.
كمثال أبسط ، يمكن للمرء أن يأخذعلى الأقل مجموعات أصلية من الحكايات الشعبية الروسية ، حيث تم وضع كل حرف كبير في بداية الفقرة الأولى من النص برسم منقوش. من كل هذا التراكم يجب أن يختار برنامج الكمبيوتر الرسالة ، ويرميها جانباً كل شيء آخر. في الواقع ، هذا هو السبب في أن التعرف على الخطوط السيريلية ، حتى بالمقارنة مع الهيروغليفية ، هو مهمة صعبة للغاية. ومع ذلك ، هناك بعض الوسائل لذلك.
الآن سوف نتوقف عند عدد قليل من منتجات البرمجيات البسيطة التي تناسب المستخدم من أي مستوى.
بادئ ذي بدء ، تجدر الإشارة إلى تطبيق CuneiForm.وهو برنامج للتعرف على الخطوط ، بما في ذلك السيريلية ، والتي لا تسمح فقط بتحديد اللغة التي ينتمي إليها النص حتى مع وجود خط غير عادي ، بل أيضًا للحفاظ على البنية الأصلية للمستند بأكمله. على سبيل المثال ، إذا تم إنشاؤه في بعض تطبيقات الكمبيوتر ، فإنه يحتوي على بيانات جدولة (بالإضافة إلى الجدول نفسه) ، سيتمكن التطبيق من تحديد مثل هذا الهيكل بسهولة وحفظه عند إخراج النتائج. وينطبق الشيء نفسه على التنسيق المستخدم في المستند.
واحدة من السمات الرئيسية للتطبيقوحقيقة أنه بالإضافة إلى دعم لغات متعددة ، يحتوي البرنامج على قاموس خاص به ، يُستخدم لتحليل النص الذي يتم بعد عملية التعرف على الخط. وفي الوقت نفسه ، يعمل البرنامج بشكل جيد مع مستندات منخفضة الجودة ، على سبيل المثال ، صور قديمة تم مسحها ضوئيًا بنصوص أو مستندات تاريخية. من بين أشياء أخرى ، يمكنك إضافة بيانات جديدة إلى قاعدة بيانات القاموس للاستخدام في وقت لاحق.
يمكن استدعاء تطبيق بسيط جدا وبرنامج تحليل الخطوط. دون الدخول في مبادئ عملها ، دعونا نلاحظ فقط العملية نفسها. هنا ، يحتاج المستخدم ببساطة إلى تنزيل الصورة باستخدام الخط في حقل المحلل ، ثم تنشيط عملية التعرف. هنا "الخدعة" هي أنه بعد تلقي نتيجة الفحص والمعالجة يمكن تحريرها.
Интересной является и система Font Matching Tool.من بين أشياء أخرى ، يُنصح باستخدام هذا التطبيق بالاقتران مع البرنامج Compare It! ، والذي يسمح لك بمقارنة المستند الأصلي والنتيجة مع الخطوط المعترف بها.
بالإضافة إلى البرامج المثبتة على الكمبيوتر ، أويمكن للنسخ المحمولة الخاصة بهم استخدام خدمات العديد من موارد الإنترنت. يشبه التعرف على الخط في الصورة في خطة العمل التطبيقات السابقة. والفرق الوحيد هو أن المستخدم يقوم بتنزيل الصورة مباشرة إلى الموقع ، ويتم تنزيل النتيجة على جهاز الكمبيوتر الخاص به.
من بين الأكثر شعبية وشعبيةتشتمل الخدمات على الأنظمة عبر الإنترنت مثل What The Font و Identifont و Message Boards: Typophile و Bowfin Printworks و Type Navigator و Flickr Typeface Identification والعديد غيرها.
Остается добавить только то, что особо ни на أو على موارد الإنترنت فمن الأفضل عدم الاعتماد. ليست هناك حاجة لتوقع أي شيء خارق منها. احكم بنفسك ، لأنه حتى الكابتشا المعتادة لا يتم التعرف عليها من خلال جميع برامج الروبوت. لكن التشابه مع البرامج المصممة للتعرف على الخط واضح هنا. لذا عند استخدام هذه الأدوات ، يمكنك الاعتماد بشكل أساسي على نتائج تحديد أبسط الخطوط. شيء آخر هو أنها غير معترف بها من مستندات المكتب المطبوعة ، ولكن من الصور. هذا ، في الواقع ، هو الزائد الرئيسي لجميع منتجات وخدمات البرمجيات من هذا النوع.