'সহায় আৰু নিৰ্দেশাৱলী': অ'চিআৰ
ৱিকিউৎসত কিতাপ এখনৰ স্কেন প্ৰতিলিপিক ইউনিক'ড আখৰলৈ কেনেকৈ সলাব পাৰি।

Optical Character Recognition (OCR) প্ৰক্ৰিয়াই pdf/djvu/jpg ফাইলৰ স্কেন ছবি এখনৰ পৰা আখৰৰ চিহ্নক ইউনিক'ড চিহ্নলৈ পৰিৱৰ্তিত কৰিব পাৰে। গতিকে ছবি এখনত থকা অসমীয়া আখৰবোৰ মেনুৱেলী টাইপ কৰি থকাৰ সলনি এই প্ৰক্ৰিয়ালৈ কামটো উজু আৰু খৰতকীয়া কৰি তোলে। ভাৰতীয় ভাষাবোৰৰ বাবে ২০১৫ চনৰ মাজভাগলৈকে কোনো সন্তোষজনক OCR উপলব্ধ নাছিল। তাৰ পাছত গুগলে ভাৰতীয় ভাষাবোৰৰ বাবেও OCR সেৱা মুকলি কৰে আৰু এতিয়া ভাৰতীয় ৱিকিউৎসমূহে সেই সুবিধাকে ব্যৱহাৰ কৰি আছে।

OCRৰ সহায়ত পাঠ্য সংযোগ

সম্পাদনা কৰক

অ'চিআৰ সঁজুলিটো অসমীয়া ৱিকিউৎসৰ সকলো ব্যৱহাৰকাৰীৰ বাবে পৃষ্ঠা নামস্থানত উপলভ্য। উদাহৰণস্বৰূপে পাঠ্য সংযোগৰ আগতে সূচী:অসমীয়া সাহিত্যৰ চানেকি (দ্বিতীয় খণ্ড, দ্বিতীয় ভাগ)ৰ ২৫১ নং পৃষ্ঠা খুলিলে (পৃষ্ঠা:অসমীয়া সাহিত্যৰ চানেকি v2p2.djvu/২৫১) তলৰ দিয়াৰ দৰে দেখা পাব।

 

OCR বুটামটো হালধীয়া বৃত্তৰে ঘেৰি দেখুওৱা হৈছে। এই বুটামটো ক্লিক কৰিলে "গুগল অ'চিআৰৰ পৰা পাঠ আহৰণ কৰি থকা হৈছে" বুলি বাৰ্তা দেখা পাব আৰু দুই ছেকেণ্ডমানৰ পাছতে তলত দিয়াৰ দৰে পাঠ্য দৃশ্যমান হ'ব।

 

ইউনিক'ড সংশোধন

সম্পাদনা কৰক

অ'চিআৰৰ সহায়ত পাঠ্য আহৰণ কৰাৰ পাছত রকে ধৰি কিছুমান ত্ৰুটি থাকি যায় (সহায়:মুদ্ৰণ সংশোধন# সাধাৰণ OCR ত্ৰুটিসমূহ দ্ৰষ্টব্য)। গতিকে পৃষ্ঠাটো সাঁচি থোৱাৰ আগতে ইয়াৰ সংশোধনৰ প্ৰয়োজন। এনে কৰিবলৈ OCR বুটামৰ কাষতে থকা উজ্জ্বল ৰঙা ৰঙৰ "ৰ" বুটামটো এবাৰ ক্লিক কৰিব আৰু তাৰ পাছত পৃষ্ঠাটো সাঁচি থ'ব।

 

File:As wikisource OCS tool.jpg

Indic OCR সঁজুলি

সম্পাদনা কৰক

কেতিয়াবা কিবা কাৰণত কোনো ব্যৱহাৰকাৰীয়ে সাধাৰণ অ'চিআৰ সঁজুলিটো দেখা নাপাব পাৰে বা সঁজুলিটোৱে ভালকৈ কাম নকৰিব পাৰে। তেনে ক্ষেত্ৰত গুগল ড্ৰাইভ APIৰ সহায়ত সজা ইণ্ডিক অ'চিআৰ সঁজুলিটো ব্যৱহাৰ কৰিব পাৰি। ইয়াৰ বাবে প্ৰথমে পছন্দসমূহৰ গেজেট পৃষ্ঠালৈ গৈ ইণ্ডিক OCR সঁজুলিটো সক্ৰিয় কৰি ল’ব লাগিব। নাইবা ব্যৱহাৰকাৰীজনে নিজৰ সদস্য পৃষ্ঠাত common.js পৃষ্ঠা এটা সৃষ্টি কৰিব লাগিব। অৰ্থাৎ ব্যৱহাৰকাৰীগৰাকীৰ সদস্যনাম "অমুক" হ'লে "সদস্য:অমুক/common.js" (উৰ্ধকমা অবিহনে) নামৰ পৃষ্ঠা এটা সৃষ্টি কৰি এই সংকেতখিনি তালৈ প্ৰতিলিপি কৰিব: mw.loader.load('//meta.wikimedia.org/w/index.php?title=User:Indic-TechCom/Script/IndicOCR.js&action=raw&ctype=text/javascript');

এতিয়া পৃষ্ঠাটো সাঁচি থ'ব। ব্ৰাউজাৰ কেশ্ব খালি কৰি সম্পাদনা পৃষ্ঠা এটালৈ গ'লে (যেনে- পৃষ্ঠা:অসমীয়া সাহিত্যৰ চানেকি v2p2.djvu/২৫২) তলৰ হালধীয়া বৃত্তৰে ঘেৰি দেখুওৱাৰ দৰে এটা বুটাম দেখা পাব।

 

এই বুটামটো ক্লিক কৰিলেও সাধাৰণ OCR বুটামৰ দৰে কাম কৰিব আৰু কেইছকেণ্ডমানৰ পাছত পাঠ্য দৃশ্যমান হ'ব।

অ’চিএছ হৈছে ইউনিক’ড পাঠ আহৰণৰ লগতে আহৰণ কৰা পাঠসমূহত থাকি যোৱা কিছুমান ত্ৰুটি নিবাৰণ কৰিবৰ বাবে অসমীয়া ৱিকিউৎসৰ সদস্যসকলে নিৰ্মান কৰা এবাৰতে তিনিটা কাম কৰা (3-in-1) এটা সঁজুলি। এই সঁজুলিত ক্লিক কৰাৰ লগে লগে স্কেন পৃষ্ঠাৰ পাঠ আহৰণ কৰাৰ লগতে সঁজুলিটোৱে ৰৈ যোৱা কিছুমান ত্ৰুটি নিবাৰণ কৰে আৰু স্বয়ংক্ৰিয়ভাবে পৃষ্ঠাটো সাঁচিও ৰাখে।

এই সঁজুলিটো ব্যৱহাৰ কৰিবলৈ প্ৰথমে পছন্দসমূহৰ গেজেট পৃষ্ঠালৈ গৈ OCS সঁজুলিটো সক্ৰিয় কৰি ল’ব লাগিব। তাৰ পাছত যিকোনো এটা সম্পাদনা পৃষ্ঠালৈ গ’লে (যেনে- পৃষ্ঠা:অসমীয়া সাহিত্যৰ চানেকি v2p2.djvu/২৫২) তলৰ ৰঙা বৃত্তৰে ঘেৰি দেখুওৱাৰ দৰে এটা বুটাম দেখা পাব।

 

এই বুটামটো ক্লিক কৰিলেই কেইছকেণ্ডমানৰ পাছত স্কেন পৃষ্ঠাৰ পৰা আহৰণ কৰা পাঠ দৃশ্যমান হ'ব আৰু ‘বঙালী ৰ’ প্ৰতিস্থাপন কৰি পৃষ্ঠাটো স্বয়ংক্ৰিয়ভাবে সৃষ্টিও হ’ব।

অ'চিআৰৰ সহায়ত লাভ কৰা পাঠ্য ১০০% শুদ্ধ নহয়। পাঠ্য শুধৰাবৰ বাবে মেনুৱেল মুদ্ৰণ সংশোধন কৰিবই লাগিব। পাঠ্যৰ শুদ্ধতা মূল গ্ৰন্থৰ পৃষ্ঠাৰ অৱস্থা আৰু স্কেন ফাইলৰ প্ৰাঞ্জলতাৰ ওপৰত নিৰ্ভৰ কৰিব।