সহায়:অ'চিআৰ
সূচীকৰণ | 'সহায় আৰু নিৰ্দেশাৱলী': অ'চিআৰ | মুদ্ৰণ সংশোধন |
ৱিকিউৎসত কিতাপ এখনৰ স্কেন প্ৰতিলিপিক ইউনিক'ড আখৰলৈ কেনেকৈ সলাব পাৰি। |
Optical Character Recognition (OCR) প্ৰক্ৰিয়াই pdf/djvu/jpg ফাইলৰ স্কেন ছবি এখনৰ পৰা আখৰৰ চিহ্নক ইউনিক'ড চিহ্নলৈ পৰিৱৰ্তিত কৰিব পাৰে। গতিকে ছবি এখনত থকা অসমীয়া আখৰবোৰ মেনুৱেলী টাইপ কৰি থকাৰ সলনি এই প্ৰক্ৰিয়ালৈ কামটো উজু আৰু খৰতকীয়া কৰি তোলে। ভাৰতীয় ভাষাবোৰৰ বাবে ২০১৫ চনৰ মাজভাগলৈকে কোনো সন্তোষজনক OCR উপলব্ধ নাছিল। তাৰ পাছত গুগলে ভাৰতীয় ভাষাবোৰৰ বাবেও OCR সেৱা মুকলি কৰে আৰু এতিয়া ভাৰতীয় ৱিকিউৎসমূহে সেই সুবিধাকে ব্যৱহাৰ কৰি আছে।
OCRৰ সহায়ত পাঠ্য সংযোগ
সম্পাদনা কৰকঅ'চিআৰ সঁজুলিটো অসমীয়া ৱিকিউৎসৰ সকলো ব্যৱহাৰকাৰীৰ বাবে পৃষ্ঠা নামস্থানত উপলভ্য। উদাহৰণস্বৰূপে পাঠ্য সংযোগৰ আগতে সূচী:অসমীয়া সাহিত্যৰ চানেকি (দ্বিতীয় খণ্ড, দ্বিতীয় ভাগ)ৰ ২৫১ নং পৃষ্ঠা খুলিলে (পৃষ্ঠা:অসমীয়া সাহিত্যৰ চানেকি v2p2.djvu/২৫১) তলৰ দিয়াৰ দৰে দেখা পাব।
OCR বুটামটো হালধীয়া বৃত্তৰে ঘেৰি দেখুওৱা হৈছে। এই বুটামটো ক্লিক কৰিলে "গুগল অ'চিআৰৰ পৰা পাঠ আহৰণ কৰি থকা হৈছে" বুলি বাৰ্তা দেখা পাব আৰু দুই ছেকেণ্ডমানৰ পাছতে তলত দিয়াৰ দৰে পাঠ্য দৃশ্যমান হ'ব।
ইউনিক'ড সংশোধন
সম্পাদনা কৰকঅ'চিআৰৰ সহায়ত পাঠ্য আহৰণ কৰাৰ পাছত রকে ধৰি কিছুমান ত্ৰুটি থাকি যায় (সহায়:মুদ্ৰণ সংশোধন# সাধাৰণ OCR ত্ৰুটিসমূহ দ্ৰষ্টব্য)। গতিকে পৃষ্ঠাটো সাঁচি থোৱাৰ আগতে ইয়াৰ সংশোধনৰ প্ৰয়োজন। এনে কৰিবলৈ OCR বুটামৰ কাষতে থকা উজ্জ্বল ৰঙা ৰঙৰ "ৰ" বুটামটো এবাৰ ক্লিক কৰিব আৰু তাৰ পাছত পৃষ্ঠাটো সাঁচি থ'ব।
File:As wikisource OCS tool.jpg
Indic OCR সঁজুলি
সম্পাদনা কৰককেতিয়াবা কিবা কাৰণত কোনো ব্যৱহাৰকাৰীয়ে সাধাৰণ অ'চিআৰ সঁজুলিটো দেখা নাপাব পাৰে বা সঁজুলিটোৱে ভালকৈ কাম নকৰিব পাৰে। তেনে ক্ষেত্ৰত গুগল ড্ৰাইভ APIৰ সহায়ত সজা ইণ্ডিক অ'চিআৰ সঁজুলিটো ব্যৱহাৰ কৰিব পাৰি। ইয়াৰ বাবে প্ৰথমে পছন্দসমূহৰ গেজেট পৃষ্ঠালৈ গৈ ইণ্ডিক OCR সঁজুলিটো সক্ৰিয় কৰি ল’ব লাগিব। নাইবা ব্যৱহাৰকাৰীজনে নিজৰ সদস্য পৃষ্ঠাত common.js পৃষ্ঠা এটা সৃষ্টি কৰিব লাগিব। অৰ্থাৎ ব্যৱহাৰকাৰীগৰাকীৰ সদস্যনাম "অমুক" হ'লে "সদস্য:অমুক/common.js" (উৰ্ধকমা অবিহনে) নামৰ পৃষ্ঠা এটা সৃষ্টি কৰি এই সংকেতখিনি তালৈ প্ৰতিলিপি কৰিব:
mw.loader.load('//meta.wikimedia.org/w/index.php?title=User:Indic-TechCom/Script/IndicOCR.js&action=raw&ctype=text/javascript');
এতিয়া পৃষ্ঠাটো সাঁচি থ'ব। ব্ৰাউজাৰ কেশ্ব খালি কৰি সম্পাদনা পৃষ্ঠা এটালৈ গ'লে (যেনে- পৃষ্ঠা:অসমীয়া সাহিত্যৰ চানেকি v2p2.djvu/২৫২) তলৰ হালধীয়া বৃত্তৰে ঘেৰি দেখুওৱাৰ দৰে এটা বুটাম দেখা পাব।
এই বুটামটো ক্লিক কৰিলেও সাধাৰণ OCR বুটামৰ দৰে কাম কৰিব আৰু কেইছকেণ্ডমানৰ পাছত পাঠ্য দৃশ্যমান হ'ব।
OCS সঁজুলি
সম্পাদনা কৰকঅ’চিএছ হৈছে ইউনিক’ড পাঠ আহৰণৰ লগতে আহৰণ কৰা পাঠসমূহত থাকি যোৱা কিছুমান ত্ৰুটি নিবাৰণ কৰিবৰ বাবে অসমীয়া ৱিকিউৎসৰ সদস্যসকলে নিৰ্মান কৰা এবাৰতে তিনিটা কাম কৰা (3-in-1) এটা সঁজুলি। এই সঁজুলিত ক্লিক কৰাৰ লগে লগে স্কেন পৃষ্ঠাৰ পাঠ আহৰণ কৰাৰ লগতে সঁজুলিটোৱে ৰৈ যোৱা কিছুমান ত্ৰুটি নিবাৰণ কৰে আৰু স্বয়ংক্ৰিয়ভাবে পৃষ্ঠাটো সাঁচিও ৰাখে।
এই সঁজুলিটো ব্যৱহাৰ কৰিবলৈ প্ৰথমে পছন্দসমূহৰ গেজেট পৃষ্ঠালৈ গৈ OCS সঁজুলিটো সক্ৰিয় কৰি ল’ব লাগিব। তাৰ পাছত যিকোনো এটা সম্পাদনা পৃষ্ঠালৈ গ’লে (যেনে- পৃষ্ঠা:অসমীয়া সাহিত্যৰ চানেকি v2p2.djvu/২৫২) তলৰ ৰঙা বৃত্তৰে ঘেৰি দেখুওৱাৰ দৰে এটা বুটাম দেখা পাব।
এই বুটামটো ক্লিক কৰিলেই কেইছকেণ্ডমানৰ পাছত স্কেন পৃষ্ঠাৰ পৰা আহৰণ কৰা পাঠ দৃশ্যমান হ'ব আৰু ‘বঙালী ৰ’ প্ৰতিস্থাপন কৰি পৃষ্ঠাটো স্বয়ংক্ৰিয়ভাবে সৃষ্টিও হ’ব।
টোকা
সম্পাদনা কৰকঅ'চিআৰৰ সহায়ত লাভ কৰা পাঠ্য ১০০% শুদ্ধ নহয়। পাঠ্য শুধৰাবৰ বাবে মেনুৱেল মুদ্ৰণ সংশোধন কৰিবই লাগিব। পাঠ্যৰ শুদ্ধতা মূল গ্ৰন্থৰ পৃষ্ঠাৰ অৱস্থা আৰু স্কেন ফাইলৰ প্ৰাঞ্জলতাৰ ওপৰত নিৰ্ভৰ কৰিব।