ভুল বাংলা ঠিক করবে ‘সঠিক’

এটি একটি তথ্যভিত্তিক অ্যাপ এবং মেশিং লার্নিং ব্যবস্থা। এর সাহায্যকারী হিসেবে রয়েছে কৃত্রিম বুদ্ধিমত্তা। অ্যাপ্লিকেশনটি ভালোভাবে তৈরির পর আরও উন্নয়নের কাজে বিশাল তথ্যভাণ্ডার ও মডেল ব্যবহৃত হয়।
বাংলা লেখার ভুল শোধরাতে এলো অনলাইন টুল ‘সঠিক’
ছবি: সংগৃহীত

অনলাইন যোগাযোগের দুনিয়ায় স্পষ্ট ও সঠিকভাবে লেখাটা খুব জরুরি, তা সে মেইল, ব্লগ পোস্ট বা সামাজিক যোগাযোগমাধ্যমের আপডেট– যাই হোক না কেন। লিখিত বার্তাটা হতে হবে সংক্ষিপ্ত, মিথস্ক্রিয়ামূলক এবং নির্ভুল। বাংলার মতো ভাষার ক্ষেত্রে এটি আরও বেশি প্রযোজ্য, যা কি না বিশ্বব্যাপী লাখো মানুষের মুখের ভাষা হওয়া সত্ত্বেও এর সাহায্যকারী ডিজিটাল টুলের সংখ্যা পর্যাপ্ত নয়।  

আর এই অপর্যাপ্ততা ঘোচাতেই আবির্ভাব হলো 'সঠিক'-এর। এটি বাংলাভাষী লেখকদের জন্য ক্লাউডভিত্তিক এমন একটি সহায়ক মাধ্যম, যা বর্তমান সময়ে বাংলা লেখার গল্পটাই পাল্টে দেবে। বৈশ্বিক পরিসরে জনপ্রিয় রাইটিং টুল গ্রামারলির মতো সঠিক বানান, ব্যাকরণ, যতিচিহ্ন, লেখার স্পষ্টতা ইত্যাদি বিষয় দেখে ভুল খুঁজে বের করে এবং শোধরানোর বিভিন্ন পরামর্শ দেবে।

বাংলা ভাষার ব্যাকরণে নিজস্ব যে সব নিয়ম-নীতি আছে, যা নিজস্ব ভাষাভাষী বক্তা ও পেশাদার লেখকদের জন্যেও অনেক ক্ষেত্রে বেশ কঠিন। ইংরেজি লেখকদের জন্য এত এত ডিজিটাল টুল থাকলেও বাজারে এর আগ পর্যন্ত বাংলার জন্য এমন কিছুই আসেনি। এই শূন্যস্থান পূরণ করতেই এসেছে সঠিক। এই সফটওয়্যারটি বাংলা লেখা স্ক্যানের পাশাপাশি সম্ভাব্য ত্রুটি শনাক্ত করতে মেশিন লার্নিং অ্যালগরিদম ব্যবহার করে থাকে। তাই ঝামেলাটা বানান নিয়ে হোক বা ক্রিয়ার কাল, যতিচিহ্ন– সঠিক সব সময়ই সঠিক পরামর্শ দিয়ে লেখালেখির মান আরও উন্নত করতে সক্ষম।

সঠিক মূলত আইসিটি বিভাগের আওতাধীন বাংলাদেশ কম্পিউটারের 'এনহ্যান্সমেন্ট অব বাংলা ল্যাঙ্গুয়েজ ইন আইসিটি' বা 'আইসিটিতে বাংলা ভাষার সমৃদ্ধি' শীর্ষক প্রকল্পের একটি উপজাত। এই সরকারি প্রকল্পটি ২০১৭ সাল থেকে চালু রয়েছে। বিশেষত 'স্পেল চেকার' বা বানান সংশোধনকারী ফিচারটির উন্নয়নকাজ শুরু হয় ২০১৯ সালে। এই প্রকল্পের উদ্দেশ্য হচ্ছে বাংলা ভাষার সমৃদ্ধি ঘটিয়ে বিশ্বমাধ্যমে এর বিশেষ স্থান তৈরি করা। 

বাংলা ভাষায় লেখালেখি ও তা প্রকাশের সব রকম বাধাবিপত্তি দূর করাও এ প্রকল্পের আরেকটি লক্ষ্য। তাই সঠিক-এর পরিকল্পনা করা হয়ে একটি বাংলা কম্পিউটিং মডিউল হিসেবে। এবং এটি যাতে জনপরিসরে চাহিদা পূরণে সক্ষম হয়, সেটিও মাথায় রাখা হয়েছিল।

'সঠিক'-এর বিকাশ

এটি একটি তথ্যভিত্তিক অ্যাপ এবং মেশিং লার্নিং ব্যবস্থা। এর সাহায্যকারী হিসেবে রয়েছে কৃত্রিম বুদ্ধিমত্তা। অ্যাপ্লিকেশনটি ভালোভাবে তৈরির পর আরও উন্নয়নের কাজে বিশাল তথ্যভাণ্ডার ও মডেল ব্যবহৃত হয়।

মডেলটি প্রস্তুতের আগে নির্মাণকারী দল বাংলা একটি নির্দিষ্ট পরিমাণ টেক্সচুয়াল বা পাঠ্য ডেটাকে এনএলপি, অর্থাৎ ন্যাচারাল লার্নিং প্রবলেম হিসেবে চিহ্নিত করে। অবশ্য সেই তথ্যভাণ্ডারে এমন বহু সমস্যা ছিল, যার সমাধান করতে করতে সঠিক এ কাজে দক্ষ হয়ে ওঠে। 

মডেলিং প্রক্রিয়া ছাড়াও অ্যালগরিদম, সফটওয়্যার, ম্যানুয়াল ডেটা প্রসেসিং ছিল এই অ্যাপ্লিকেশনের মূল কাজ। এসব অত্যন্ত একঘেয়ে এবং সময়সাপেক্ষ কাজগুলো করেন এ বিষয়ে দায়িত্বপ্রাপ্ত কনসাল্টিং ফার্মের এক দল নিবেদিতপ্রাণ ভাষাবিদ। একটি গণমুখী মেশিন লার্নিং-ভিত্তিক অ্যাপ্লিকেশন পরিচালনার পথে বহু চ্যালেঞ্জ রয়েছে। সেসব চ্যালেঞ্জের সম্মুখীন হয়েও সফটওয়্যার দলটি এর অবকাঠামো তৈরির জন্য কঠোর পরিশ্রম করেছে। এ ছাড়া 'সঠিক'কে সুষ্ঠুভাবে চালিয়ে যাওয়ার জন্য তারা মূল প্রকল্পটিকেও আরও শক্তিশালী করে।

যেহেতু 'সঠিক' একটি সরকারি প্রকল্পের ফসল, এর পরিকল্পনা ও প্রাথমিক নকশা ইবিএলআইসিটি দ্বারা নির্ধারণ করে দেওয়া হয়। ইবিএলআইসিটি ১৬টি বিষয়ের অন্তর্ভুক্ত ৪০টিরও বেশি ডিজিটাল টুল ও রিসোর্স তৈরি করছে। সঠিকও সেগুলোর মধ্যে একটি।

সঠিক-এর সফটওয়্যার উন্নয়নের জন্য অংশীদার হচ্ছে 'রিভ'। বুয়েটের সিএসই বিভাগেও মনোনীত কনসাল্টেন্ট হিসেবে সফটওয়্যারের বিভিন্ন পরীক্ষা-নিরীক্ষায় কাজ করছে। এ ছাড়া প্রকল্পটির সব ধরনের কাজই একটি বিশেষজ্ঞ কমিটি দ্বারা যাচাই করা হয়। 

আরও কিছু দুর্দান্ত প্রকল্প

এই দলটি কৃত্রিম বুদ্ধিমত্তা-নির্ভর এনএলপি ও কম্পিউটার ভিশন সংক্রান্ত বেশ কিছু অ্যাপ্লিকেশন, যেমন– বাংলা ওসিআর এবং হাতের লেখা শনাক্তকরণ ব্যবস্থা গড়ে তুলছে। এটি মূলত বিভিন্ন রূপে, অর্থাৎ 'টেক্সট', 'স্পিচ টু টেক্সট' ও 'টেক্সট টু স্পিচ' অ্যাপ্লিকেশনে বাংলা ভাষার বিভিন্ন বার্তার আবেগীয় মূল্যায়ন, শ্রবণ ও বাক প্রতিবন্ধীদের জন্য বাংলা সাংকেতিক ভাষা শনাক্তকারী ব্যবস্থা, দৃষ্টি প্রতিবন্ধীদের জন্য স্ক্রিন রিডার এবং ব্রেইল পদ্ধতি তৈরি এবং বাংলাদেশের মোট ৪০টি ভাষাকে ডিজিটাইজ করার জন্য বাংলা ন্যাশনাল কর্পাস ডেভেলপমেন্টের একটি প্রকল্প, যার মধ্যে ১৪টি বিলুপ্তপ্রায় আদিবাসী ভাষা রয়েছে।

এ ছাড়া দলটি সবগুলো ভাষা ও লেআউটের জন্য একটি বৈশ্বিক কি-বোর্ডও ডেভেলপ করেছে। বর্তমানে গবেষক ও প্রকৌশলীদের জন্য সহায়ক টুল হিসেবে বাংলা ট্রিব্যাংক ও বিভিন্ন ল্যাঙ্গুয়েজ মডেল ডেভেলপমেন্ট, লেবেলিং, মাঠ পর্যায়ে তথ্য সংগ্রহের ব্যবস্থা ও ট্যাগিং প্ল্যাটফর্ম তৈরি করছে। একটি সংক্ষিপ্ত ই-মেইল সাক্ষাৎকারে দলটি জানায়, শিগগিরই এমন কিছু শক্তিশালী প্রকল্প শুরু হবে, যার মধ্যে রয়েছে মেশিন ট্রান্সলেটর এবং বাংলা ভার্চুয়াল প্রাইভেট অ্যাসিস্টেন্ট। এই প্রকল্পগুলোর অধিকাংশই ইতোমধ্যে ডেভেলপ করা হয়ে গেছে এবং বেটা-রিলিজের জন্য অপেক্ষায় রয়েছে। আশা করা যায়, এসব টুল সম্পূর্ণ প্রস্তুত হয়ে গেলে তথ্য-প্রযুক্তির জগতে বাংলা ভাষা আরও ছড়িয়ে পড়বে।

তারা আরও জানান, বিশ্বের যেকোনো প্রান্তের বাংলাভাষীদের জন্যই সঠিক পুরোপুরি বিনামূল্যে ব্যবহার করা যাবে। দলটি আশাবাদী যে, মুদ্রণ, প্রকাশ ও শিক্ষাক্ষেত্রে সরকারি প্রতিষ্ঠানগুলো সঠিক ব্যবহারের মাধ্যমে উপকৃত হবে। এ বিষয়ে তাদের চূড়ান্ত লক্ষ্য হচ্ছে জনপরিসরে বিনামূল্যে ব্যবহারের জন্য একটি উঁচু মানের বানান ও ব্যাকরণ সংশোধনকারী সফটওয়্যার ডেভেলপ করা। 

 

অনুবাদ করেছেন অনিন্দিতা চৌধুরী
 

Comments

The Daily Star  | English

Saber Hossain Chowdhury arrested

The Detective Branch of police arrested former environment minister Saber Hossain Chowdhury from the capital’s Gulshan area today

59m ago