ভুল বাংলা ঠিক করবে ‘সঠিক’

এটি একটি তথ্যভিত্তিক অ্যাপ এবং মেশিং লার্নিং ব্যবস্থা। এর সাহায্যকারী হিসেবে রয়েছে কৃত্রিম বুদ্ধিমত্তা। অ্যাপ্লিকেশনটি ভালোভাবে তৈরির পর আরও উন্নয়নের কাজে বিশাল তথ্যভাণ্ডার ও মডেল ব্যবহৃত হয়।
বাংলা লেখার ভুল শোধরাতে এলো অনলাইন টুল ‘সঠিক’
ছবি: সংগৃহীত

অনলাইন যোগাযোগের দুনিয়ায় স্পষ্ট ও সঠিকভাবে লেখাটা খুব জরুরি, তা সে মেইল, ব্লগ পোস্ট বা সামাজিক যোগাযোগমাধ্যমের আপডেট– যাই হোক না কেন। লিখিত বার্তাটা হতে হবে সংক্ষিপ্ত, মিথস্ক্রিয়ামূলক এবং নির্ভুল। বাংলার মতো ভাষার ক্ষেত্রে এটি আরও বেশি প্রযোজ্য, যা কি না বিশ্বব্যাপী লাখো মানুষের মুখের ভাষা হওয়া সত্ত্বেও এর সাহায্যকারী ডিজিটাল টুলের সংখ্যা পর্যাপ্ত নয়।  

আর এই অপর্যাপ্ততা ঘোচাতেই আবির্ভাব হলো 'সঠিক'-এর। এটি বাংলাভাষী লেখকদের জন্য ক্লাউডভিত্তিক এমন একটি সহায়ক মাধ্যম, যা বর্তমান সময়ে বাংলা লেখার গল্পটাই পাল্টে দেবে। বৈশ্বিক পরিসরে জনপ্রিয় রাইটিং টুল গ্রামারলির মতো সঠিক বানান, ব্যাকরণ, যতিচিহ্ন, লেখার স্পষ্টতা ইত্যাদি বিষয় দেখে ভুল খুঁজে বের করে এবং শোধরানোর বিভিন্ন পরামর্শ দেবে।

বাংলা ভাষার ব্যাকরণে নিজস্ব যে সব নিয়ম-নীতি আছে, যা নিজস্ব ভাষাভাষী বক্তা ও পেশাদার লেখকদের জন্যেও অনেক ক্ষেত্রে বেশ কঠিন। ইংরেজি লেখকদের জন্য এত এত ডিজিটাল টুল থাকলেও বাজারে এর আগ পর্যন্ত বাংলার জন্য এমন কিছুই আসেনি। এই শূন্যস্থান পূরণ করতেই এসেছে সঠিক। এই সফটওয়্যারটি বাংলা লেখা স্ক্যানের পাশাপাশি সম্ভাব্য ত্রুটি শনাক্ত করতে মেশিন লার্নিং অ্যালগরিদম ব্যবহার করে থাকে। তাই ঝামেলাটা বানান নিয়ে হোক বা ক্রিয়ার কাল, যতিচিহ্ন– সঠিক সব সময়ই সঠিক পরামর্শ দিয়ে লেখালেখির মান আরও উন্নত করতে সক্ষম।

সঠিক মূলত আইসিটি বিভাগের আওতাধীন বাংলাদেশ কম্পিউটারের 'এনহ্যান্সমেন্ট অব বাংলা ল্যাঙ্গুয়েজ ইন আইসিটি' বা 'আইসিটিতে বাংলা ভাষার সমৃদ্ধি' শীর্ষক প্রকল্পের একটি উপজাত। এই সরকারি প্রকল্পটি ২০১৭ সাল থেকে চালু রয়েছে। বিশেষত 'স্পেল চেকার' বা বানান সংশোধনকারী ফিচারটির উন্নয়নকাজ শুরু হয় ২০১৯ সালে। এই প্রকল্পের উদ্দেশ্য হচ্ছে বাংলা ভাষার সমৃদ্ধি ঘটিয়ে বিশ্বমাধ্যমে এর বিশেষ স্থান তৈরি করা। 

বাংলা ভাষায় লেখালেখি ও তা প্রকাশের সব রকম বাধাবিপত্তি দূর করাও এ প্রকল্পের আরেকটি লক্ষ্য। তাই সঠিক-এর পরিকল্পনা করা হয়ে একটি বাংলা কম্পিউটিং মডিউল হিসেবে। এবং এটি যাতে জনপরিসরে চাহিদা পূরণে সক্ষম হয়, সেটিও মাথায় রাখা হয়েছিল।

'সঠিক'-এর বিকাশ

এটি একটি তথ্যভিত্তিক অ্যাপ এবং মেশিং লার্নিং ব্যবস্থা। এর সাহায্যকারী হিসেবে রয়েছে কৃত্রিম বুদ্ধিমত্তা। অ্যাপ্লিকেশনটি ভালোভাবে তৈরির পর আরও উন্নয়নের কাজে বিশাল তথ্যভাণ্ডার ও মডেল ব্যবহৃত হয়।

মডেলটি প্রস্তুতের আগে নির্মাণকারী দল বাংলা একটি নির্দিষ্ট পরিমাণ টেক্সচুয়াল বা পাঠ্য ডেটাকে এনএলপি, অর্থাৎ ন্যাচারাল লার্নিং প্রবলেম হিসেবে চিহ্নিত করে। অবশ্য সেই তথ্যভাণ্ডারে এমন বহু সমস্যা ছিল, যার সমাধান করতে করতে সঠিক এ কাজে দক্ষ হয়ে ওঠে। 

মডেলিং প্রক্রিয়া ছাড়াও অ্যালগরিদম, সফটওয়্যার, ম্যানুয়াল ডেটা প্রসেসিং ছিল এই অ্যাপ্লিকেশনের মূল কাজ। এসব অত্যন্ত একঘেয়ে এবং সময়সাপেক্ষ কাজগুলো করেন এ বিষয়ে দায়িত্বপ্রাপ্ত কনসাল্টিং ফার্মের এক দল নিবেদিতপ্রাণ ভাষাবিদ। একটি গণমুখী মেশিন লার্নিং-ভিত্তিক অ্যাপ্লিকেশন পরিচালনার পথে বহু চ্যালেঞ্জ রয়েছে। সেসব চ্যালেঞ্জের সম্মুখীন হয়েও সফটওয়্যার দলটি এর অবকাঠামো তৈরির জন্য কঠোর পরিশ্রম করেছে। এ ছাড়া 'সঠিক'কে সুষ্ঠুভাবে চালিয়ে যাওয়ার জন্য তারা মূল প্রকল্পটিকেও আরও শক্তিশালী করে।

যেহেতু 'সঠিক' একটি সরকারি প্রকল্পের ফসল, এর পরিকল্পনা ও প্রাথমিক নকশা ইবিএলআইসিটি দ্বারা নির্ধারণ করে দেওয়া হয়। ইবিএলআইসিটি ১৬টি বিষয়ের অন্তর্ভুক্ত ৪০টিরও বেশি ডিজিটাল টুল ও রিসোর্স তৈরি করছে। সঠিকও সেগুলোর মধ্যে একটি।

সঠিক-এর সফটওয়্যার উন্নয়নের জন্য অংশীদার হচ্ছে 'রিভ'। বুয়েটের সিএসই বিভাগেও মনোনীত কনসাল্টেন্ট হিসেবে সফটওয়্যারের বিভিন্ন পরীক্ষা-নিরীক্ষায় কাজ করছে। এ ছাড়া প্রকল্পটির সব ধরনের কাজই একটি বিশেষজ্ঞ কমিটি দ্বারা যাচাই করা হয়। 

আরও কিছু দুর্দান্ত প্রকল্প

এই দলটি কৃত্রিম বুদ্ধিমত্তা-নির্ভর এনএলপি ও কম্পিউটার ভিশন সংক্রান্ত বেশ কিছু অ্যাপ্লিকেশন, যেমন– বাংলা ওসিআর এবং হাতের লেখা শনাক্তকরণ ব্যবস্থা গড়ে তুলছে। এটি মূলত বিভিন্ন রূপে, অর্থাৎ 'টেক্সট', 'স্পিচ টু টেক্সট' ও 'টেক্সট টু স্পিচ' অ্যাপ্লিকেশনে বাংলা ভাষার বিভিন্ন বার্তার আবেগীয় মূল্যায়ন, শ্রবণ ও বাক প্রতিবন্ধীদের জন্য বাংলা সাংকেতিক ভাষা শনাক্তকারী ব্যবস্থা, দৃষ্টি প্রতিবন্ধীদের জন্য স্ক্রিন রিডার এবং ব্রেইল পদ্ধতি তৈরি এবং বাংলাদেশের মোট ৪০টি ভাষাকে ডিজিটাইজ করার জন্য বাংলা ন্যাশনাল কর্পাস ডেভেলপমেন্টের একটি প্রকল্প, যার মধ্যে ১৪টি বিলুপ্তপ্রায় আদিবাসী ভাষা রয়েছে।

এ ছাড়া দলটি সবগুলো ভাষা ও লেআউটের জন্য একটি বৈশ্বিক কি-বোর্ডও ডেভেলপ করেছে। বর্তমানে গবেষক ও প্রকৌশলীদের জন্য সহায়ক টুল হিসেবে বাংলা ট্রিব্যাংক ও বিভিন্ন ল্যাঙ্গুয়েজ মডেল ডেভেলপমেন্ট, লেবেলিং, মাঠ পর্যায়ে তথ্য সংগ্রহের ব্যবস্থা ও ট্যাগিং প্ল্যাটফর্ম তৈরি করছে। একটি সংক্ষিপ্ত ই-মেইল সাক্ষাৎকারে দলটি জানায়, শিগগিরই এমন কিছু শক্তিশালী প্রকল্প শুরু হবে, যার মধ্যে রয়েছে মেশিন ট্রান্সলেটর এবং বাংলা ভার্চুয়াল প্রাইভেট অ্যাসিস্টেন্ট। এই প্রকল্পগুলোর অধিকাংশই ইতোমধ্যে ডেভেলপ করা হয়ে গেছে এবং বেটা-রিলিজের জন্য অপেক্ষায় রয়েছে। আশা করা যায়, এসব টুল সম্পূর্ণ প্রস্তুত হয়ে গেলে তথ্য-প্রযুক্তির জগতে বাংলা ভাষা আরও ছড়িয়ে পড়বে।

তারা আরও জানান, বিশ্বের যেকোনো প্রান্তের বাংলাভাষীদের জন্যই সঠিক পুরোপুরি বিনামূল্যে ব্যবহার করা যাবে। দলটি আশাবাদী যে, মুদ্রণ, প্রকাশ ও শিক্ষাক্ষেত্রে সরকারি প্রতিষ্ঠানগুলো সঠিক ব্যবহারের মাধ্যমে উপকৃত হবে। এ বিষয়ে তাদের চূড়ান্ত লক্ষ্য হচ্ছে জনপরিসরে বিনামূল্যে ব্যবহারের জন্য একটি উঁচু মানের বানান ও ব্যাকরণ সংশোধনকারী সফটওয়্যার ডেভেলপ করা। 

 

অনুবাদ করেছেন অনিন্দিতা চৌধুরী
 

Comments

The Daily Star  | English

To Europe Via Libya: A voyage fraught with peril

An undocumented Bangladeshi migrant worker choosing to enter Europe from Libya, will almost certainly be held captive by armed militias, tortured, and their families extorted for lakhs of taka.

4h ago