ভুল বাংলা ঠিক করবে ‘সঠিক’

বাংলা লেখার ভুল শোধরাতে এলো অনলাইন টুল ‘সঠিক’
ছবি: সংগৃহীত

অনলাইন যোগাযোগের দুনিয়ায় স্পষ্ট ও সঠিকভাবে লেখাটা খুব জরুরি, তা সে মেইল, ব্লগ পোস্ট বা সামাজিক যোগাযোগমাধ্যমের আপডেট– যাই হোক না কেন। লিখিত বার্তাটা হতে হবে সংক্ষিপ্ত, মিথস্ক্রিয়ামূলক এবং নির্ভুল। বাংলার মতো ভাষার ক্ষেত্রে এটি আরও বেশি প্রযোজ্য, যা কি না বিশ্বব্যাপী লাখো মানুষের মুখের ভাষা হওয়া সত্ত্বেও এর সাহায্যকারী ডিজিটাল টুলের সংখ্যা পর্যাপ্ত নয়।  

আর এই অপর্যাপ্ততা ঘোচাতেই আবির্ভাব হলো 'সঠিক'-এর। এটি বাংলাভাষী লেখকদের জন্য ক্লাউডভিত্তিক এমন একটি সহায়ক মাধ্যম, যা বর্তমান সময়ে বাংলা লেখার গল্পটাই পাল্টে দেবে। বৈশ্বিক পরিসরে জনপ্রিয় রাইটিং টুল গ্রামারলির মতো সঠিক বানান, ব্যাকরণ, যতিচিহ্ন, লেখার স্পষ্টতা ইত্যাদি বিষয় দেখে ভুল খুঁজে বের করে এবং শোধরানোর বিভিন্ন পরামর্শ দেবে।

বাংলা ভাষার ব্যাকরণে নিজস্ব যে সব নিয়ম-নীতি আছে, যা নিজস্ব ভাষাভাষী বক্তা ও পেশাদার লেখকদের জন্যেও অনেক ক্ষেত্রে বেশ কঠিন। ইংরেজি লেখকদের জন্য এত এত ডিজিটাল টুল থাকলেও বাজারে এর আগ পর্যন্ত বাংলার জন্য এমন কিছুই আসেনি। এই শূন্যস্থান পূরণ করতেই এসেছে সঠিক। এই সফটওয়্যারটি বাংলা লেখা স্ক্যানের পাশাপাশি সম্ভাব্য ত্রুটি শনাক্ত করতে মেশিন লার্নিং অ্যালগরিদম ব্যবহার করে থাকে। তাই ঝামেলাটা বানান নিয়ে হোক বা ক্রিয়ার কাল, যতিচিহ্ন– সঠিক সব সময়ই সঠিক পরামর্শ দিয়ে লেখালেখির মান আরও উন্নত করতে সক্ষম।

সঠিক মূলত আইসিটি বিভাগের আওতাধীন বাংলাদেশ কম্পিউটারের 'এনহ্যান্সমেন্ট অব বাংলা ল্যাঙ্গুয়েজ ইন আইসিটি' বা 'আইসিটিতে বাংলা ভাষার সমৃদ্ধি' শীর্ষক প্রকল্পের একটি উপজাত। এই সরকারি প্রকল্পটি ২০১৭ সাল থেকে চালু রয়েছে। বিশেষত 'স্পেল চেকার' বা বানান সংশোধনকারী ফিচারটির উন্নয়নকাজ শুরু হয় ২০১৯ সালে। এই প্রকল্পের উদ্দেশ্য হচ্ছে বাংলা ভাষার সমৃদ্ধি ঘটিয়ে বিশ্বমাধ্যমে এর বিশেষ স্থান তৈরি করা। 

বাংলা ভাষায় লেখালেখি ও তা প্রকাশের সব রকম বাধাবিপত্তি দূর করাও এ প্রকল্পের আরেকটি লক্ষ্য। তাই সঠিক-এর পরিকল্পনা করা হয়ে একটি বাংলা কম্পিউটিং মডিউল হিসেবে। এবং এটি যাতে জনপরিসরে চাহিদা পূরণে সক্ষম হয়, সেটিও মাথায় রাখা হয়েছিল।

'সঠিক'-এর বিকাশ

এটি একটি তথ্যভিত্তিক অ্যাপ এবং মেশিং লার্নিং ব্যবস্থা। এর সাহায্যকারী হিসেবে রয়েছে কৃত্রিম বুদ্ধিমত্তা। অ্যাপ্লিকেশনটি ভালোভাবে তৈরির পর আরও উন্নয়নের কাজে বিশাল তথ্যভাণ্ডার ও মডেল ব্যবহৃত হয়।

মডেলটি প্রস্তুতের আগে নির্মাণকারী দল বাংলা একটি নির্দিষ্ট পরিমাণ টেক্সচুয়াল বা পাঠ্য ডেটাকে এনএলপি, অর্থাৎ ন্যাচারাল লার্নিং প্রবলেম হিসেবে চিহ্নিত করে। অবশ্য সেই তথ্যভাণ্ডারে এমন বহু সমস্যা ছিল, যার সমাধান করতে করতে সঠিক এ কাজে দক্ষ হয়ে ওঠে। 

মডেলিং প্রক্রিয়া ছাড়াও অ্যালগরিদম, সফটওয়্যার, ম্যানুয়াল ডেটা প্রসেসিং ছিল এই অ্যাপ্লিকেশনের মূল কাজ। এসব অত্যন্ত একঘেয়ে এবং সময়সাপেক্ষ কাজগুলো করেন এ বিষয়ে দায়িত্বপ্রাপ্ত কনসাল্টিং ফার্মের এক দল নিবেদিতপ্রাণ ভাষাবিদ। একটি গণমুখী মেশিন লার্নিং-ভিত্তিক অ্যাপ্লিকেশন পরিচালনার পথে বহু চ্যালেঞ্জ রয়েছে। সেসব চ্যালেঞ্জের সম্মুখীন হয়েও সফটওয়্যার দলটি এর অবকাঠামো তৈরির জন্য কঠোর পরিশ্রম করেছে। এ ছাড়া 'সঠিক'কে সুষ্ঠুভাবে চালিয়ে যাওয়ার জন্য তারা মূল প্রকল্পটিকেও আরও শক্তিশালী করে।

যেহেতু 'সঠিক' একটি সরকারি প্রকল্পের ফসল, এর পরিকল্পনা ও প্রাথমিক নকশা ইবিএলআইসিটি দ্বারা নির্ধারণ করে দেওয়া হয়। ইবিএলআইসিটি ১৬টি বিষয়ের অন্তর্ভুক্ত ৪০টিরও বেশি ডিজিটাল টুল ও রিসোর্স তৈরি করছে। সঠিকও সেগুলোর মধ্যে একটি।

সঠিক-এর সফটওয়্যার উন্নয়নের জন্য অংশীদার হচ্ছে 'রিভ'। বুয়েটের সিএসই বিভাগেও মনোনীত কনসাল্টেন্ট হিসেবে সফটওয়্যারের বিভিন্ন পরীক্ষা-নিরীক্ষায় কাজ করছে। এ ছাড়া প্রকল্পটির সব ধরনের কাজই একটি বিশেষজ্ঞ কমিটি দ্বারা যাচাই করা হয়। 

আরও কিছু দুর্দান্ত প্রকল্প

এই দলটি কৃত্রিম বুদ্ধিমত্তা-নির্ভর এনএলপি ও কম্পিউটার ভিশন সংক্রান্ত বেশ কিছু অ্যাপ্লিকেশন, যেমন– বাংলা ওসিআর এবং হাতের লেখা শনাক্তকরণ ব্যবস্থা গড়ে তুলছে। এটি মূলত বিভিন্ন রূপে, অর্থাৎ 'টেক্সট', 'স্পিচ টু টেক্সট' ও 'টেক্সট টু স্পিচ' অ্যাপ্লিকেশনে বাংলা ভাষার বিভিন্ন বার্তার আবেগীয় মূল্যায়ন, শ্রবণ ও বাক প্রতিবন্ধীদের জন্য বাংলা সাংকেতিক ভাষা শনাক্তকারী ব্যবস্থা, দৃষ্টি প্রতিবন্ধীদের জন্য স্ক্রিন রিডার এবং ব্রেইল পদ্ধতি তৈরি এবং বাংলাদেশের মোট ৪০টি ভাষাকে ডিজিটাইজ করার জন্য বাংলা ন্যাশনাল কর্পাস ডেভেলপমেন্টের একটি প্রকল্প, যার মধ্যে ১৪টি বিলুপ্তপ্রায় আদিবাসী ভাষা রয়েছে।

এ ছাড়া দলটি সবগুলো ভাষা ও লেআউটের জন্য একটি বৈশ্বিক কি-বোর্ডও ডেভেলপ করেছে। বর্তমানে গবেষক ও প্রকৌশলীদের জন্য সহায়ক টুল হিসেবে বাংলা ট্রিব্যাংক ও বিভিন্ন ল্যাঙ্গুয়েজ মডেল ডেভেলপমেন্ট, লেবেলিং, মাঠ পর্যায়ে তথ্য সংগ্রহের ব্যবস্থা ও ট্যাগিং প্ল্যাটফর্ম তৈরি করছে। একটি সংক্ষিপ্ত ই-মেইল সাক্ষাৎকারে দলটি জানায়, শিগগিরই এমন কিছু শক্তিশালী প্রকল্প শুরু হবে, যার মধ্যে রয়েছে মেশিন ট্রান্সলেটর এবং বাংলা ভার্চুয়াল প্রাইভেট অ্যাসিস্টেন্ট। এই প্রকল্পগুলোর অধিকাংশই ইতোমধ্যে ডেভেলপ করা হয়ে গেছে এবং বেটা-রিলিজের জন্য অপেক্ষায় রয়েছে। আশা করা যায়, এসব টুল সম্পূর্ণ প্রস্তুত হয়ে গেলে তথ্য-প্রযুক্তির জগতে বাংলা ভাষা আরও ছড়িয়ে পড়বে।

তারা আরও জানান, বিশ্বের যেকোনো প্রান্তের বাংলাভাষীদের জন্যই সঠিক পুরোপুরি বিনামূল্যে ব্যবহার করা যাবে। দলটি আশাবাদী যে, মুদ্রণ, প্রকাশ ও শিক্ষাক্ষেত্রে সরকারি প্রতিষ্ঠানগুলো সঠিক ব্যবহারের মাধ্যমে উপকৃত হবে। এ বিষয়ে তাদের চূড়ান্ত লক্ষ্য হচ্ছে জনপরিসরে বিনামূল্যে ব্যবহারের জন্য একটি উঁচু মানের বানান ও ব্যাকরণ সংশোধনকারী সফটওয়্যার ডেভেলপ করা। 

 

অনুবাদ করেছেন অনিন্দিতা চৌধুরী
 

Comments

The Daily Star  | English

How Chattogram built its economic legacy

Picture a crowded harbour where the salty seabreeze carries whispers of far-off lands, where merchants of all creed and caste haggle over silks and spices, and where towering ships of all varieties – Chinese junks, Arab dhows, and Portuguese carracks – sway gently in the waters of the Bay of Bengal.

13h ago