-0 C
Toronto
শুক্রবার, মার্চ ২৯, ২০২৪

আপনার কণ্ঠ যাবে গুগলে, বাড়বে বাংলার বিস্তৃতি!

আপনার কণ্ঠ যাবে গুগলে, বাড়বে বাংলার বিস্তৃতি! - the Bengali Times
ফাইল ছবি

চলছে ভাষার মাস। বাংলা ভাষাকে রক্ষা করতে ঝরেছে তরুণদের তাজা রক্ত। এজন্য আমরা এখন সুমধুর বাংলা ভাষায় আমাদের মনের ভাব প্রকাশ করছি সবার সঙ্গে। দেশ ছেড়ে বিদেশেও জনপ্রিয় হয়েছে এ বাংলা ভাষা। বর্তমান প্রযুক্তির যুগে আধুনিকতার ছোঁয়া লেগেছে প্রায় সবখানেই। কিন্তু সেই আধুনিকতার সংস্পর্শে আমরা নিয়ে আসতে পারিনি আমাদের মাতৃভাষা বাংলাকে।

বাংলা ভাষাকে অনেকেই পৃথিবীর মধুরতম ভাষা হিসেবে উল্লেখ করেছেন। ৫০ কোটি মানুষের কানে-মুখে এ ভাষাটি ঘুরলেও কম্পিউটার প্রযুক্তিতে অত ঘোরে না এ ভাষা। গুগল, অ্যালেক্সা ও সিরিতে বাংলাতে কথা বলতেই সে অনুযায়ী কাজ করবে-এ সাধ জাগে আমাদের অনেকের মনেই। কিন্তু সাধ থাকলেই তো আর হবে না সাধ্যও তো থাকতে হবে।

- Advertisement -

এবার সেই সাধ্যকে সত্যি করতে কাজ করছে বাংলাদেশের একদল গবেষক ও ছাত্ররা। তারা চাইছেন কম্পিউটারের মতো যন্ত্রকে বাংলা ভাষায় যা বলবেন সেভাবেই কাজ করবে। তবে সমস্যা হচ্ছে কম্পিউটার তো আর আমাদের বাংলা ভাষা বুঝে না। কম্পিউটার বুঝে অ্যালগরিদম, এর মাধ্যমেই কাজ কম্পিউটার তার কাজ সম্পাদন করে।

আর কম্পিউটারকে বাংলা ভাষা শেখাতে বা বুঝাতে হলে প্রয়োজন অনেক অনেক মানুষের কণ্ঠের নমুনা। নানা পরিস্থিতিতে, নানা বয়সের মানুষের কণ্ঠের নমুনা প্রয়োজন। ইংরেজি গবেষকরা এমন কণ্ঠের নমুনা সংগ্রহ করেছে বলেই তারা আজ সিরি, এলেক্সা বা গুগল এসিস্টেন্টের সঙ্গে কথা বলতে পারছেন।

এবার বাংলাকে সেই কাতারে তুলে নিয়ে আসতে কণ্ঠের নমুনা সংগ্রহ করছে মজিলা ফাউন্ডেশন প্ল্যাটফর্মের আয়োজনে বেঙ্গলি.এআই কমিউনিটির পক্ষ থেকে বিভিন্ন স্তরের গবেষক বা ছাত্ররা। তারা বাংলাদেশ ও ভারতের বাংলাভাষী নানা বয়সী ব্যক্তিদের কাছ থেকে বিভিন্ন কণ্ঠে কথা বলার নমুনা সংগ্রহ করছে। এসব ভাষা কম্পিউটারকে অ্যালগরিদমের মাধ্যমে শোনালেই বাংলার জন্য একটি অ্যাসিস্ট্যান্ট তৈরি করা যাবে। যা আমাদের সর্বস্তরের কাজে সাহায্য করবে।

গুগল বাংলা ভাষা নিয়ে কিছু কাজ করলেও তাদের অ্যালগরিদমের অনেক ত্রুটি রয়েছে। কারণ গুগলের কাছে বাংলাভাষীদের সব এলাকার লোকের বাংলা কণ্ঠের নমুনা নেই। তাই এবার এ প্রতিষ্ঠানটি একটি বড় কণ্ঠের নমুনা সংগ্রহ করার কাজে নেমেছে।

এর আগে গুগলের কাছে সর্বোচ্চ ২৫০ ঘণ্টার কণ্ঠের নমুনা সংগ্রহের ডেটাসেট ছিল। কিন্তু প্রোডাকশন লেভেল সফটওয়ারের জন্য দরকার ১০ হাজার ঘণ্টা কণ্ঠ নমুনার ডেটাসেট। সরকার থেকে একটি সফটওয়্যার বানানো হচ্ছে যেখানে সবস্তরের মানুষের কণ্ঠের নমুনা দরকার। সেই নমুনা সংগ্রহ করছে বেঙ্গলি.এআই নামের একটি কমিউনিটি।

এ কমিউনিটি একটি লিংক শেয়ার করেছে যেখানে তারা সব মানুষের কণ্ঠের নমুনা চাচ্ছে। লিংকে গিয়ে সবাইকে কথা বলার জন্য অনুরোধও করছে তারা।

- Advertisement -

Related Articles

Latest Articles