Thursday, February 7, 2008

ইউনিকোড পাঠ ০৬

চটকদার ভূমিকা ছাড়াই এ কিস্তি দেয়া হলো।
____________________________________
ছয়.
কোনো ভাষার বর্ণমালাকে ইউনিকোড দু ভাগে ভাগ করে। একটি মূল লিপি (World Script), অন্যটি পরিবর্তিত লিপি। যেমন, বাংলায় স্বরবর্ণ, ব্যঞ্জনবর্ণ, মাত্রা ও মৌলিক চিহ্ন সমূহকে স্বাধীন বর্ণ হিসেবে মূল লিপির অন্তর্ভুক্ত করা হয়। ইউনিকোডে কেবল মূল লিপির কোড পয়েন্ট দেয়া হয়। আর যে সব বর্ণ বা মাত্রা অন্য কোনো বর্ণের সংস্পর্শে বা সংযুক্তির ফলে উৎপন্ন হয় বা পরিবর্তিত রূপে ব্যবহৃত হয়, তার জন্য কোনো কোড পয়েন্ট থাকে না। পরিবর্তিত লিপির জন্য শুধু রূপরেখা থাকে।

দেবনাগরী, বাংলা, গুরুমুখী, গুজরাটি, ওড়িয়া, তামিল, তেলেগু, কানাঢ়া, মালায়লাম, সিনহালা, থাই, লাও, তিব্বতী, বার্মিজ ও খেমার-- এই মোট ১৫টি লিপিকে ইউনিকোডে একই শ্রেণীভুক্ত রাখা হয়েছে। কারণ ইউনিকোডের পর্যবেক্ষণ অনুযায়ী, ব্রাহ্মী লিপি থেকেই এ সব লিপির উৎপত্তি। ব্রাহ্মী লিপির উত্তরসুরী হবার ফলে এই ১৫টি লিপির গঠনগত বিন্যাস ও প্রয়োগরীতি প্রায় একই রকম। অনেকে মনে করেন, ভারতীয় পরিবারের অংশ হিসেবে বুঝি ‘বাংলা’ অন্তর্ভুক্ত হয়েছে। কিন্তু এ শ্রেণীর থাই ও লাও লিপিকে দেখলে ব্যাপারটি স্পষ্ট হয়ে যায়।

যেসব বর্ণ দেখতে একরকম, অথচ একাধিক ভাষার লিপিতে রয়েছে, তাদেরকে ইউনিকোডে কেবল একবার রাখা হয়েছে। যেমন : দেবনাগরী লিপিতে দাঁড়ি(।) সদৃশ ডাণ্ডা থাকার ফলে বাংলা লিপিতে পৃথকভাবে দাঁড়ি চিহ্ন যুক্ত করা হয়নি। কারণ ডাণ্ডা ও দাঁড়ি দুটোই ব্রাহ্মী লিপি থেকে এসেছে, দুটো দেখতে একই রকম এবং কাজও এক। আবার কোনো ভাষার লিপিতে এক বর্ণ কয়েক ভাবে লেখা হতে পারে। কিন্তু ইউনিকোড স্ট্যান্ডার্ডে বর্ণটি কেবল একভাবে সংরক্ষিত হয়। যেমন : আরবিতে ‘হা’ হরফ চার ভাবে লেখা হলেও ইউনিকোডে তা একভাবেই সংরক্ষিত আছে।

আরেকটি বিষয় লক্ষ্যণীয়, আমাদের ভাষাবিদরা ৎ, ক্ষ ও অন্তস্থ ব-কে ইউনিকোডে স্থান দেয়ার কথা বলছেন। ইউনিকোড কনসোর্টিয়ামের নীতিমালা অনুযায়ী, যদি বর্ণটিকে স্বাধীন বা মৌলিক বর্ণ হিসেবে প্রমাণ করা য়ায়, তবেই তা ইউনিকোডে যুক্ত হবে। যেমন, ইউনিকোড তার ৪.১ সংস্করণ থেকে ৎ (খণ্ড-ত) যুক্ত করেছে।
____________________________________
- এ লেখার প্রথম কিস্তি -

আর আগের কিস্তিগুলোয় তথ্যগত কোনো ভুল পেলে জানাবেন। প্রাসঙ্গিক মন্তব্য আশা করছি।

পরের কিস্তি দিচ্ছি শিগগিরই।

No comments:

Post a Comment