Thursday, July 16, 2009

വെബ്ബിലെ മലയാളം

ഇന്റര്‍നെറ്റ്കാലത്തെ മലയാളഭാഷാപ്രശ്നങ്ങള്‍


മലയാളം ബ്ലോഗ്, മലയാളം വിക്കിപീഡിയ എന്നെല്ലാം ഇക്കഴിഞ്ഞ കുറേ നാളായി പത്രമാദ്ധ്യമങ്ങളില്‍ ആവര്‍ത്തിച്ച് പരാമര്‍ശിക്കപ്പെട്ടുകാണുന്നു. കമ്പ്യൂട്ടറില്‍ മലയാളം ഉപയോഗിക്കാമെന്നും ഇന്റര്‍നെറ്റില്‍ മലയാളഭാഷയില്‍ വിവരങ്ങള്‍ വിനിമയം ചെയ്യാമെന്നും കേരളീയസമൂഹം മനസ്സിലാക്കുന്നതിന് ഇത് വഴിയൊരുക്കിയിട്ടുണ്ട്. എന്നിരുന്നാലും, കമ്പ്യൂട്ടറില്‍ മലയാളഭാഷ ഉപയോഗിക്കുന്നത് കേരളത്തില്‍ ജീവിക്കുന്ന മലയാളികളേക്കാള്‍ വിദേശവാസികളാണ്. ബ്ലോഗ് എഴുതുന്നതിനു പുറമെ മലയാളത്തില്‍ മെയിലയക്കാനും ചാറ്റ് ചെയ്യാനും ഇപ്പോള്‍ സാദ്ധ്യമാണ്. ഇത്തരം സാദ്ധ്യതകള്‍ ഉപയോഗപ്പെടുത്താത്തതിനാല്‍ കേരളത്തിലെ കമ്പ്യൂട്ടറുകള്‍ ഏറെയും അലങ്കാരവസ്തുക്കളായി ഉപയോഗിക്കപ്പെടുകയാണ്. വീടുകളില്‍ മാത്രമല്ല ടെലിവിഷന്‍ വാര്‍ത്തകളില്‍ ഉദ്യോഗസ്ഥമേധാവികളുടെയും മന്ത്രിമാരുടേയും ചേംബറുകളിലും ഈ അലങ്കാരവസ്തുവിനെ കാണാവുന്നതാണ്.

ആദ്യത്തെ മലയാളം ബ്ലോഗ് 2003 ഏപ്രില്‍ മാസത്തിലാണ് പ്രസിദ്ധീകരിക്കപ്പെട്ടത്। അതിനു ശേഷം ഈ മാദ്ധ്യമത്തിന്റെ സാദ്ധ്യതകള്‍ തിരിച്ചറിഞ്ഞ നിരവധി പേര്‍ ബ്ലോഗുകള്‍ ഉണ്ടാക്കി. തുടക്കത്തില്‍ പതുക്കെയായിരുന്നുവെങ്കിലും ഇപ്പോള്‍ ഓരോ ആഴ്ചയിലും ഇരുന്നൂറോളം പുതിയ ബ്ലോഗുകള്‍ ഉണ്ടാകുന്നുണ്ട്. അവയില്‍ ഏറെയും നിരന്തരമായി പുതിയ പോസ്റ്റുകള്‍ പ്രസിദ്ധീകരിച്ച് സജീവമായി നില്ക്കുന്നവയുമാണ്. ബ്ലോഗു പോലെ സജീവമാണ് മലയാളം വിക്കിപീഡിയയും. താല്പര്യമുള്ള ആര്‍ക്കും ലേഖനങ്ങള്‍ എഴുതാവുന്നതും തിരുത്തലുകളിലൂടെ ലേഖനങ്ങള്‍ മെച്ചപ്പെടുത്താവുന്നതുമായ സ്വതന്ത്രവിജ്ഞാനകോശമാണ് വിക്കിപീഡിയ. ഇക്കഴിഞ്ഞ ഡിസംബറില്‍ അഞ്ചു വയസ്സു പൂര്‍ത്തിയാക്കിയ മലയാളം വിക്കിപീഡിയയില്‍ അയ്യായിരത്തിലധികം ലേഖനങ്ങള്‍ ഉണ്ട്. ഒരു ലക്ഷം തിരുത്തലുകള്‍ വിക്കിപീഡിയയില്‍ ഇതിനകം നടന്നു കഴിഞ്ഞിട്ടുണ്ട്. ഇന്റര്‍നെറ്റിലെ മലയാളത്തിന്റെ സജീവത വ്യക്തമാക്കാന്‍ ഈ കണക്കുകള്‍ പര്യാപ്തമാണ് . ഈ അവസ്ഥയിലും ഇത്തരം സാദ്ധ്യതകള്‍ ഉപയോഗിക്കുന്നതില്‍ നമ്മുടെ സര്‍ക്കാര്‍ വകുപ്പുകള്‍ തികഞ്ഞ അലംഭാവമാണ് കാണിക്കുന്നത്. കേരള സര്‍ക്കാരിന്റെ ഔദ്യോഗിക വെബ്‌സൈറ്റ് ഇപ്പോഴും ആംഗലത്തിലാണ്. ഭരണഭാഷ മലയാളമാക്കുന്നതില്‍ നാം പുലര്‍ത്തുന്ന നിഷ്കര്‍ഷയുടെ മികച്ച ഉദാഹരണമാണിത്.

ഇന്റര്‍നെറ്റിലെ മലയാളം അനായാസമായത് യൂനിക്കോഡ് എന്‍കോഡിംഗിനെത്തുടര്‍ന്നാണ്. മലയാളത്തിന്റെ യൂനിക്കോഡ് എന്‍കോഡിംഗിനെക്കുറിച്ച് ഇപ്പോള്‍ ചില തര്‍ക്കങ്ങള്‍ നിലവിലുണ്ട്. ഭാഷാപരവും സാങ്കേതികവുമായ പരിജ്ഞാനം ഈ പ്രശ്‌നങ്ങള്‍ മനസ്സിലാക്കാനും അവയ്ക്ക് പരിഹാരം കാണാനും ആവശ്യമാണ്. എന്നാല്‍ കേരളത്തിലെ ഭാഷാപണ്ഡിതന്മാരോ വിവരസാങ്കേതികതാ വിദഗ്ദ്ധരോ ഈ പ്രശ്‌നത്തെക്കുറിച്ച് സഗൗരവം പഠിക്കുകയോ അഭിപ്രായം രൂപീകരിക്കുകയോ ചെയ്തിട്ടില്ല. എന്താണ് ഈ പ്രശ്‌നം എന്നു പോലും ശരിയായ രീതിയില്‍ മനസ്സിലാക്കാന്‍ ഔദ്യോഗികഭാഷാസ്ഥാപനങ്ങള്‍ക്ക് ഇനിയും കഴിഞ്ഞിട്ടില്ല. എന്താണ് യൂനിക്കോഡ് എന്‍കോഡിംഗിലെ പ്രശ്‌നം എന്ന് വിശദീകരിക്കാനുള്ള ഒരു ശ്രമമാണ് ഈ ലേഖനം.
ലോകത്തിലെ പ്രമുഖ കമ്പ്യൂട്ടര്‍നിര്‍മ്മാണക്കമ്പനികളും സോഫ്റ്റ്‌വേര്‍കമ്പനികളും ചേര്‍ന്ന് രൂപീകരിച്ച ഒരു സംഘടനയാണ് കാലിഫോര്‍ണിയ ആസ്ഥാനമായ യൂനിക്കോഡ് കണ്‍സോര്‍ഷ്യം। ലോകത്തിലെ എല്ലാ ഭാഷകളും അനായാസം ഫലപ്രദമായി കമ്പ്യൂട്ടറില്‍ ഉപയോഗിക്കാനും ഇന്റര്‍നെറ്റ് വഴി ഈ ഭാഷകളില്‍ വിവരവിനിമയം അനായാസമാക്കാനും സഹായകമായ സാങ്കേതികവിദ്യ രൂപപ്പെടുത്തുക എന്നതാണ് ഈ കണ്‍സോര്‍ഷ്യത്തിന്റെ ഉദ്ദേശ്യലക്ഷ്യം. അതിനായി അവര്‍ ചിട്ടപ്പെടുത്തിയ ഭാഷാകോഡുകളാണ് യൂനിക്കോഡ് എന്ന പേരില്‍ അറിയപ്പെടുന്നത്. ലോകത്തിലെ ഭാഷകള്‍ക്കെല്ലാം ഓരോ കോഡ് പേജുകള്‍ യൂനിക്കോഡില്‍ നല്കിയിട്ടുണ്ട്. മലയാളത്തിന്റെ യൂനിക്കോഡ് കോഡ്‌പേജ് നിലവില്‍ വരികയും സോഫ്റ്റ്‌വേര്‍ നിര്‍മ്മാതാക്കള്‍ ഇത് പിന്തുടരുകയും ചെയ്തതിനാലാണ് ഇന്ന് ഇന്റര്‍നെറ്റില്‍ നേരത്തെ പറഞ്ഞതു പോലെ മലയാളം ഉപയോഗിക്കാന്‍ സാധിക്കുന്നത്.

വിന്‍ഡോസ് എക്‌സ്പി എന്ന ഓപ്പറേറ്റിംഗ് സിസ്റ്റത്തിന്റെ സര്‍വ്വീസ് പായ്ക്ക് രണ്ടിലാണ് മലയാളത്തിന്റെ കോഡുകള്‍ മൈക്രോസോഫ്റ്റ് ആദ്യമായി ഉള്‍ക്കൊള്ളിക്കുന്നത്। ഈ ഓപ്പറേറ്റിംഗ് സിസ്റ്റം അതിന്റെ രണ്ടാമത്തെ സര്‍വ്വീസ് പായ്ക്ക് സഹിതം ഇന്‍സ്റ്റള്‍ ചെയ്ത കമ്പ്യൂട്ടറില്‍ മറ്റൊരു ഭാഷാസോഫ്റ്റ്‌വേറുമില്ലാതെ മലയാളം ഉപയോഗിക്കാന്‍ സാധിക്കും. ഗ്നു ലിനക്‌സിന്റെ ഒട്ടുമിക്ക ഡിസ്ട്രിബ്യൂഷനുകളിലും മലയാളം ഉള്‍ക്കൊള്ളിച്ചിട്ടുണ്ട്. ഐടി @ സ്കൂള്‍ ഉപയോഗിക്കുന്ന ഡെബിയാന്റെ കസ്റ്റമൈസ്ഡ് വേര്‍ഷന്‍, തികച്ചും സൗജന്യമായി ലഭിക്കുന്ന ഉബന്തു, പ്രശസ്തമായ ഫെഡോറ എന്നിവയെല്ലാം പ്രയാസമില്ലാതെ മലയാളം ഉപയോഗിക്കാന്‍ സാധിക്കുന്ന ലിനക്‌സ് ഡിസ്ട്രിബ്യൂഷനുകളാണ്.

മലയാളത്തിന് ഇന്ന് യൂനിക്കോഡില്‍ നിലവിലിരിക്കുന്ന കോഡ് പേജ് പരിഷ്കരിക്കണമെന്ന നിര്‍ദ്ദേശത്തെ തുടര്‍ന്നാണ് തര്‍ക്കങ്ങള്‍ ഉടലെടുത്തത്। യൂനിക്കോഡില്‍ ചില്ല് അക്ഷരമില്ല എന്നും ചില്ലക്ഷരം മലയാളത്തിന് ആവശ്യമില്ല എന്ന് ചിലര്‍ വാദിക്കുന്നു എന്നെല്ലാം പ്രചരിപ്പിക്കുന്നത് ഈ തര്‍ക്കത്തിന്റെ അടിസ്ഥാനത്തിലാണ്. എന്താണ് ഇതിന്റെ വാസ്തവം എന്നു മനസ്സിലാക്കേണ്ടതുണ്ട്. മലയാളിസമൂഹത്തിന്റെ ഭാഷയെ സംബന്ധിക്കുന്ന ജീവല്‍പ്രധാനമായ ഒരു കാര്യം കാലിഫോര്‍ണിയയില്‍ ലോകത്തിലെ കുത്തക കമ്പ്യൂട്ടര്‍നിര്‍മ്മാതാക്കളും സോഫ്റ്റ്‌വേര്‍കമ്പനികളും കേരളത്തിലെ ജനങ്ങള്‍ അറിയാതെ തീരുമാനിക്കുന്നുവെന്നത് വിവരം നിഗൂഢവത്കരിക്കുന്നതിനെ എതിക്കുന്നവരെങ്കിലും പുറത്തറിയിക്കേണ്ടതാണ്. ഭാരതീയഭാഷകളുടെ യൂനിക്കോഡ് എന്‍കോഡിംഗിനെക്കുറിച്ച് അഭിപ്രായം പറയാന്‍ ഇന്‍ഡി മെയിലിംഗ് ലിസ്റ്റ് എന്ന ഒരു സംവിധാനം യൂനിക്കോഡ് കണ്‍സോര്‍ഷ്യത്തിനുണ്ട്. അവിടെ അഭിപ്രായം പറയാമെന്നല്ലാതെ അത് യൂനിക്കോഡ് സ്വീകരിച്ചുകൊള്ളും എന്ന വ്യവസ്ഥയൊന്നുമില്ല. തീരുമാനങ്ങള്‍ കൈക്കൊള്ളുന്നത് അതിനായി നിയോഗിച്ചിട്ടുള്ള കമ്മിറ്റിയാണ്. മെയിലിംഗ് ലിസ്റ്റില്‍ കേരളത്തിലെ ഭാഷാപണ്ഢിതന്മാരില്‍ ഒരാളും ഇക്കാലത്തിനിടയില്‍ അഭിപ്രായം പറയാന്‍ എത്തിയിട്ടില്ല. കാരണം ലളിതമാണ്. അവര്‍ ആരും ഈ സംവിധാനത്തെക്കുറിച്ചോ അവിടെ നടക്കുന്ന ചര്‍ച്ചയെക്കുറിച്ചോ അറിഞ്ഞിട്ടില്ല. കടുത്ത കമ്പ്യൂട്ടര്‍വിരുദ്ധനിലപാടുണ്ടായിരുന്ന കേരളത്തില്‍ ഇന്നും മഹാഭൂരിപക്ഷം ബുദ്ധീജീവികളും കമ്പ്യൂട്ടറുമായോ ഇന്റര്‍നെറ്റുമായോ പരിചയം നേടിയിട്ടില്ലാത്തവരാണ്. ഇത് ഒരു ഐ.ടി പ്രശ്‌നം എന്ന നിലയില്‍ ഭാഷാവിദഗ്ദ്ധരും ഇതൊരു ഭാഷാപ്രശ്‌നം എന്ന നിലയില്‍ ഐ.ടി വിദഗ്ദ്ധരും കണക്കാക്കുന്നു. ചുരുക്കത്തില്‍ കേരളത്തില്‍ ആരുടേയും പരിഗണനയില്‍ വരാതെ കിടന്ന പ്രശ്‌നമാണിത്. അതിനാല്‍ ഇന്‍ഡി മെയിലിംഗ് ലിസ്റ്റില്‍ ചര്‍ച്ച ചെയ്ത മലയാളഭാഷാപ്രശ്‌നം ലഘുവായി ഇവിടെ പരാമര്‍ശിക്കാം.

പ്രധാന തര്‍ക്കവിഷയം മലയാളത്തിലെ ചില്ലക്ഷരങ്ങള്‍ക്ക് പ്രത്യേകം കോഡ് പോയിന്‍റുകള്‍ നല്കേണ്ടതുണ്ടോ എന്നതാണ്। പ്രത്യേകം കോഡ് പോയിന്റ് നല്കണം എന്നു വാദിക്കുവാന്‍ കാരണം എന്ത്? പ്രത്യേകം കോഡ് പോയിന്റ് നല്കിയാല്‍ എന്തെങ്കിലും ദോഷമുണ്ടോ? ചില്ലക്ഷരങ്ങള്‍ക്ക് കോഡ് പോയിന്‍റുകള്‍ നല്കുന്നത് എതിര്‍ക്കുവാന്‍ കാരണമെന്ത്? ഇക്കാര്യം മനസ്സിലാക്കാന്‍ അല്പം സാങ്കേതികജ്ഞാനം ആവശ്യമാണ്.

ടൈപ്പ്‌റൈറ്ററിന്റേതു പോലുള്ള കീബോര്‍ഡാണ് കമ്പ്യൂട്ടറിനും ഉള്ളത്। എങ്കിലും പ്രവര്‍ത്തനരീതി വ്യത്യസ്തമാണ്. കീബോര്‍ഡിലെ ഒരു കീ അമര്‍ത്തുമ്പോള്‍ കമ്പ്യൂട്ടറിനകത്ത് സൂക്ഷിച്ചിട്ടുള്ള വിവരങ്ങളില്‍ നിന്ന് ആ കീയുമായി ബന്ധപ്പെടുത്തി സൂക്ഷിച്ചിട്ടുള്ള വിവരം അനുസരിച്ച് പ്രവര്‍ത്തിക്കുകയാണ് കമ്പ്യൂട്ടര്‍ ചെയ്യുന്നത്. ഒരു അക്ഷരം ടൈപ്പ് ചെയ്യുമ്പോഴും സംഭവിക്കുന്നത് ഇതു തന്നെയാണ്. കമ്പ്യൂട്ടറിനകത്ത് വിവരങ്ങള്‍ കോഡുരൂപത്തിലാണ് സംഭരിച്ചു സൂക്ഷിക്കുന്നത്. ഇതിനായി 0,1 എന്നീ സംഖ്യകളുടെ ഒരു ശൃംഖലയാണ് കമ്പ്യൂട്ടര്‍ ആന്തരികമായി ഉപയോഗിക്കുന്നത്. ഭാരതീയഭാഷകള്‍ കമ്പ്യൂട്ടറില്‍ ഉപയോഗിക്കാന്‍ ആവശ്യമായ ഇത്തരം വിവരങ്ങള്‍ ഓരോ സോഫ്റ്റ്‌വേര്‍ നിര്‍മ്മാതാവും സ്വന്തം യുക്തിക്ക് അനുസൃതമായി ചിട്ടപ്പെടുത്തി ഉപയോഗിക്കുകയാണ് ചെയ്തിരുന്നത്. ഇക്കാരണത്താല്‍ കോഡുകളുടെ നിരവധി വ്യവസ്ഥകള്‍ നിലവിലുണ്ടായിരുന്നു. അക്കാരണത്താല്‍, ഒരു സോഫ്റ്റ്‌വേര്‍ ഉപയോഗിച്ച് മലയാളം ഉള്‍പ്പെടെയുള്ള ഭാരതീയഭാഷയില്‍ ടൈപ്പുചെയ്ത ഒരു രചന മറ്റൊരു സോഫ്റ്റ്‌വേര്‍ ഉപയോഗിക്കുന്ന കമ്പ്യൂട്ടറില്‍ വായിക്കാന്‍ സാധിക്കുമായിരുന്നില്ല. ഈ പ്രശ്‌നം പരിഹരിക്കണമെങ്കില്‍ എല്ലാ കമ്പ്യൂട്ടറും ഒരേ കോഡുകള്‍ തന്നെ ഉപയോഗിക്കണം. കമ്പ്യൂട്ടറുകള്‍ക്കിടയില്‍ വിവരവിനിമയം സാധിക്കുന്നതിന് മാനകീകരിച്ച കോഡുകള്‍ ഉപയോഗിച്ച് ഭാഷാസോഫ്റ്റുവേറുകള്‍ നിര്‍മ്മിക്കേണ്ടിയിരുന്നു. കേന്ദ്രസര്‍ക്കാരിന്റെ ഇലട്രോണിസ് വിഭാഗം 1986-88 കാലത്താണ് ഭാരതീയഭാഷകളുടെ കോഡുകളുടെ മാനകീകരണം നടത്തിയത്. ഈ വ്യവസ്ഥ പിന്തുരുന്നതാണ് കമ്പ്യൂട്ടര്‍ ടൈപ്പ്‌സെറ്റിംഗിനായി ഇന്ന് ഉപയോഗിക്കുന്ന ഭാരതീയഭാഷാ സോഫ്റ്റുവേറുകള്‍.

എന്നാല്‍ ഇത് ഉപയോഗിച്ച് ഇന്റര്‍നെറ്റില്‍ അനായാസമായി വിവരവിനിമയം സാധിക്കുകയില്ലായിരുന്നു। വെബ് ഫോണ്ടുകളും ബിറ്റ്‌സ്ട്രീം സാങ്കേതികവിദ്യയും ഉപയോഗിച്ചാണ് അക്കാലത്ത് ഇന്റര്‍നെറ്റില്‍ മലയാളം ഉപയോഗിച്ചിരുന്നത്. ഓരോ പത്രവും അവരുടെ സ്വന്തം ഫോണ്ട് ഉപയോഗിക്കുന്നു. പ്രസ്തുത ഫോണ്ട് നമ്മുടെ കമ്പ്യൂട്ടറില്‍ ഇന്‍സ്റ്റള്‍ ചെയ്താലേ ആ പത്രം നമ്മുക്ക് വായിക്കാനാകൂ. നാലു പത്രം വായിക്കാന്‍ നാല് ഫോണ്ട്!

ഫോണ്ടിനെ ആശ്രയിച്ചും അതിന്റെ സാങ്കേതികവിദ്യയ്ക്ക് വിധേയമായും ഭാഷ ഉപയോഗിക്കുന്ന പ്രയാസം ഇല്ലാതാക്കിയത് യൂനിക്കോഡ് എന്‍കോഡിംഗാണ്. ഒരു യൂനിക്കോഡ് ഫോണ്ട് കമ്പ്യൂട്ടറില്‍ ഉണ്ടായാല്‍ യൂനിക്കോഡ് കോഡിംഗ് വ്യവസ്ഥ പിന്തുടരുന്ന രചന നമ്മുക്ക് അത് തയ്യാറാക്കിയവര്‍ ഉപയോഗിച്ച ഫോണ്ട് നമ്മള്‍ ഉപയോഗിക്കുന്നില്ലെങ്കിലും വായിക്കാം. കോഡുകള്‍ക്ക് കമ്പ്യൂട്ടറിലെ ഭാഷാരചനയില്‍ നിര്‍ണ്ണായകമായ പ്രാധാന്യമാണുള്ളത്. ഒരു ഭാഷയിലെ അടിസ്ഥാനാക്ഷരങ്ങള്‍ക്കാണ് കോഡുകള്‍ നല്കുന്നത്. അക്ഷരങ്ങളുടെ ഇരട്ടിപ്പ്, കൂട്ടക്ഷരങ്ങള്‍ തുടങ്ങിയവ അടിസ്ഥാനാക്ഷരങ്ങള്‍ ചേര്‍ന്ന് ഉണ്ടാകുന്നവയാണ് എന്നതിനാല്‍ അവ ഏതൊക്കെ കൂട്ടക്ഷരങ്ങള്‍ ചേര്‍ന്നാണോ രൂപപ്പെടുന്നത് അവ ചേര്‍ത്ത് രൂപപ്പെടുത്തുയാണ് ടൈപ്പു ചെയ്യുമ്പോള്‍ ചെയ്യുന്നത്. ഉദാഹരണമായി ത,ചന്ദ്രക്കല എന്നിവ ഉണ്ടെങ്കില്‍ തത്ത എന്ന് ടൈപ്പ് ചെയ്യാം. ത,ത,ചന്ദ്രക്കല,ത എന്നു ടൈപ്പു ചെയ്താല്‍ മതി. ചന്ദ്രക്കല അക്ഷരങ്ങളെ യോജിപ്പിക്കുവാനുള്ള കോഡിനെ പ്രതിനിധാനം ചെയ്യുന്നു. ചില്ലുകളും ഇങ്ങനെ ഉണ്ടാക്കിയെടുക്കുയാണ് ചെയ്യുന്നത്. കാരണം, ഓരോ ചില്ലക്ഷരവും ചില അടിസ്ഥാനാക്ഷരവുമായി ബന്ധപ്പെട്ടതാണ് എന്നതു തന്നെ.
ഭാരതീയഭാഷകളുടെ കോഡുകള്‍ നിശ്ചയിക്കുന്ന പ്രക്രിയയില്‍ ശ്രദ്ധേയമായ സംഭാവനയാണ് ഇസ്കി എന്‍കോഡിംഗ് അടിസ്ഥാനമാക്കിയ ഇസ്‌ഫോ കോഡില്‍ സിഡാക്ക് നല്കിയത്। എല്ലാ ഭാരതീയഭാഷകളും അക്ഷരമാലയില്‍ ഒരേ ക്രമം പിന്തുടരുന്നവയാണല്ലോ. അക്ഷരങ്ങളുടെ എണ്ണവും സാദൃശ്യവും ഇവയുടെ ക്രമവും എല്ലാ ഇന്ത്യന്‍ഭാഷകളും ഒരേ കോഡിംഗിന്റെ അടിസ്ഥാനത്തില്‍ ഉപയോഗിക്കാമെന്ന പൂര്‍വ്വാനുമാനത്തിനു അടിസ്ഥാനമായി॥ അതിനാല്‍ ഭാഷ മാറ്റി എല്ലാ ഭാരതീയഭാഷകളും ഒരേ രീതിയില്‍ ഉപയോഗിക്കാവുന്ന ഒരു വ്യവസ്ഥ അവര്‍ രൂപീകരിച്ചു. ഇവ ടൈപ്പ് ചെയ്യാന്‍ എല്ലാ ഭാഷകള്‍ക്കും ഒരേ കീബോര്‍ഡ് എന്നതും അവര്‍ യാഥാര്‍ത്ഥ്യമാക്കി. അതിനാല്‍ സിഡാക്കിന്റെ ഐ എസ് എം പരമ്പരയില്‍പ്പെട്ട സോഫ്റ്റ്‌വേര്‍ ഉപയോഗിക്കുന്ന പക്ഷം മലയാളം ടൈപ്പുചെയ്യുന്നതിനിടയില്‍ ഭാഷ ഹിന്ദിയോ ബംഗാളിയോ മറ്റേതെങ്കിലും ഭാരതീയഭാഷയോ ആക്കി മാറ്റി ആ ഭാഷയിലെ വാക്ക് ടൈപ്പു ചെയ്യാം. അതിനു വേണ്ടി ആ ഭാഷയുടെ കീബോര്‍ഡ് പരിശീലിക്കേണ്ടതില്ല. ഈ കീബോര്‍ഡ് ലേഔട്ട് ഇന്‍സ്ക്രിപ്റ്റ് കീബോര്‍ഡ് എന്ന പേരില്‍ അറിയപ്പെടുന്നു. ഭാരതീയഭാഷകളുടെ സ്വനപരവും ലിപിപരവുമായ സവിശേഷതകള്‍ അടിസ്ഥാനമാക്കി ചിട്ടപ്പെടുത്തിയ യുക്തിഭദ്രവും സൗകര്യപ്രദവുമായ വ്യവസ്ഥയാണ് സിഡാക്ക് നല്കിയിട്ടുള്ളത്.

ഭാരതീയഭാഷളുടെ മാനകീകരണത്തിന് സിഡാക്ക് ഉപയോഗിച്ച വ്യവസ്ഥ അതേപടി ഉപയോഗിച്ചാണ് യൂനിക്കോഡിന്റെ കോഡുകള്‍ നിശ്ചയിച്ചത്. അതിനാല്‍ ചില്ല്, അക്ഷരങ്ങളുടെ ഇരട്ടിപ്പ്, കൂട്ടക്ഷരം എന്നിവ അടിസ്ഥാനാക്ഷരത്തില്‍ നിന്നും ഉണ്ടാക്കിയെടുക്കുകയാണ് യൂനിക്കോഡില്‍ ചെയ്യുന്നത്. നേരത്തെ ഇന്ത്യന്‍ ഭാഷകളുടെ കോഡിനെ പ്രാവര്‍ത്തികമാക്കാന്‍ ഉണ്ടാക്കിയ ഇസേ്ഫാക്ക് എന്ന എന്‍കോഡിംഗിന്റെ ഭാഗമായി നുക്ത എന്ന സംവിധാനം ഉപയോഗിച്ചായിരുന്നു ചില്ലുകള്‍ ഉണ്ടാക്കിയിരുന്നത്. യൂനിക്കോഡില്‍ സീറോ വിഡ്ത്ത് ജോയിനര്‍ (ZWJ) എന്ന സംവിധാനമാണ് നുക്തയ്ക്കു പകരം ഉപയോഗിക്കുന്നത്. അതാവട്ടെ ഇന്ത്യന്‍ ഭാഷകള്‍ക്കു മാത്രമല്ല ലോകത്തിലെ നിരവധി ഭാഷകളുടെ കാര്യത്തില്‍ ഉപയോഗിക്കുന്ന സംവിധാനമാണ്. അടിസ്ഥാനാക്ഷരവും വിരാമ എന്ന് പേരിട്ടിരിക്കുന്ന ചന്ദ്രക്കലയും സീറോ വിഡ്ത്ത് ജോയിനറുമാണ് ചില്ലക്ഷരം ഉണ്ടാക്കിയെടുക്കാനായി ഉപയോഗിക്കുന്നത്. ഉദാഹരണമായി ന്‍ എന്ന ചില്ലക്ഷരം ന, ചന്ദ്രക്കല, സീറോ വിഡ്ത്ത് ജോയിനര്‍ (ZWJ) എന്നിവ ടൈപ്പു ചെയ്താണ് ഉണ്ടാക്കുന്നത്. ഇക്കാരണത്താല്‍ അക്ഷരമാലയില്‍ കാണുന്ന ചില്ലക്ഷരങ്ങള്‍ മലയാളത്തിന്റെ കോഡ് പേജില്‍ കാണില്ല. അത് അടിസ്ഥാനാക്ഷരമായല്ല ഇവിടെ പരിഗണിക്കപ്പെടുന്നത് എന്നതിനാലാണത്. ഈ രീതിക്കു പകരം ചില്ലിന് പ്രത്യേകം കോഡ് വേണം എന്നാണ് ഒരു വിഭാഗം വാദിക്കുന്നത്. ഈ വാദത്തെ മറ്റൊരു വിഭാഗം നിരവധി ന്യായങ്ങള്‍ ഉന്നയിച്ച് എതിര്‍ക്കുന്നു. ഇതാണ് ഇന്ന് യൂനിക്കോഡിലെ മലയാളം എന്‍കോഡിംഗ് സംബന്ധമായ ഏറ്റവും വലിയ തര്‍ക്കം.
ഒരു ഭാഷ ഓപ്പറേറ്റിംഗ് സിസ്റ്റത്തിന്റെ ഭാഗമാകുന്നതോടെ കമ്പ്യൂട്ടറിന്റെ അടിസ്ഥാനപരമായ ഭാഷാശേഷിയില്‍ പ്രസ്തുതഭാഷകൂടി ഉള്‍പ്പെടുന്നുവെന്നതിനാലാണ് യൂനിക്കോഡിലെ മലയാളത്തിന്റെ കോഡുകള്‍ വമ്പിച്ച ഒരു പ്രശ്‌നമാകുന്നത്. ഡി.ടി.പി യുടെ തലത്തില്‍ നടത്തുന്ന പ്രവര്‍ത്തനത്തിനപ്പുറം കമ്പ്യൂട്ടര്‍ ഉപയോഗിച്ചു ചെയ്യുന്ന എല്ലാ പ്രവര്‍ത്തനങ്ങള്‍ക്കും പ്രസ്തുതഭാഷ ഉപയോഗിക്കാം എന്നു വരുമ്പോള്‍ തെറ്റില്ലാതെ അനായാസം ഭാഷ കൈകാര്യം ചെയ്യാനാകേണ്ടതുണ്ട്. ചില്ലക്ഷരത്തിന് പ്രത്യേക കോഡ് നല്കുകയും ഭാഷയിലെ അടിസ്ഥാനാക്ഷരമായി പരിഗണിക്കുകയും ചെയ്യുമ്പോള്‍ സംഭവിക്കുന്ന പ്രശ്‌നങ്ങളെക്കുറിച്ച് ഉന്നയിക്കപ്പെട്ട വാദമുഖങ്ങള്‍ മനസ്സിലാക്കേണ്ടത് ഇക്കാരണത്താല്‍ പ്രാധാന്യമുള്ള കാര്യമാണ്.

യൂനിക്കോഡ് എന്‍കോഡിംഗ് വ്യവസ്ഥയനുസരിച്ച് കമ്പ്യൂട്ടറില്‍ മലയാളം ടൈപ്പുചെയ്യാന്‍ അടിസ്ഥാനാക്ഷരങ്ങളും വിരമ എന്നു പേരിട്ടിരിക്കുന്ന ചന്ദ്രക്കലയും സീറോ വിഡ്ത്ത് ജോയിനര്‍ (ZWJ), സീറോ വിഡ്ത്ത് നോണ്‍ജോയിനര്‍ (ZWNJ) എന്നീ ഒരു ക്രമീകരണങ്ങളും ഉപയോഗിക്കുന്നു। ചില്ലക്ഷരം നിര്‍മ്മിച്ചെടുക്കാന്‍ സീറോ വിഡ്ത്ത് ജോയിനര്‍ (ZWJ) ഉപയോഗിക്കുന്നതിനെക്കുറിച്ച് നേരത്തെ പറഞ്ഞിട്ടുണ്ടല്ലോ. ഓരോ അക്ഷരത്തിനും ഒരു നിശ്ചിത വലുപ്പം ഉണ്ട്. എന്നാല്‍ അങ്ങനെയല്ലാത്തതും അക്ഷരത്തിന്റെ രൂപത്തില്‍ മാറ്റം വരുത്തുന്നതുമായ ക്രമീകരണമാണ് ജോയിനര്‍. നോണ്‍ ജോയിനര്‍ ആവട്ടെ, പേര് സൂചിപ്പിക്കുന്നതു പോലെ അക്ഷരങ്ങള്‍ കൂടിച്ചേരുന്നതിനെ തടയുവാനുള്ള ക്രമീകരണമാണ് എന്നു ചുരുക്കി പറയാം. ജോയിനറും നോണ്‍ ജോയിനറും കണ്‍ട്രോള്‍ ഫോര്‍മാറ്റിംഗ് ക്യാറക്ടേഴ്‌സ് ആണ് എന്നാണ് സാങ്കേതികമായി പറയുക. ടൈപ്പ് ചെയ്ത ഒരു രചനയില്‍ അക്ഷരങ്ങള്‍ ചെരിഞ്ഞതാക്കുക ( ഇറ്റാലിസ്), കട്ടിയുള്ളതാക്കുക (ബോള്‍ഡ് ഫെയ്‌സ്) എന്നിങ്ങനെയുള്ള കാര്യങ്ങള്‍ ഫോര്‍മാറ്റിംഗിന്റെ ഭാഗമായി ചെയ്യുന്ന പ്രവര്‍ത്തനങ്ങളാണ്. ഇത്തരം പ്രവര്‍ത്തനമാണ് ജോയിനര്‍ ചെയ്യുന്നതെന്നും അതിനാല്‍ ചില പ്രശ്‌നങ്ങള്‍ ഉണ്ടാകാനിടയുണ്ടെന്നുമാണ് ചില്ലക്ഷരത്തിന് കോഡ് പോയിന്റ് വേണം എന്നു വാദിക്കുന്നവര്‍ ഉന്നയിക്കുന്ന പ്രധാനയുക്തി.

ഇപ്പോഴത്തെ നിലയില്‍ യൂനിക്കോഡിന്റെ കോഡ് പേജില്‍ വ്യവസ്ഥചെയ്യപ്പെട്ട വിധത്തില്‍ മലയാളം തെറ്റു കൂടാതെ ഉപയോഗിക്കാന്‍ സാധിക്കും। ഫോര്‍മാറ്റിംഗ് കണ്‍ട്രോള്‍ ക്യാറക്ടറുകളാണ് ജോയിനറുകള്‍ എന്നത് ഒരു നിലയിലും ഇന്നത്തെ അവസ്ഥയില്‍ അച്ചടിയിലും വെബ്ബിലുമുള്ള ഭാഷോപയോഗത്തെ പ്രശ്‌നത്തിലാക്കുന്നില്ല. പത്രം അച്ചടിക്കുക, പുസ്തകങ്ങള്‍ തയ്യാറാക്കുക എന്നിങ്ങനെയുള്ള പ്രവര്‍ത്തനങ്ങള്‍ക്കൊന്നും ഇപ്പോഴത്തെ വ്യവസ്ഥ ഒരു തടസ്സവുമല്ല. സാങ്കേതികമായ ഭാഷയില്‍ പറഞ്ഞാല്‍ ടെസ്റ്റ് എഡിറ്റിംഗിന്റെ തലത്തിലോ വെബ്ബിലോ ഇപ്പോള്‍ യൂനിക്കോഡില്‍ നിലവിലുള്ള വ്യവസ്ഥയ്ക്ക് ഒരു പ്രശ്‌നവുമില്ല. ഒരു ചില്ലക്ഷരം ടൈപ്പ് ചെയ്യാന്‍ മൂന്ന് കീകള്‍ അമര്‍ത്തേണ്ടിവരും എന്നു തോന്നാം. കൂട്ടക്ഷരങ്ങള്‍, ഇരട്ടിപ്പുകള്‍ എന്നിവ ടൈപ്പു ചെയ്യാനും മൂന്ന് കീകള്‍ തന്നെ ഉപയോഗിക്കുന്നു. വേണമെങ്കില്‍ ഇത് കീബോര്‍ഡ് വിന്യസനത്തില്‍ പരിഹരിക്കാവുന്ന പ്രശ്‌നം മാത്രമാണ്. അത് പരിഹരിച്ചിട്ടുമുണ്ട്. ഉദാഹരണമായി, ഐടി @ സ്കൂള്‍ ഉപയോഗിക്കുന്ന ഡബിയാന്‍ ലിനക്‌സിന്റെ കസ്റ്റമൈസ്ഡ് വേര്‍ഷനില്‍ നുക്ത എന്ന് ഇന്‍സ്ക്രിപ്റ്റ് കീബോര്‍ഡില്‍ വിളിക്കുന്ന ഒരു കീയില്‍ ചില്ല് രൂപപ്പെടുത്തുവാന്‍ ക്രമപ്പെടുത്തിയിട്ടുണ്ട്. മലയാളത്തിന്റെ കാര്യത്തില്‍ കീബോര്‍ഡില്‍ ഓരോ അക്ഷരത്തിനും സുനിശ്ചിതമായ സ്ഥാനം എന്നത് വളരെ ഗുരുതരമായ പ്രശ്‌നമല്ല. നിലവില്‍ ഏറ്റവുമധികം പ്രൊഫഷനല്‍ ടൈപ്പിസ്റ്റുകള്‍ ഉപയോഗിക്കുന്നത് സിഡാക് എന്ന സ്ഥാപനം ചിട്ടപ്പെടുത്തിയ ഇന്‍സ്ക്രിപ്റ്റ് കീ ബോര്‍ഡാണ്. അതില്‍ മാത്രമേ നുക്ത എന്ന സങ്കല്പം തന്നെയുള്ളൂ. വിദേശമലയാളികള്‍ മഹാഭൂരിപക്ഷവും ട്രാന്‍സ്ലിറ്ററേഷന്‍ കീബോര്‍ഡ് എന്ന ഒരു ക്രമീകരണമാണ് പിന്തുടരുന്നത്. അതാകട്ടെ, ഇംഗ്ലീഷില്‍ ടൈപ്പ് ചെയ്താല്‍ മലയാളം കിട്ടാവുന്ന ക്രമീകരണമാണ്. അതില്‍ തന്നെ നിരവധി വ്യത്യസ്തങ്ങളായ രീതികള്‍ നിലവിലുണ്ട്.

ചില്ലക്ഷരത്തിന് കോഡ് പേജില്‍ അടിസ്ഥാനാക്ഷരങ്ങളോടൊപ്പം സ്ഥാനം വേണം എന്ന് വാദിക്കുന്നവര്‍ ചില ഉദാഹരണങ്ങള്‍ കാണിച്ചാണ് തങ്ങളുടെ വാദമുഖം അവതരിപ്പിക്കുന്നത്। അതില്‍ പ്രധാനം വന്‍യവനിക - വന്യവനിക എന്ന ദ്വന്ദമാണ്. വലിയ യവനിക എന്ന അര്‍ത്ഥത്തിലുള്ള ആദ്യത്തെ വാക്കും അതല്ലാത്ത അര്‍ത്ഥമുള്ള രണ്ടാമത്തെ വാക്കും (എന്താണ് അതിന്റെ അര്‍ത്ഥമെന്ന് എനിക്ക് മനസ്സിലായിട്ടില്ല. വന്യമായ വനിക എന്നാല്‍ എന്തായിരിക്കാം?) ടൈപ്പു ചെയ്യുമ്പോള്‍ ഉള്ള വ്യത്യാസം ആദ്യത്തെ വാക്കില്‍ ന, ചന്ദ്രക്കല എന്നിവയ്ക്കു ശേഷം ZWJ ഉണ്ട് എന്നതാണ്. എന്നാല്‍ ഇത് അവഗണിക്കപ്പെടുന്ന ഒരു സന്ദര്‍ഭം ഉണ്ടെങ്കില്‍ ഈ രണ്ട് വാക്കുകളും തമ്മില്‍ യാതൊരു വ്യത്യാസവും ഉണ്ടാകില്ല. കാരണം ന, ചന്ദ്രക്കല, യ എന്നിവ ചേര്‍ന്നാല്‍ ന്യ എന്നാണ് കമ്പ്യൂട്ടര്‍ കാണിക്കുക. ഇതു പോലെ വേറെ ചില ദ്വന്ദങ്ങളും വാദത്തിന് ഉപോദ്ബലകമായി അവര്‍ അവതരിപ്പിക്കുന്നുണ്ട്. മന്‍വിക്ഷോഭം - മന്വിക്ഷോഭം(മന: + വിക്ഷോഭം എന്നത് എങ്ങനെയാണ് ഈ പദമാകുന്നത് എന്ന് എനിക്ക് മനസ്സിലായിട്ടില്ല), കണ്‍വലയം - കണ്വലയം (കണ്വലയത്തിന് എന്താണ് അര്‍ത്ഥം എന്നും മനസ്സിലായിട്ടില്ല) എന്നിവയാണ് പ്രശസ്തമായ ഉദാഹരണങ്ങള്‍. ഉദാഹരണമായി കാണിച്ച പദങ്ങളില്‍ പലതും മലയാളത്തില്‍ നിരര്‍ത്ഥകങ്ങളും കുസന്ധികളുമാണ്. എന്നിരുന്നാലും വാദത്തിന് ഈ ഉദാഹരണങ്ങള്‍ സ്വീകരിച്ച് പരിശോധിക്കാവുന്നതാണ്. ഇതില്‍ എല്ലാ സന്ദര്‍ഭത്തിലും അനൈച്ഛികമായ അക്ഷരസംയോഗം ഉണ്ടാകുന്നത് തടയാന്‍ സാധിക്കും. അനൈച്ഛികമായ അക്ഷരസംയോഗമാണ് ഇവിടങ്ങളിലെല്ലാം സംഭവിക്കുന്നത്. താഴ്‌വാരം എന്ന വാക്ക് ടൈപ്പു ചെയ്യുമ്പോള്‍ താഴ്വാരം എന്നാവാതിരിക്കാന്‍ ഴ, ചന്ദ്രക്കല എന്നിവയ്ക്കു ശേഷം ZWNJ ടൈപ്പു ചെയ്യേണ്ടതാണ്. നോണ്‍ജോയിനര്‍ അക്ഷരങ്ങള്‍ കൂടിച്ചേരുന്നത് തടയും. ജോയിനര്‍ ഇടയില്‍ ഉള്ളിടത്തോളം ഇങ്ങനെ അനൈച്ഛികപദസംയോഗം സംഭവിക്കുകയുമില്ല. ജോയിനര്‍ ഉപയോഗിക്കാതിരുന്നാലേ പ്രശ്‌നം ഉണ്ടാകുന്നുള്ളൂ. ആകയാല്‍ ജോയിനറുകള്‍ ഉപയോഗിക്കുന്ന രീതി അനുവര്‍ത്തിച്ചാല്‍ നേരത്തെ ചൂണ്ടിക്കാണിച്ച ഉദാഹരണദ്വന്ദങ്ങളിലെ അനൈച്ഛികപദസംയോഗം തടയാവുന്നതാണ്. ഇത് ചില്ലക്ഷരത്തിന് കോഡ് പേജില്‍ സ്ഥാനം വേണം എന്ന വാദത്തിന് മതിയായ ന്യായീകരണമാകുന്നില്ല. മലയാളത്തില്‍ നിരര്‍ത്ഥകമായ വാക്കുകള്‍ കാണിച്ചുള്ള ഈ യുക്തിവാദത്തിന് യാതൊരു സാധൂകരണവുമില്ല.

മലയാളം ടൈപ്പ് ചെയ്യുമ്പോള്‍ ജോയിനറുകളുടെ ഉപയോഗം ഒഴിച്ചുകൂടാനാകാത്തതാണ്। ലോസഭ എന്ന വാക്ക് ടൈപ്പു ചെയ്യുമ്പോള്‍ ലോക്‌സഭ എന്നാവാതിരിക്കാന്‍, ശ്രേയാംസ്കുമാര്‍ എന്നത് ശ്രേയാംസ്കുമാര്‍ എന്നാവാതിരിക്കാന്‍ ZWNJ മലയാളത്തില്‍ ഉപയോഗിക്കേണ്ടി വരും. ഇവിടെ ചില്ലക്ഷരമില്ല എന്നത് ശ്രദ്ധിക്കുക. ഫോര്‍മാറ്റിംഗ് കണ്‍ട്രോള്‍ ക്യാറക്ടേഴ്‌സ് എന്നു കണക്കാക്കി അവഗണിക്കാനാകാത്ത പ്രാധാന്യം മലയാളത്തിന്റെ കാര്യത്തില്‍ ZWJ, ZWNJ എന്നിവയ്ക്കുണ്ട് എന്ന് ഇതില്‍ നിന്ന് മനസ്സിലാക്കാവുന്നതാണ്. അങ്ങനെയല്ലെങ്കില്‍ വരാവുന്ന ചില മാതൃകകള്‍ കാണിക്കാം: ജോസേ്താമസ്, രമേശ്ചെന്നിത്തല. പേരിനും സര്‍നെയിമിനുമിടയില്‍ ഒരു സെ്പയ്‌സ് ഇടുന്നില്ലെങ്കില്‍ ഈ പേരുകള്‍ ഇങ്ങനെയാകും രൂപപ്പെടുക.

ചില്ലുകള്‍ക്ക് പ്രത്യേകം കോഡ് പോയിന്റ് നല്കണം എന്ന് വാദിക്കാന്‍ കാരണം അവയ്ക്ക് സ്വതന്ത്രമായ നില്പില്ല എന്നതാണ്। അവ ഫോര്‍മാറ്റിംഗ് ക്യാരക്ടറുകളെ ആശ്രയിച്ചാണ് നില്ക്കുന്നത്. ഫോര്‍മാറ്റിംഗ് കണ്‍ട്രോള്‍ ക്യാറക്ടറുകള്‍ക്ക് പരിമിതമായ സ്ഥാനമേയുള്ളൂ എന്നും അവഗണിക്കാവുന്നത് എന്ന് ഒരു ആപ്ലിക്കേഷന് ഇതിനെ പരിഗണിക്കാം എന്നുമുള്ള മുന്‍വിധിയില്‍ നിന്നാണ് ഈ വാദമുഖം അവതരിപ്പിച്ചിട്ടുള്ളത്. സെര്‍ച്ച് എന്‍ജിനുകള്‍ സാധാരണനിലയില്‍ ഇറ്റാലിസ്, ബോള്‍ഡ് എന്നിങ്ങനെയുള്ള ഫോര്‍മാറ്റിംഗ് ഘടകങ്ങളെ അവഗണിക്കുകയാണ് പതിവ്. ഈ വാദം യുക്തിസഹമാണ് എന്ന് ഇതിന്റെ അടിസ്ഥാനത്തില്‍ തോന്നാവുന്നതാണ്. എന്നാല്‍ ലോകത്തിലെ പല ഭാഷകളും ഫോര്‍മാറ്റ് കണ്‍ട്രോള്‍ ക്യാറക്ടറുകള്‍ ഉപയോഗിക്കുന്നുണ്ട് എന്നതിനാല്‍ അവയെ മലയാളത്തിന്റെ കാര്യത്തില്‍ മാത്രം ഒരു ആപ്ലിക്കേഷന് അവഗണിക്കാവുന്നവ എന്ന് മാറ്റി നിറുത്താന്‍ സാദ്ധ്യമല്ല.

ഫോര്‍മാറ്റിംഗ് കണ്‍ട്രോള്‍ ക്യാറക്ടറുകള്‍ അവഗണിക്കപ്പെടാവുന്നവയായി പരിഗണിക്കപ്പെടും എന്നു കണക്കാക്കി ചില്ലിന് യൂനിക്കോഡ് കോഡ് പേജില്‍ സ്ഥാനം നല്കിയാല്‍ അത് പ്രശ്‌നം പരിഹരിക്കുകയല്ല കൂടുതല്‍ പ്രശ്‌നങ്ങള്‍ സൃഷ്ടിക്കുകയാണ് ചെയ്യുക। യൂനിക്കോഡിന്റെ വ്യവസ്ഥയനുസരിച്ച് ഒരിക്കല്‍ ചെയ്ത വ്യവസ്ഥ പിന്നീട് മാറ്റുകയില്ല. അതിനാല്‍ ജോയിനറുകള്‍ ഉപയോഗിച്ചും ചില്ലുകള്‍ക്കായി നല്കിയിട്ടുള്ള പുതിയ കോഡ് ഉപയോഗിച്ചും ചില്ലക്ഷരം ടൈപ്പു ചെയ്യാന്‍ സാധിക്കുന്ന അവസ്ഥയാണ് ഇതിന്റെ ഫലമായി ഉണ്ടാവുക. ഒരു അക്ഷരത്തിന് രണ്ടു കോഡുകള്‍ എന്ന അവസ്ഥയാണത്. കോഡുകള്‍ മാനകീകരിക്കുന്നതും അത് എല്ലാവരും ഒരു പോലെ പിന്തുടരുകയും ചെയ്യുന്നത് അതോടെ അവസാനിക്കും. ചില്ലക്ഷരം പലര്‍ പലരീതിയില്‍ ടൈപ്പു ചെയ്യുന്നത് അച്ചടിയുടെ തലത്തില്‍ ഒരു ഗുരുതരമായ പ്രശ്‌നമല്ല. എന്നാല്‍ ഇന്റര്‍നെറ്റ് കാലത്തെ ഭാഷാപ്രയോഗം അച്ചടിക്കാലത്തിലേതില്‍ നിന്ന് വ്യത്യസ്തമായി നിരവധി മണ്ഡലങ്ങളില്‍ വ്യാപിച്ചു കിടക്കുന്നതാണ്. അവിടെയെല്ലാം രണ്ട് രീതിയില്‍ ചില്ലക്ഷരം ഉണ്ടാക്കാവുന്ന അവസ്ഥയുണ്ടാകും. യൂനിക്കോഡിന്റെ നയം അനുസരിച്ച് നേരത്തെയുണ്ടായിരുന്ന കോഡുകള്‍ അതേ പടി നിലനിറുത്തുകയാണ് അവര്‍ ചെയ്യുകയെന്ന് നേരത്തെ പറഞ്ഞല്ലോ. അതിനാല്‍ ഞാന്‍ എന്ന വാക്ക് രണ്ട് രീതിയില്‍ ടൈപ്പു ചെയ്യാനാകും. ഞ, ദീര്‍ഘം, ന, ചന്ദ്രക്കല, ZWJ എന്ന് ഒരാളും വേറൊരാള്‍ ഞ, ദീര്‍ഘം, ചില്ല് ന്‍ എന്നും. രണ്ടും കാഴ്ചയില്‍ ഒരു പോലെയാണെങ്കിലും കമ്പ്യൂട്ടറിന്റെ ആന്തരികമായ വിവരത്തില്‍ ഇത് രണ്ട് വാക്കുകളായിരിക്കും. അര്‍ത്ഥവ്യത്യാസമില്ലാതെ ഒരു വാക്ക് രണ്ടു രീതിയില്‍ എഴുതുന്ന എഴുത്തു രീതി ഇന്ന് മലയാളത്തില്‍ നിലവിലുണ്ട്. പുതിയലിപിയുടെ അടിസ്ഥാനത്തില്‍ നിലവില്‍ വന്ന പ്രസ്തുതരീതി ഇന്റര്‍നെറ്റ് കാലത്ത് മലയാളത്തിന്റെ അന്തകനായിത്തീരും.

ഇന്റര്‍നെറ്റുകാലത്തെ മലയാളത്തിന് ടൈപ്പ്‌റൈറ്റിംഗ് കാലത്തിലേതില്‍ നിന്ന് വ്യത്യസ്തമായ പല ധര്‍മ്മങ്ങളും നിര്‍വ്വഹിക്കാനുണ്ട്। ഇന്റര്‍നെറ്റിലെ വെബ്ബ് വിലാസം മലയാളത്തില്‍ നല്കാനാകുന്ന സാഹചര്യം ഇതില്‍ ഒന്നാണ്. ഇവിടെ കൃത്യത പാലിക്കാനാകാത്ത ഒരു ഭാഷ ഈ മണ്ഡലത്തില്‍ വമ്പിച്ച പ്രശ്‌നങ്ങള്‍ സൃഷ്ടിക്കും. ഒരു ഉദാഹരണത്തിലൂടെ ഇത് വ്യക്തമാക്കാം. ഞാന്‍ ഡോട്ട് കോം എന്ന പേരില്‍ ഒരാള്‍ വെബ് വിലാസം ഉണ്ടാക്കുന്നവെന്നു കരുതുക. യുനിക്കോഡില്‍ ഇപ്പോഴുള്ള വ്യവസ്ഥയനുസരിച്ച് ZWJ ഉപയോഗിച്ചായിരിക്കും ആ വിലാസം ഉണ്ടാക്കിയിരിക്കുക. ചില്ലിന് കോഡ് പോയിന്റ് നിലവില്‍ വന്നാല്‍ മറ്റൊരാള്‍ക്ക് അതേ വിലാസം ചില്ലിന്റെ കോഡ് ഉപയോഗിച്ച് ഉണ്ടാക്കാനാകും. രണ്ടും കാഴ്ചയില്‍ ഒരേ പേരാണ്. എന്നാല്‍ കമ്പ്യൂട്ടറിന്റെ ആന്തരികമായ വ്യവസ്ഥയില്‍ രണ്ടും വ്യത്യസ്തമാണ് എന്നതിനാല്‍ ഇങ്ങനെ ഒരു വ്യാജനെ സൃഷ്ടിക്കുക എളുപ്പമാണ്. ചില്ലക്ഷരമുള്ള ഏത് വിലാസത്തിനും ഇങ്ങനെ വ്യാജന്മാര്‍ വരാവുന്നതാണ്. കേരളസര്‍ക്കാര്‍ എന്ന പേരിലുള്ള വെബ് സൈറ്റ് നാലു രീതിയില്‍ റജിസ്റ്റര്‍ ചെയ്യാന്‍ സാധിക്കും. സര്‍ക്കാര്‍ സെറ്റിന്റെ വ്യാജന്‍ ഉണ്ടായാല്‍ സംഭവിക്കാവുന്ന അപകടം വിസ്തരിക്കേണ്ടതില്ല. ഇങ്ങനെ വ്യാജന്മാരെ സൃഷ്ടിച്ച് വെബ്ബ് തെരയുന്നവരെ വഴിതെറ്റിച്ച് കൊണ്ടുപോകുന്ന രീതി ഇംഗ്ലീഷിന്റെയും മറ്റു ഭാഷകളുടേയും കാര്യത്തില്‍ ഇപ്പോള്‍ തന്നെ നിലവിലുണ്ട്. ഇതിനെ സ്പൂഫിംഗ് എന്നാണ് പറയുക. ഇങ്ങനെ ചെയ്യുന്നതിലൂടെ ഇന്റര്‍നെറ്റില്‍ തെരയുന്ന ഒരാളെ വഴിതെറ്റിക്കുന്നതിനപ്പുറം നിയമവിരുദ്ധമായ പ്രവര്‍ത്തനങ്ങളാണ് സ്പൂഫ് ചെയ്യുന്നവര്‍ നടത്തുന്നത്.ചില്ലിന്റെ കോഡു ഉപയോഗിച്ച് അങ്ങനെ ചെയ്യാവുന്ന അവസ്ഥ തടയുക എന്നത് മലയാളത്തിന്റെ ആവശ്യമാണ്.

ബാങ്കിംഗ് ഉള്‍പ്പെടെയുള്ള രംഗത്ത് ഇക്കാരണത്താല്‍ തന്നെ പലരീതിയില്‍ എഴുതുന്ന ഭാഷ ഉപയോഗിക്കാന്‍ സാദ്ധ്യമാവില്ല। സെക്യൂറിറ്റി ആവശ്യമായ ഒരു പ്രവര്‍ത്തനവും ഡുവല്‍ എന്‍കോഡിംഗ് എന്ന പേരില്‍ അറിയപ്പെടുന്ന ഇരട്ട എഴുത്തു സാദ്ധ്യമാകുന്ന ഭാഷയില്‍ നിര്‍വ്വഹിക്കുവാന്‍ സാദ്ധ്യമല്ല. വ്യാജവിലാസം ഉപയോഗിച്ച് അക്കൗണ്ടുകളില്‍ വ്യാജന്മാര്‍ നുഴഞ്ഞുകയറിയാല്‍ എന്തു തന്നെ സംഭവിക്കുകയില്ല! ചുരുക്കിപ്പറഞ്ഞാല്‍ ഇന്റര്‍നെറ്റുകാലത്തെ മലയാളം പുതിയലിപിക്കാലത്തെ അവ്യവസ്ഥിതത്വം താങ്ങാനാകാത്ത ഭാഷയാണ്. അതിനാല്‍ ഭാഷയുടെ കോഡ് പേജില്‍ ഇപ്പോള്‍ നിലനില്ക്കുന്ന പ്രശ്‌നരഹിതമായ അവസ്ഥയില്‍ നിന്ന് പ്രശ്‌നസങ്കുലമായ അവസ്ഥയിലേക്ക് പോകേണ്ടതുണ്ടോ എന്നതാണ് ഇപ്പോള്‍ ഈ വിവാദങ്ങളുടെ പശ്ചാത്തലത്തിലുള്ള കാതലായ ചോദ്യം.

ചില്ലക്ഷരത്തിന് കോഡ് പോയിന്റ് നിശ്ചയിച്ചാല്‍ ഉണ്ടാകുന്ന പ്രശ്‌നം വിദ്യാര്‍ത്ഥികളുടെ സന്ദേഹത്തിനപ്പുറം പ്രാധാന്യമുള്ളതാണ്. കൃത്യമായി പറഞ്ഞാല്‍ പുതിയലിപി മലയാളഭാഷയില്‍ ഉണ്ടാക്കിയതിന്റെ നൂറ് മടങ്ങ് പ്രശ്‌നം അത് സൃഷ്ടിക്കും. ടൈപ്പ് റൈറ്റിംഗ് മെഷീനിനു വേണ്ടി ഉണ്ടാക്കിയ ലിപിസമ്പ്രദായം മലയാളത്തിന്റെ ലിപിയായി ഔദ്യോഗികമായി സര്‍ക്കാര്‍ ഉത്തരവിലൂടെ അംഗീകരിക്കപ്പെട്ടുവെങ്കിലും ഇന്ന് അത് എവിടെയും നിലവിലില്ല. മലയാളത്തിലെ ഏറ്റവും പ്രധാനപ്പെട്ട പത്രങ്ങളില്‍ ഒന്നായ മാതൃഭൂമി പുതിയലിപിയിലെ ഉകാരം മാത്രമേ ഉപയോഗിക്കുന്നുള്ളൂ. ഋ കാരം ഉള്‍പ്പെടെ എല്ലാ അക്ഷരങ്ങളും അതിന്റെ തനതുരൂപത്തില്‍ വീണ്ടെടുക്കാന്‍ മാതൃഭൂമിക്ക് സാധിച്ചു. എന്നു മാത്രമല്ല വായനാസമൂഹം ഒരു എതിര്‍പ്പുമില്ലാതെ അത് സ്വീകരിക്കുകയും ചെയ്തു.
ഇക്കാര്യത്തില്‍ കൗതുകാവഹമായ ഒരു സംഭവം ഉണ്ട്। സമകാലീനമലയാളം വാരികയില്‍ പ്രസിദ്ധീകരിച്ചിരുന്ന സാഹിത്യവാരഫലം എന്ന പംക്തി മലയാളത്തിന്റെ തനതുലിപിയില്‍ പ്രസിദ്ധീകരിച്ചു കാണാന്‍ എഴുത്തുകാരനായ പ്രൊഫ. എം. കൃഷ്ണന്‍നായര്‍ ആഗ്രഹം പ്രകടിപ്പിച്ചതിന്റെ അടിസ്ഥാനത്തില്‍ പ്രസാധകര്‍ അത് തനതുലിപിയിലേക്ക് മാറ്റി. ഈ മാറ്റം വലിയ ആകര്‍ഷണമാകുമെന്ന് പത്രാധിപസമിതി പ്രതീക്ഷിച്ചുവെങ്കിലും വായനക്കാരില്‍ നിന്നും ഒരു പ്രതികരണവും ഉണ്ടായില്ലത്രെ. കാരണം ലിപി വിഷയത്തില്‍ മലയാളികള്‍ തനതുലിപി സ്വാഭാവികം എന്ന നിലയില്‍ സ്വീകരിക്കുന്നുവെന്നതാണ്. മറ്റൊരു ഉദാഹരണം കൂടി പറയാം: വൃത്തസഹായി എന്ന പേരില്‍ വൃത്തം കണ്ടുപിടിക്കാന്‍ സഹായിക്കുന്ന ഒരു സോഫ്റ്റ്‌വേര്‍ അമേരിക്കയില്‍ ജോലി ചെയ്യുന്ന സുഷെന്‍ കുമാര്‍, സഞ്ജീവ്കുമാര്‍ എന്നിവര്‍ ചേര്‍ന്ന് ഉണ്ടാക്കിയിട്ടുണ്ട്. അതിന്റെ നിര്‍ദ്ദേശം ഇതില്‍ പുതിയലിപി ഉപയോഗിക്കരുത് എന്നാണ്. മാത്രമല്ല, വിസര്‍ഗ്ഗം, സംവൃതോകാരം എന്നിവയെല്ലാം ഉപയോഗിക്കണമെന്നുകൂടിയാണ്. അല്ലെങ്കില്‍ മാത്ര ഗണിക്കാനാകാതെ വരികയും വൃത്തം നിര്‍ണ്ണയിക്കുന്നതില്‍ പിഴവ് സംഭവിക്കുകയും ചെയ്യും. ലിപിപരിഷ്കരണത്തിന്റെ ഭാഗമായി തകര്‍ത്തെറിയപ്പെട്ടത് ഭാഷയുടെ ആന്തരികമായ യുക്തിയാണ് എന്നു മനസ്സിലാക്കാന്‍ വൃത്തശാസ്ത്രത്തെക്കുറിച്ചുള്ള ഈ നിര്‍ദ്ദേശം സഹായകമാകും. മലയാളഭാഷയുടെ ആന്തരമായ യുക്തിയെ തകര്‍ത്ത് കൃത്രിമമായി ഉണ്ടാക്കിയ പുതിയലിപി ഇന്റര്‍നെറ്റ് കാലത്ത് സ്വാഭാവികമായിത്തന്നെ കാലഗതിയടഞ്ഞു. ബ്ലോഗെഴുത്തുകാരും വിക്കിപീഡിയ എഡിറ്റു ചെയ്യുന്നവരും ചിന്ത.കോമിലെ തര്‍ജ്ജനി മാസിക വായനക്കാരും ഉപയോഗിക്കുന്നത ഒന്നുകില്‍ അഞ്ജലി ഓള്‍ഡ് ലിപിയോ രചനW01 എന്ന ഫോണ്ടോ ആണ്. ഇതു രണ്ടും മലയാളത്തിന്റെ തനതുലിപിസഞ്ചയം ഉപയോഗപ്പെടുത്തുന്ന ഫോണ്ടുകളാണ്.

ഇന്റര്‍നെറ്റു കാലത്തെ മലയാളം അച്ചടിക്കാലത്തെ ആധിപത്യങ്ങളെ നിരാകരിച്ച് സ്വതന്ത്രമായി മുന്നേറുന്ന ഘട്ടത്തിലാണ് യൂനിക്കോഡില്‍ ഇപ്പോള്‍ നിലവിലുള്ള കോഡ് പേജില്‍ ചില്ലക്ഷരങ്ങള്‍ക്കും സ്ഥാനം വേണം എന്ന വാദം ഉയരുന്നത്. ഇത് ന്യായമായും സംശയാസ്പദമായിത്തീരുന്നു. ചില്ലിന് കോഡ് പോയിന്റ് വേണം എന്നു വാദിക്കുന്നവര്‍ പല ന്യായങ്ങളും പല രീതിയില്‍ ഉന്നയിക്കുന്നവെങ്കിലും എന്താണ് ഇതു കൊണ്ട് പ്രയോജനം എന്ന ചോദ്യത്തിനു മുമ്പില്‍ മൗനികളാണ്. ഏത് പ്രശ്‌നമാണ് അത് പരിഹരിക്കുക എന്നതിനും ഉത്തരമില്ല. അത് വേറെ പ്രശ്‌നങ്ങളുണ്ടാക്കുമെങ്കില്‍ അതിനെന്തു പ്രതിവിധി എന്നതിനും ഉത്തരമില്ല. ഇന്‍ഡിക്‍ മെയിലിംഗ് ലിസ്റ്റിലും ബ്ലോഗിലും നടന്ന ചര്‍ച്ചകള്‍ അവസാനം വരെ കാത്തിരുന്നു വായിച്ച ഒരാള്‍ എന്ന നിലയില്‍ ചില്ലക്ഷരത്തിന്റെ എന്‍കോഡിംഗ് എന്തിനെന്ന് എനിക്ക് മനസ്സിലാക്കാനായിട്ടില്ല. ഒരു പ്രശ്‌നവും പരിഹരിക്കാതിരിക്കുകയും പുതിയ പ്രശ്‌നങ്ങള്‍ സൃഷ്ടിക്കുകയും ചെയ്യും ചില്ലിന്റെ എന്‍കോഡിംഗ് എന്നാണ് ഞാന്‍ ഈ സംവാദങ്ങളില്‍ നിന്ന് മനസ്സിലാക്കിയിട്ടുള്ളത്.

No comments:

Post a Comment