|
The Unicode standard
is the universal character encoding standard used for representation of text
for computer processing. It is fully compatible with the International Standard
ISO/IEC 10646-1;1993. and contains all the same characters and encoding points
as ISO/IEC 10646. Unicode provides a consistent way of encoding multilingual
plain text and brings order to chaotic state of affairs that has made it difficult
to exchange text files internationally.
Unicode has been hailed
by many in the computing communities as an ideal solution to the problems of
multiplatform internationalization. It is destined to replace ASCII and other
single and multibyte character sets currently in existence. Majority of the
software developers of the world over have declared conformance to Unicode.
They include IBM, Microsoft, Oracle, Sybase, Unisys, Apple, Bell Labs, Compaq,
GNU/Linux, Sun, SCO, Hewlett Packard, Netscape, Ericsson and Novell. More and
more applications are becoming Unicode compliant. It is expected that Unicode
will become the de-facto standard in the multilingual word, especially with
the spread of Internet. Visit
http://www.unicode.org for more details of Unicode.
എന്താണു യൂണിക്കോഡ് ?
അക്ഷരങ്ങളും അക്കങ്ങളും ചിഹ്നങ്ങളും പൂജ്യത്തിന്റേയും ഒന്നിന്റേയും
കൂട്ടങ്ങളായി മാറ്റിയാണ് കമ്പ്യൂട്ടറില് ശേഖരിച്ചു വയ്ക്കുന്നത്. ഇങ്ങനെ
ശേഖരിക്കുന്നതിന് ഓരോന്നിനും അതിന്റേതായ കോഡുകള് ഉണ്ടായിരിക്കണം. ഇപ്പോള്
ഇത് കൂടുതലായും ASCII (അമേരിക്കന് സ്റ്റാന്ഡാര്ഡ് കോഡ് ഫോര് ഇന്ഫര്മേഷന്
ഇന്റര്ചേഞ്ച്) കോഡുപയോഗിച്ചാണ് നിര്വ്വഹിച്ചു വരുന്നത്.
ഇതുപയോഗിച്ചുണ്ടാക്കാവുന്ന അക്ഷരാദികളുടെ എണ്ണം (256) പരിമിതമായതുകൊണ്ട് രണ്ടു
ഭാഷകളിലെ അക്ഷരങ്ങളേ ഒരേ സമയം ഉപയോഗിക്കാന് സാധിക്കുകയുള്ളു. ഇതില് ആദ്യത്തെ
128 എണ്ണം ഇംഗ്ളീഷിനും അടുത്ത 128 എണ്ണം വേറെ ഏതെങ്കിലും ഭാഷക്കും ഉപയോഗിക്കാം.
ലോകമാസകലം കമ്പ്യൂട്ടറുകള് വരുകയും അവയെയെല്ലാം ബന്ധിപ്പിക്കുന്ന ഇന്റര്നെറ്റ്
സംജാതമാകുകയും ചെയ്തതോടെ ലോകഭാഷകള് എല്ലാം അടങ്ങുന്ന ഒരു കോഡിംഗ് സിസ്റ്റം
ആവശ്യമായിവന്നു. ഇതിലേക്കായി ഇന്റര്നാഷണല് സ്റ്റാന്ഡാര്ഡ് ISO/IEC 106461,
ഒരു പദ്ധതി തയ്യാറാക്കി. ഈ പദ്ധതിയില് ഉള്പ്പെടുത്തിയ എല്ലാ അക്ഷരാദികളേയും
സ്വാംശീകരിച്ചുകൊണ്ട് കുറച്ചു കൂടി ബൃഹത്തായതും ലോകഭാഷകളാകമാനം ഉള്ക്കൊള്ളാനാവുന്നതും
ഭാവി വികസനങ്ങള്ക്ക് പഴുതുള്ളതുമായ ഒരു കോഡിംഗ് സന്പ്രദായം വേണമെന്ന്
കമ്പ്യൂട്ടര് ലോകത്തിനു തോന്നി. അങ്ങനെയാണ് കംമ്പ്യൂട്ടര് കോര്പ്പറേഷനുകളും
സോഫ്റ്റ്വെയര് ഡാറ്റാബേസ് കച്ചവടക്കാരും, അന്താരാഷ്ട്ര ഏജന്സികളും
ഉപയോകതാക്കളും ചേര്ന്ന് 1991-ല് ദി യുണിക്കോഡ് കണ്സോര്ഷ്യം എന്ന ഒരു സംഘടന
രൂപീകരിച്ചത്. ഇന്ത്യാ ഗവണ്മെന്റിന്റെ ഇന്ഫര്മേഷന് ടെക്നോളജി ഡിപ്പാര്ട്ട്മെന്റ
ഇതിലെ ഒരു മുഴുവന് സമയ അംഗമാണ് .
ഇന്റര്നാഷണല് സ്റ്റാന്റേര്ഡ് ഓര്ഗനൈസേഷനും യുണിക്കോഡും ചേര്ന്ന് 1992ല്
യൂണിക്കോഡ് വേര്ഷന് 1.0 പുറത്തിറക്കി. ഇതു പരിഷ്കരിച്ച് 2.0യും 2000
ഫെബ്രുവരിയില് 3.0യും പുറത്തിറങ്ങി. ISO 10646 -ല് 32
ബിറ്റുപയോഗിച്ചിരുന്നിടത്ത് 16 ബിറ്റു മാത്രമേ യൂണിക്കോഡ് ഉപയോഗിക്കുന്നുള്ളൂ.
അതായത് 16 സ്ഥാനങ്ങളിലായി ഒന്നും പൂജ്യവും നിരത്തി 65000-ല് പരം അക്ഷരാദികളുടെ
കോഡുകള് നിര്മ്മിക്കാം. ഇവ 500 ഓളം ഭാഷകള്ക്കു മതിയാകും. പുരാതന ലിപികളും
ഭാവിയില് ഉണ്ടാകുന്ന ലിപികളും ഇതില് ഉള്ക്കൊള്ളിക്കാന് തക്കവിധത്തില് ഇതിനെ
വിപുലപ്പെടുത്താനും സാധിക്കുന്നതാണ് . പ്രധാനപ്പെട്ട ലോകഭാഷകള് മിക്കവാറും
എല്ലാം തന്നെ ഉള്പ്പെട്ടുത്തി 49194 അക്ഷരാദികള്ക്ക് ഇതിനകം കോഡുകള്
നല്കിക്കഴിഞ്ഞു. ഇതില് ചൈനീസും ജാപ്പനീസും ഉള്പ്പെടും. അടുത്തുതന്നെ ബര്മീസ്,
സിന്ഹാളീസ്, സിറിയക് മുതലായ ഭാഷകളും ഇതിന്റേ കീഴില് കൊണ്ടു വരുന്നതാണ്
യൂണിക്കോഡ് ഭാഷയിലെ അക്ഷരങ്ങള്ക്ക് കോഡുകള് നല്കിയെങ്കിലും അവ എങ്ങനെ
സ്ക്രീനില് കാണണമെന്ന് ഹാര്ഡ്വേറും സോഫ്റ്റ്വേറും ഇറക്കുന്നവരാണ്
തീരുമാനിക്കുന്നത്. ലോക ഭാഷകള് ഒരേ സ്ക്രീനില് പ്രത്യക്ഷപ്പെടേണ്ടി വരുന്പോള്
ലോക പ്രശസ്തരായ IBM, മൈക്രോസോഫ്റ്റ്, ഒറാക്കിള്, ആപ്പിള് എന്നിത്യാദി
വമ്പന്മാരെല്ലാം യൂണിക്കോഡിനെ വാരിപ്പുണരുന്നതില് അത്ഭുതപ്പെടാനില്ല. ഇന്റര്നെറ്റിന്റേ
ലോകവ്യാപകമായ പ്രചാരത്തോടുകൂടി യൂണിക്കോഡും ഒരു ആഗോളലിപികളുടെ
കോഡായിമാറിക്കഴിഞ്ഞു
9 ഇന്ത്യന് ഭാഷകള്ക്കായി 128 X 9 = 1152 കോഡുകള് (2304 മുതല് 3455 വരെ)
അലോട്ടുചെയ്തിരിക്കുന്നതില് 3328 മുതല് 3455 വരെയുള്ള 128 എണ്ണം മലയാള ലിപികള്ക്കാണ്
തന്നിരിക്കുന്നത്.
|