Home Up Site Map Contact Us

What is Unicode? 

Google
 

 

 


 

What is Unicode?

The Unicode standard is the universal character encoding standard used for representation of text for computer processing. It is fully compatible with the International Standard ISO/IEC 10646-1;1993. and contains all the same characters and encoding points as ISO/IEC 10646. Unicode provides a consistent way of encoding multilingual plain text and brings order to chaotic state of affairs that has made it difficult to exchange text files internationally.

Unicode has been hailed by many in the computing communities as an ideal solution to the problems of multiplatform internationalization. It is destined to replace ASCII and other single and multibyte character sets currently in existence. Majority of the software developers of the world over have declared conformance to Unicode. They include IBM, Microsoft, Oracle, Sybase, Unisys, Apple, Bell Labs, Compaq, GNU/Linux, Sun, SCO, Hewlett Packard, Netscape, Ericsson and Novell. More and more applications are becoming Unicode compliant. It is expected that Unicode will become the de-facto standard in the multilingual word, especially with the spread of Internet. Visit http://www.unicode.org for more details of Unicode.

 

എന്താണു യൂണിക്കോഡ് ?
 

അക്ഷരങ്ങളും അക്കങ്ങളും ചിഹ്നങ്ങളും പൂജ്യത്തിന്‍റേയും ഒന്നിന്‍റേയും കൂട്ടങ്ങളായി മാറ്റിയാണ്‍ കമ്പ്യൂട്ടറില്‍ ശേഖരിച്ചു വയ്ക്കുന്നത്. ഇങ്ങനെ ശേഖരിക്കുന്നതിന് ഓരോന്നിനും അതി‍ന്‍റേതായ കോഡുകള്‍ ഉണ്ടായിരിക്കണം. ഇപ്പോള്‍ ഇത് കൂടുതലായും ASCII (അമേരിക്കന്‍ സ്റ്റാന്‍ഡാര്‍ഡ് കോഡ് ഫോര്‍ ഇന്‍ഫര്‍മേഷന്‍ ഇന്റര്‍ചേഞ്ച്) കോഡുപയോഗിച്ചാണ്‍ നിര്‍വ്വഹിച്ചു വരുന്നത്. ഇതുപയോഗിച്ചുണ്ടാക്കാവുന്ന അക്ഷരാദികളുടെ എണ്ണം (256) പരിമിതമായതുകൊണ്ട് രണ്ടു ഭാഷകളിലെ അക്ഷരങ്ങളേ ഒരേ സമയം ഉപയോഗിക്കാന്‍ സാധിക്കുകയുള്ളു. ഇതില്‍ ആദ്യത്തെ 128 എണ്ണം ഇംഗ്ളീഷിനും അടുത്ത 128 എണ്ണം വേറെ ഏതെങ്കിലും ഭാഷക്കും ഉപയോഗിക്കാം.

ലോകമാസകലം കമ്പ്യൂട്ടറുകള്‍ വരുകയും അവയെയെല്ലാം ബന്ധിപ്പിക്കുന്ന ഇന്റര്‍നെറ്റ് സംജാതമാകുകയും ചെയ്തതോടെ ലോകഭാഷകള്‍ എല്ലാം അടങ്ങുന്ന ഒരു കോഡിംഗ് സിസ്റ്റം ആവശ്യമായിവന്നു. ഇതിലേക്കായി ഇന്റര്‍നാഷണല്‍ സ്റ്റാന്‍ഡാര്‍ഡ് ISO/IEC 106461, ഒരു പദ്ധതി തയ്യാറാക്കി. ഈ പദ്ധതിയില്‍ ഉള്‍പ്പെടുത്തിയ എല്ലാ അക്ഷരാദികളേയും സ്വാംശീകരിച്ചുകൊണ്ട് കുറച്ചു കൂടി ബൃഹത്തായതും ലോകഭാഷകളാകമാനം ഉള്‍ക്കൊള്ളാനാവുന്നതും ഭാവി വികസനങ്ങള്‍ക്ക് പഴുതുള്ളതുമായ ഒരു കോഡിംഗ് സന്പ്രദായം വേണമെന്ന് കമ്പ്യൂട്ടര്‍ ലോകത്തിനു തോന്നി. അങ്ങനെയാണ്‍ കംമ്പ്യൂട്ടര്‍ കോര്‍പ്പറേഷനുകളും സോഫ്റ്റ്വെയര്‍ ഡാറ്റാബേസ് കച്ചവടക്കാരും, അന്താരാഷ്ട്ര ഏജന്‍സികളും ഉപയോകതാക്കളും ചേര്‍ന്ന് 1991-ല്‍ ദി യുണിക്കോഡ് കണ്‍സോര്‍ഷ്യം എന്ന ഒരു സംഘടന രൂപീകരിച്ചത്. ഇന്ത്യാ ഗവണ്‍മെന്റിന്‍റെ ഇന്‍ഫര്‍മേഷന്‍ ടെക്നോളജി ഡിപ്പാര്‍ട്ട്മെന്റ ഇതിലെ ഒരു മുഴുവന്‍ സമയ അംഗമാണ്‍ .

ഇന്റര്‍നാഷണല്‍ സ്റ്റാന്‍റേര്‍ഡ് ഓര്‍ഗനൈസേഷനും യുണിക്കോഡും ചേര്‍ന്ന് 1992ല്‍ യൂണിക്കോഡ് വേര്‍ഷന്‍ 1.0 പുറത്തിറക്കി. ഇതു പരിഷ്കരിച്ച് 2.0യും 2000 ഫെബ്രുവരിയില്‍ 3.0യും പുറത്തിറങ്ങി. ISO 10646 -ല്‍ 32 ബിറ്റുപയോഗിച്ചിരുന്നിടത്ത് 16 ബിറ്റു മാത്രമേ യൂണിക്കോഡ് ഉപയോഗിക്കുന്നുള്ളൂ. അതായത് 16 സ്ഥാനങ്ങളിലായി ഒന്നും പൂജ്യവും നിരത്തി 65000-ല്‍ പരം അക്ഷരാദികളുടെ കോഡുകള്‍ നിര്‍മ്മിക്കാം. ഇവ 500 ഓളം ഭാഷകള്‍ക്കു മതിയാകും. പുരാതന ലിപികളും ഭാവിയില്‍ ഉണ്ടാകുന്ന ലിപികളും ഇതില്‍ ഉള്‍ക്കൊള്ളിക്കാന്‍ തക്കവിധത്തില്‍ ഇതിനെ വിപുലപ്പെടുത്താനും സാധിക്കുന്നതാണ്‍ . പ്രധാനപ്പെട്ട ലോകഭാഷകള്‍ മിക്കവാറും എല്ലാം തന്നെ ഉള്‍പ്പെട്ടുത്തി 49194 അക്ഷരാദികള്‍ക്ക് ഇതിനകം കോഡുകള്‍ നല്കിക്കഴിഞ്ഞു. ഇതില്‍ ചൈനീസും ജാപ്പനീസും ഉള്‍പ്പെടും. അടുത്തുതന്നെ ബര്‍മീസ്, സിന്‍ഹാളീസ്, സിറിയക് മുതലായ ഭാഷകളും ഇതിന്‍റേ കീഴില്‍ കൊണ്ടു വരുന്നതാണ്‍

യൂണിക്കോഡ് ഭാഷയിലെ അക്ഷരങ്ങള്‍ക്ക് കോഡുകള്‍ നല്‍കിയെങ്കിലും അവ എങ്ങനെ സ്ക്രീനില്‍ കാണണമെന്ന് ഹാര്‍ഡ്‍വേറും സോഫ്‍റ്റ്വേറും ഇറക്കുന്നവരാണ്‍ തീരുമാനിക്കുന്നത്. ലോക ഭാഷകള്‍ ഒരേ സ്ക്രീനില്‍ പ്രത്യക്ഷപ്പെടേണ്ടി വരുന്പോള്‍ ലോക പ്രശസ്തരായ IBM, മൈക്രോസോഫ്റ്റ്, ഒറാക്കിള്‍, ആപ്പിള്‍ എന്നിത്യാദി വമ്പന്മാരെല്ലാം യൂണിക്കോഡിനെ വാരിപ്പുണരുന്നതില്‍ അത്ഭുതപ്പെടാനില്ല. ഇന്റര്‍നെറ്റിന്‍റേ ലോകവ്യാപകമായ പ്രചാരത്തോടുകൂടി യൂണിക്കോഡും ഒരു ആഗോളലിപികളുടെ കോഡായിമാറിക്കഴിഞ്ഞു

9 ഇന്ത്യന്‍ ഭാഷകള്‍ക്കായി 128 X 9 = 1152 കോഡുകള്‍ (2304 മുതല്‍ 3455 വരെ) അലോട്ടുചെയ്തിരിക്കുന്നതില്‍ 3328 മുതല്‍ 3455 വരെയുള്ള 128 എണ്ണം മലയാള ലിപികള്‍ക്കാണ്‍ തന്നിരിക്കുന്നത്.
 

 

Home Site Map Contact Us