இவற்றிற்கான களஞ்சியம் 'Tamil Unicode' வகை

Oct 03 2006


தமிழ் ஒருங்குறி ?! – 17

ஒரு சட்டம், வரையறை, கோட்பாடு இயற்றுவதில் வெள்ளைக்காரன் கெட்டிக்காரன் தான். ஏனெனில், அவன் மற்ற இனத்தவர்களை விட இவைகளை இயற்ற முதலில் எத்தணித்தவன். ஆகவே, அவனுக்கு பல முறை முட்டி மோதி, பல முறை மேம்படுத்தி பழக்கப்பட்டவன். இன்றும், கையில் அதிகாரம் இருந்தால் கூட களவு செய்ய முடியாதபடி (அ) செய்தாலும் பிடிபடும்படி நுணுக்கமாக ஒரு கட்டமைப்பை உருவாக்கி இருப்பதால் தான், கடையின் சொந்தக் காரன் வீட்டில் இருக்க வேலைக்காரன் கல்லாவில் அமர்ந்தாலும் கடை நஷ்டத்தில் போவதில்லை.

ஆகவே, ஒருங்குறி அமைப்பின் சட்ட திட்டங்கள் சரியானதாகவே இருக்கலாம். ஒருங்குறி ஒரு உலக மொழி ஒருங்கமைப்பு என்ற ரீதியில் நோக்குவோமானால் அவர்களின் சட்ட திட்டங்கள் மிகச் சரியானவையே. அதையே, தமிழை மட்டும் பார்த்தால், தமிழுக்கு விவேகக் குறைவே. இருந்தாலும் தமிழை மட்டும் அவர்களால் பார்க்க இயலாது. ஆகவே அவர்கள் நிலைப்பாடு சரியானதே.

இதில் இருந்து என்ன கற்றுக்கொள்ள வேண்டிய விடயம்? இனிமேலாவது தமிழ் மொழியை யாரும் பார்த்துக்கொள்வார்கள் என்று விடாமல், நாம் தாம் நம் மொழியின் முன்னேற்றத்திற்கு உழைக்க வேண்டும். இதை தமிழர்கள் உணர்வார்களா என்பது கேள்விக்குறி.

ஒருங்குறி உதவி வருங்காலத்தில் சகல மென்பொருளிலும் வழங்கப்படும். அதில் ஐயமில்லை. ஆதலால், எதிர்காலத்தில் தமிழுக்கு பிரச்சனை இருக்காது. ஆனால், மற்றய இடர்களான இடம், வேகம் என்பன இருந்து கொண்டே தான் இருக்கும்.என்னதான் தொழில்நுட்பம் வளர்ச்சி அடைந்தாலும், இன்னமும் பலருக்கு கணினியே கிட்டாத நிலை தானே நிலவுகிறது. அப்படியாயின், ஒருங்குறி வேலை செய்யக்கூடிய கணினி கிட்ட இன்னும் எத்தனை காலம் எடுக்கும் என்பதை எதிர்காலம் பதில் சொல்லும். இவ்வளவு காலமும் தமிழுக்கு ஒரு பின்னடைவே. மற்றய மொழிகள் வளர்ந்து கொண்டு வருகையில் தமிழ் மிக மெதுவாகவே துளிர்க்கிறது. இணைய முகவரி 255 எழுத்துக்களுக்குள் இருத்தல் வேண்டும். தமிழில் இணைய முகவரி வைத்தால் இந்த கட்டுப்பாட்டை இலகுவாக தாண்டும். இதை இப்போதே சில வலைப்பதிவாளர்களின் இடுகைகளில் கவனிக்கலாம். மேலதிக எழுத்துக்கள் வெட்டப்படுவதால் ஒழுங்காக வேலை செய்யாமல் போய்விடும். [மேலும் அறிய இடுகைகளில் தமிழில் தலைப்பு வைக்கும்போது கவனிக்கப்பட வேண்டியவை] இதை சரி செய்ய இன்னும் கொஞ்ச காலம் அதிகமாக தேவை. போராடிப் போராடியே பழக்கப்பட்டவர்கள் நாம். இதில் தோற்று விடுவோமா என்ன?

என்னைப் பொறுத்த மட்டில் இந்திய அரசாங்கம் இனிமேல் எந்த மாற்று கருத்துக்களையும் ஒருங்குறி அமைப்புக்கு எடுத்துச் செல்ல ஆதரவளிக்காது. அரசே ஆதரவளிக்காத போது ஒருங்குறி அமைப்பும் அதற்கு பெரிய முக்கியத்துவம் கொடுக்கப்போவது இல்லை. எப்பவும் பட்ட பின் தானே தமிழனுக்கு ஞானம் வரும்.

இருந்தாலும், தமிழின் மேம்பட்ட வடிவமைப்பை இன்று செய்து வைத்திருந்தால், எதிர்காலத்தில் உதவலாம் தானே. இனிமேல் எதாவது ஒரு அமைப்பு புதிதாக ஒரு முயற்சி செய்தால், அதற்கு தமிழை சரியாக, மிக மேன்மையானதாக வளங்கக்கூடியதாக நாங்களே முயற்சி செய்ய வேண்டும். அடுத்த முறையும் தவறினால், “குட்டக் குட்டக் குனிபவன் மொக்கன்” என்ற கதையாகிவிடும்.

<< பாகம் – 16

One response so far

Oct 03 2006


இடுகைகளில் தமிழில் தலைப்பு வைக்கும்போது கவனிக்கப்பட வேண்டியவை

வலைப்பதிவில் இடுகைகள் இடும்போது, தமிழில் தலைப்பை வைப்பதினால் சில தொழில்நுட்ப சிக்கல்களுக்குள் தள்ளப்படுகிறார்கள், நமது தமிழ் வலைப்பதிவாளர்கள். அவற்றை சரி செய்ய வழியை இங்கே தருகிறேன்.

ஒருங்குறித் தமிழ் கணினியில் வேலை செய்தாலும், எல்லா இடங்களிலும் ஒருங்குறித் தமிழ் வேலை செய்யாது. இதற்குக் காரணம் தமிழ் இரண்டாம் தர மொழியாக ஒருங்குறியில் ஏற்றப்பட்டதே. [மேலும் அறிய தமிழ் ஒருங்குறி?!]

உங்கள் இடுகைகளை தமிழ் தலைப்பில் சேமிக்கும்போது வலைப்பதிவு மென்பொருள் அந்த தலைப்பை இணைய முகவரியாக எடுத்துக்கொள்கிறது. ஆனால், “போ” என்பது இணைய முகவரி இடும் இடத்தில் அப்படி சரியாகத் தெரியாது. அது இணைய முகவரிகளை சேமிக்கும் முறையில் மாற்றியே தெரியும். அது மட்டுமல்லாமல் “போ” என்பது தமிழ் ஒருங்குறியில் 2 குறிகள். ஒரு குறி அல்ல. அப்படித் தான் தமிழ் ஒருங்குறி அமைக்கப்பட்டு இருக்கிறது. இப்போது நீங்கள் உங்கள் இடுகைக்கு “நான்” என்று தலைப்பைக் கொடுத்தால் அது உண்மையில் 4 குறிகள். இணைய முகவரிக்கு 255 எழுத்துக்களை தாண்டக் கூடாது என்பது விதியாகும். இப்போது நீங்கள் ஒரு பெரிய தமிழ் பெயரைக் கொடுத்தால், மீதமுள்ள எழுத்துக்கள் காணாமல் போய்விடும். அப்போ உங்கள் இடுகைகள் தெரியாமல் “404 – Page Not Found” என்று காட்டும் அல்லது பின்னூட்டமிட முடியாமல் இருக்கும். இந்த 255 எழுத்துக் கட்டுப்பாடே இதற்குக் காரணம்.

இதே 255 எழுத்து கட்டுப்பாடுதான் தமிழ் குழுமங்களில் தமிழில் தலைப்பை வைத்து அதற்கு மறுமொழி மின்னஞ்சலூடாக அனுப்பும்போது இழை பிரிந்து புதியதோர் இழை உருவாகுகிறது. ஒரு மிக நீண்ட எழுத்துக்களைக் கொண்ட தலைப்பில் கடைசியில் சில ஒருங்குறி குறிகள் வெட்டப்பட்டாலுமே அவை புதிய இழையாகிவிடும். கவனிக்கவும். நான் இங்கு எழுத்து என்னும்போதெல்லாம் தமிழின் ஒரு எழுத்தைக் குறிப்பிடவில்லை. தமிழ் “போ” என்பது ஒருங்குறியில் 2 குறிகள். அதே இணைய முகவரியில் இந்த இரண்டு குறிகளுமே மேலும் பல குறிகளாக மாற்றித் தான் உபயோகப்படுத்தப்படுகிறது. தமிழில் இரண்டெழுத்து தலைப்பு இணைய முகவரியாகும்போது பல எழுத்துக்கள்!
இதை சரி செய்ய வழிகள்:

  1. இடுகைகளுக்கு எந்தத் தலைப்பையும் கொடுக்காமல் முதலில் பிரசுரியுங்கள். வலைப்பதிவு மென்பொருள் [WordPress/ Blogspot] தானாகவே ஒரு இலக்கத்தைக் கொடுத்து சேமிக்கும். பின் அந்த இடுகையை திருத்த முயற்சி செய்து [edit], உங்களுக்கு விருப்பமான தலைப்பை கொடுக்கவும். இப்போ உங்கள் இடுகை ஒரு இலக்கமாக சேமித்து இருந்தாலும், மற்றவர்களுக்கு இடுகைத் தலைப்பு சரியாக உங்கள் விருப்பம் போல் தெரியும்.
  2. இடுகைகக்கு ஆங்கில தலைப்பைக் கொடுங்கள். பிரசுரித்த பின் மீண்டும் திருத்த முயற்சி செய்து [edit] உங்களுக்கு விருப்பமான தலைப்பை [தமிழிலோ] கொடுக்கலாம். இப்போ உங்கள் இடுகை ஆங்கில சொற்களால் சேமித்து இருந்தாலும், மற்றவர்களுக்கு இடுகைத் தலைப்பு சரியாக உங்கள் விருப்பம் போல் தெரியும்.
  3. WordPress உபயோகிப்பவர்களுக்கு மட்டும்:
    நீங்கள் புதிய இடுகை எழுத எத்தணிக்கும் போது உங்கள் வலது புறத்தில் சிறு சிறு தகவற் துளி போல் இருக்கும். அதில் “Post Slug” என்பதைக் கண்டு பிடியுங்கள். அதற்கு அருகாமையில் இருக்கும் ‘+’ சக குறியை தட்டி விரித்தால், ஒரு பெட்டி வரும். அந்தப் பெட்டிக்குள் நீங்கள் விருப்பமான ஆங்கில (அ) எண்ணில் தலைப்பை கொடுக்கலாம். அதே நேரத்தில் “Write Post” என்பதற்கு கீழ் உள்ள “Title” என்னும் இடத்தில் தமிழில் தலைப்பைக் கொடுக்கலாம். இது மேலே சொல்லப்பட்ட மேலதிக வேலையை இல்லாமல் ஆக்குகிறது.

Wordpress' Post Slug not expanded

Wordpress' Post Slug expanded

Wordpress' Post Slug and Title filled

பி.கு.: தேடு தளங்கள் [Search engines] இணைய முகவரியில் வரும் சொற்களுக்கு அதிக முக்கியத்துவம் கொடுக்கும். ஆகவே, நீங்கள் உங்கள் இடுகையை எண் கொடுத்து சேமித்தால் (அ) “blog-spot_25” என்று சேமித்தால் உங்கள் இடுகையை கண்டுபிடித்து அதிக புள்ளி கொடுக்கும் சந்தர்ப்பம் குறையும். நீங்கள் ஆங்கில/ தமிழ் சொற்களில் சேமித்தால், அந்த சொற்களை தேடும்போது உங்கள் இடுகைக்கும் முக்கியத்துவம் கூட கொடுக்கப்படும், தேடு தளங்களால்.

ஆனால் இன்னும் ஒருங்குறியின் இரண்டாம் தர மொழிகளுக்கு [தமிழ் உட்பட] இணைய முகவரியில் போதுமான உதவி இல்லாததால், தமிழின் ஒவ்வொரு எழுத்துக்களும் “%e0%ae%aa%e0%ae%bf%e0%ae%” இப்படி குதர்க்கமாக பிரித்து தான் தெரியும். நீங்கள் உங்கள் இடுகையின் முகவரியை வேறொருவருக்கு கொடுக்க எத்தணிக்கும்போதோ (அ) உங்கள் வலைப்பதிவு பயனர் உங்கள் இடுகையின் இணைய முகவரியை வேறொருவருக்கு கொடுக்க விரும்பினால் உங்கள் இடுகையின் இணைய முகவரி மிக நீண்டதாக, குதர்க்கம் நிறைந்ததாக காணப்படும்.

சிறிய இணைய முகவரியாக வருவதற்காகவும், தேடு தளங்களில் உங்கள் இடுகையின் மதிப்பு அதிகரிக்கவும் இடுகைகளை ஆங்கில சொற்கள் [உங்கள் இடுகையின் கருத்து பொறிந்த சொற்கள்] கொண்டு சேமித்தல் நன்று என்பது என் அறிவுறை.

______
CAPital

5 responses so far

Sep 23 2006


தமிழ் ஒருங்குறி ?! – 16

– ஒருங்குறியின் மேன்மை
– பிற மொழிகள் இடம்பெற்ற முறை
– தமிழ் மொழிக்கு உள்ள இடம்
– தமிழ் அறிஞர்கள் செய்யத் தவறிய செயல்
– தமிழுக்கு உள்ள சிக்கல் / அதனால் தமிழுக்குரிய பாதிப்பு
– தமிழுக்குக் கிடைக்க வேண்டிய இடம்
– தமிழை உயர்த்த செய்ய வேண்டிய பணிகள்
– போன்ற கருத்துகளுடன் நான் எடுத்துக் காட்ட விரும்பும் செயல் திட்டம் போன்றவற்றை பவர் பொய்ன்றில் கொடுத்துள்ளேன்.

ஒருங்குறியும் தமிழும்

மேலே உள்ள சுட்டியை தட்டி பவர் பொய்ன்றை தரையிறக்கிக் கொள்ளவும்.
______
CAPital

பி.கு. :-
பவர் பொய்ன்றில் தமிழ் சரியாகத் தெரியாதவர்கள் TSCu_Paranar.ttf எழுத்துருவை தரை இறக்கி நிறுவிப் பார்க்கவும். ஒருங்குறிக்கே இந்த நிலமையா! 🙁

TSCu_Paranar

தரையிறக்கியவுடன் TSCu_Paranar.txt என்னும் கோப்பின் பெயரை TSCu_Paranar.ttf என்று மாற்றுக.

பாகம் – 17 >>

<< பாகம் – 15

9 responses so far

Aug 28 2006


தமிழ் ஒருங்குறி ?! -15

Filed under Tamil Unicode

இது தான் ஒருங்குறியில் உள்ள உலக மொழிகளின் அட்டவணை:
http://www.unicode.org/charts/

நன்றாகக் கவனிக்கவும்:

Armenian
Armenian Ligatures

Coptic
Coptic in Greek block

Cyrillic
Cyrillic Supplement

Georgian
Georgian Supplement

Greek
Greek Extended
Ancient Greek Numbers
Ancient Greek Musical

Basic Latin
Latin-1
Latin Extended A
Latin Extended B
Latin Extended C (5.0)
Latin Extended D (5.0)
Latin Extended Additional
Latin Ligatures
Fullwidth Latin Letters
Small Forms

இவ்வாறு பல தரப்பட்டுள்ளது. நமது தமிழுக்கும் இதைப் போல் ஒரு “Tamil
Supplement” என்று தற்போது தமிழ் ஒருங்குறியில் இல்லாத எழுத்துக்களை ஏற்ற
முயற்சிக்கலாம்.

ஒருங்குறி அட்டவணையைப் பாருங்கள். ஏறக்குறைய அதில் உள்ள எல்லா மொழிகளுக்கும்
“Supplement”, “Extended” என்ற எதோ ஒரு முறையில் தமது எல்லா எழுத்துக்களையும்
ஏற்றியிருக்கிறார்கள் அம் மொழி வல்லுனர்கள்.

ஏன் Latin எழுத்துக்களுக்கே எத்தனையோ “Extended” எழுத்துக்களை
ஏற்றியிருக்கிறார்கள். எத்தியோப்பியா “Supplement” என்றும் “Extended” என்றும்
ஏற்றியிருக்கிறார்கள்.

அது மட்டுமல்ல சீனா, கொறியா, மற்றும் ஜபான், ஆகியவை அவைகளது எழுத்துக்கள்
மிகவும் அதிகமான பட்சத்திலும் எல்லா எழுத்துக்களையும் ஏற்றி இருக்கிறார்கள்.
சில கோப்புகளைக் கவனிக்கவும். 13MB, 5MB, 2MB என்று எல்லாம் பெரிதாக
இருந்தாலும் எல்லா எழுத்துக்களையும் ஏற்றி இருக்கிறார்கள்.

ஃபிரஞ்சு, ஸ்பானிஷ் போன்ற மொழிகளில் accent [அக்ஸன்ற்] என்று சொல்லும் குறியீடுகளுடன்
எழுத்துக்கள் இருக்கு. அவ் எழுத்துக்கள் எழுத்து வேறு “அக்ஸன்ற்” வேறு ஆகவும்
இருக்கிறது; தனி எழுத்தாகவும் இருக்கிறது. இவ்வாறு இரண்டு விதமாக அவர்கள்
ஏற்றியிருக்கிறார்கள், ஆனால் தமிழுக்கு மட்டும் அப்படியாயினும் எற்றவில்லை
இந்திய அரசு.

பாகம் – 16 >>

<< பாகம் – 14

_____
CAPital

5 responses so far

Jul 28 2006


தமிழ் ஒருங்குறி ?! -14

Filed under Tamil Unicode

நான் சொன்ன தமிழ் எழுத்துக்கள் யாவற்றையும் கணினியில் ஏற்றுதல் என்பது, விசைப்பலகையில் [keyboard] ஏற்றுதல் என்பதல்ல.

பேச்சுக்குச் சொன்னால் கணினியின் மூளையில் ஏற்றுவது. அதாவது ஒருங்குறி என்பது விசைப்பலகை அல்ல. அது ஒரு தகுதரம் [Standard for Computer Information Interchange]். அந்த தகுதரத்தில் தமிழை சரியாக ஏற்றியிருக்கலாம்.

இப்ப எத்தனை கீகள் விசைப்பலகையில் இருக்கிறதோ, அத்தனையே வைத்திருக்கலாம். வேணுமென்றால், கூட்டி (அ) குறைத்துக் கூட வைத்திருக்கலாம்.

அதாவது ஃபிரஞ்சு, ஜேர்மன், ஸ்பானிய மொழிகளில் உள்ளது போல் தமிழிலும் எல்லா எழுத்துக்களையும் ஏற்றியிருக்கலாம். à, á, â, ã, å̀́ இவை இங்கே காண்பது போல் ஒரு எழுத்தாகவும், பிரித்து தனித் தனியாகவும் a, ̀, ́, ˆ, ˜, ˚ ஏற்றப்பட்டிருக்கிறது.

இனிமேல் தமிழுக்கு அவ்வளவு இடங்கள் கிடைக்கும் என்று நம்பிக்கை இல்லை தான். அப்படி கிடைத்தாலும் ஏற்கனவே இப்போதிருக்கும் ஒருங்குறியில் ஊறிப்போனவர்கள் மாற்றத்தை விரும்ப மாட்டார்கள்.

அப்ப பிறகேன் இந்தக் கதறல்?
விட்டது பிழை என்று ஒத்துக்கொள்ளலாம்ல… இல்லை. தமிழ் மொழி இப்படித் தான். எழுத்தை ஒழுங்குமாறி வைத்து பிரித்து பிரித்து சேர்த்தால் தான் தமிழ் கணினியில் தெரியும். இல்லையேல் தமிழ் பிழையாகிவிடும். சும்மா ஏமாத்தக்கூடாது எல்லே.

தமிழ் மொழியின் எழுத்தின் வகைகளைப் புரிந்து கொள்ள எழுத்தைப் பிரித்துதான் சேமிக்க வேண்டிய அவசியமில்லை. கணினிக்கு எழுத்து தெரிவதில்லை, அதற்குண்டான இலக்கம் மட்டுமே தெரியும். அந்த இலக்கத்தை வைத்து இது எந்த மெய், எந்த உயிர் என்று அறியலாம். [TUNE இல் அப்படி செய்திருக்கிறார்கள்]

ஏன் தமிழில் கையாளும்போது இவ்வளவு சிரமம், வேகக் குறைவு, சேமிக்க அதிக இடம் என்று சாதரண கணினி உபயோகிக்கும் தமிழனுக்கு தெரியாது. அவன் சிந்தனையில் தமிழ் மொழி கணினியில் இப்படித் தான் இருக்கும் என்று மட்டுமே அறிந்திருப்பான். அவன் ஒரு ஃபிரஞ்சு, ஜேர்மன், ஸ்பானிய, சீனா, ஜப்பான், (அ) கொரியா மொழி தெரிந்தவனாக இருந்தால், தமிழில் எழுதுவதை விட அந்த மொழியில் எழுதினால் சகலவிதத்திலும் மேன்மை என்று யோசிப்பான். இன்றய காலத்தில் தமிழ் தெரிந்திருந்தாலும், ஆங்கிலத்தில் எழுதுவது இலகுவாக இருப்பது போல்.

கணினியில் ஒரு மென்பொருள் தயாரிக்கும் போது மிகவும் முக்கியமானது அந்த மென்பொருள் மிகவும் வேகமாக செயற்பட வேண்டுமென்பது. தமிழில் கணினி மொழியை [programming in Tamil script] எழுதினால் வெறும் எழுத்தைக் கையாள்வதற்கே ஒரு பகுதி வேகம் போய்விடும். பற்றாததற்கு, அந்த மென்பொருளின் சேமிக்கும் இடம் கூட அதிகமாகும். மென்பொருளை கணினிக்கு இறக்குமதி செய்ய காலம் காத்திருப்பவர்களுக்கு இது இன்னும் பெரிதாக்கும். இதையெல்லாம் அறிந்த ஒரு கணினி மொழி [computer programming்] வல்லுனர் ஒருபோதும் தமிழை கணினி மொழியாக தேர்ந்தெடுக்க மாட்டார். வெறும் பல்கலைக்கழகங்களில் சோதனைப் பயிற்சியாக மட்டுமே இருக்கும்.

 

 

பாகம் – 15 >>

<< பாகம் – 13

_____
CAPital

One response so far

பழைய இடுகைகள் »

அடடா » தவறு

Sorry, you are not allowed to access this page.