Sep 23 2006
தமிழ் ஒருங்குறி ?! – 16
– ஒருங்குறியின் மேன்மை
– பிற மொழிகள் இடம்பெற்ற முறை
– தமிழ் மொழிக்கு உள்ள இடம்
– தமிழ் அறிஞர்கள் செய்யத் தவறிய செயல்
– தமிழுக்கு உள்ள சிக்கல் / அதனால் தமிழுக்குரிய பாதிப்பு
– தமிழுக்குக் கிடைக்க வேண்டிய இடம்
– தமிழை உயர்த்த செய்ய வேண்டிய பணிகள்
– போன்ற கருத்துகளுடன் நான் எடுத்துக் காட்ட விரும்பும் செயல் திட்டம் போன்றவற்றை பவர் பொய்ன்றில் கொடுத்துள்ளேன்.
ஒருங்குறியும் தமிழும்
மேலே உள்ள சுட்டியை தட்டி பவர் பொய்ன்றை தரையிறக்கிக் கொள்ளவும்.
______
CAPital
பி.கு. :-
பவர் பொய்ன்றில் தமிழ் சரியாகத் தெரியாதவர்கள் TSCu_Paranar.ttf எழுத்துருவை தரை இறக்கி நிறுவிப் பார்க்கவும். ஒருங்குறிக்கே இந்த நிலமையா! 🙁
தரையிறக்கியவுடன் TSCu_Paranar.txt என்னும் கோப்பின் பெயரை TSCu_Paranar.ttf என்று மாற்றுக.
9 responses so far
“ஒருங்குறி” பற்றிபல தகவல்கள்
அறியத்தமக்கு நன்றிகள்,
தொடர்ந்தும் எதிர்பார்கிறோம்
[…] பாகம் – 16 >> […]
[…] ஒருங்குறித் தமிழ் கணினியில் வேலை செய்தாலும், எல்லா இடங்களிலும் ஒருங்குறித் தமிழ் வேலை செய்யாது. இதற்குக் காரணம் தமிழ் இரண்டாம் தர மொழியாக ஒருங்குறியில் ஏற்றப்பட்டதே. [மேலும் அறிய தமிழ் ஒருங்குறி?!] […]
[…] << பாகம் – 16 […]
உங்கள் ஆவணத்தைப் படித்தேன். தற்போதுள்ள குறியேற்றத்தில் பல பிழைகள் உள்ளன என்பது பலரும் அறிந்ததே. ஆனால் அதற்கு மற்றாக முன்வைக்கப்படும் TUNE திட்டம் இந்தப் போதாக்குறைகளைக் களையும் என்று எந்த உத்தரவாதமும் இருப்பதாகத் தெரியவில்லை.
நான் எனது இடுகையில் குறிப்பிட்டுள்ளது போல் பல செயல்பாடுகளில் (தேடல், போன்றவை) TUNE வந்தாலும் முன்னேற்றமிருக்காது என்றுதான் தோன்றுகிறது. மேலும் ஐம்பது குறியீடுகளுக்கு பதிலாக முன்னூறு குறியீடுகளைக் கையாள வேண்டிய நிலை ஏற்பட்டால் அது கணிமையின் செயல்திறனை எவ்வாறு பாதிக்கும் என்பதையும் யோசிக்க வேண்டும். எழுத்துரு கோப்புகளின் அளவு, அவற்றை உருவாக்கத் தேவைப்படும் உழைப்பு, அவற்றைக் கையாளத் தேவைப்படும் கணித்திறன்……… இவையனைத்துமே பல மடங்கு பெருகலாமென்பது எனது ஊகம். நூற்றுக்கணக்கான குறியீடுகளைக் கொண்ட சீன, ஜப்பானிய மொழிப் பயனர்களின் அனுபவம் எப்படியென்று தெரியவில்லை.
ஐயா,
நீங்கள் சொல்லும் கணினி செயற்திறன் அதிகமாக TUNE இற்குத் தான் தேவைப்படும் என்பது தவறென்பது என் கருத்து.
இப்போது உள்ள தமிழ் ஒருங்குறியில் “க்” என்பது இரண்டு குறிகள்; “கா” என்பதும் இரண்டு குறிகள்; “கோ” என்பது இரண்டு (அ) மூன்று குறிகள்; “கௌ” என்பதும் இரண்டு (அ) மூன்று குறிகள். இப்படி க் [2], க [1], கா [2], கி [2], கீ [2], கு [2], கூ [2], கெ [2], கே [2], கை [2], கொ [3/2], கோ [3/2] கௌ [3/2]. எல்லா உயிர்மெய் எழுத்துக்களும் இப்படியே! நீங்கள் சொல்லுவது போல் 50 குறிகள் தான் அடிப்படை என்றாலும், தமிழ் சரியாகத் தெரிய அதை விட அதிகமான குறிகளே கட்டாயமாகத் தேவை என்பது தான் நிதர்சனம்.
சரி நான் சொல்லும் சிறு பரிசோதனை செய்து பாருங்கள். கீழே உள்ள ஆங்கில எழுத்துக்களை ஒரு notepad இல் சேமியுங்கள். அதைப் போல் அதே தமிழையும் [கீழே கொடுக்கப்பட்டுள்ளது] சேமியுங்கள். இப்போது அந்தந்த கோப்புகளின் property இற்குச் சென்று எவ்வளவு இடம் தேவைப்பட்டுள்ளது என்று கவனியுங்கள். இதையே TUNE இற்கும் செய்து பாருங்கள்.
veedikkai ennavenRaal ezhuthiya thamizh kadduraiyai thamingkilishil seemippathaRku thamizhai vida kuRaivaana idangkaLee pidikkum! [வேடிக்கை என்னவென்றால் எழுதிய தமிழ் கட்டுரையை தமிங்கிலிஷில் சேமிப்பதற்கு தமிழை விட குறைவான இடங்களே பிடிக்கும்!]
சரி வெறும் இடம் தானே அதிகமாக பிடிக்குது என்பதில்லை. மேலும் இதை எனது இடுகை ஒன்றில் விளக்கி உள்ளேன். கீழே உள்ள இணைய முகவரிக்குச் சென்று பார்வையிடவும்.
http://1paarvai.wordpress.com/2006/07/27/tamil-unicode-p-13/
______
CAPital
பரிசோதித்துப் பார்க்காமலேயே நீங்கள் கூறுவது உண்மை என்பதை ஒப்புக்கொள்கிறேன்.
ஆனால் நான் கூறுவது வேறு. ஒரு ஆவணத்தைச் சேமிக்க அதிக இடம் தேவைப்படும் என்றாலும், குறைவான குறியீடுகளைக் கொண்ட ஒரு மொழியமைப்பைக் கணிமைப்படுத்துவது எளிதாயிருக்கும். உ-ம், தமிழ் எழுத்துருக் கோப்புகள் (font files) சில KB அளவே என்றால், சில கிழக்காசிய மொழிகளின் எழுத்துருக் கோப்புகளின் அளவு MBகளை எட்டுகின்றன. காரணம் அம்மொழிகளிலுள்ள நூற்றுக்கணக்கான குறியீடுகள். TUNE எழுத்துருக்களின் நிலையும் அதே வகையாக அமையும் என்றே தோன்றுகிறது. ஒரு bloated அமைப்பை நிர்வகிக்க கணியாற்றல் தேவை அதிகமாகும் என்பதை ஊகிப்பது கடினமல்ல. (எளிதில் புரிந்து கொள்ள வேண்டுமென்றால் ஒரு GB அளவுள்ள databaseஐயும் ஒரு terabyte அளவுள்ள databaseஐயும் நினைத்துப் பாருங்கள். முன்னதை நிர்வாகம் செய்ய அதிக கணியாற்றல் தேவைப்படுமா, அல்லது பின்னதை நிர்வாகம் செய்ய அதிக கணியாற்றல் தேவைப்படுமா? TUNE is like a terabyte-sized database.)
இப்படியாக, தற்போது ஒரு எளிய மொழி என்றிருக்கும் நிலையிலிருந்து ஒரு கடினமான மொழி என்ற நிலையை அடைவதற்கு முயற்சி செய்வதையே நான் விமர்சிக்கிறேன்.
பி.கு. – உங்கள் அடுத்த இடுகையை இன்னமும் படிக்கவில்லை, படித்துவிட்டு கருத்திடுகிறேன்.
தமிழில் வலையெழுதிப் பார்க்க ஆசை! HTML எல்லாம் தமிழிலேயே இருக்க வேண்டும் என்று கனவு காண்கிறேன். எவரின் உதவியுமின்றி, தமிழ் எழுதத் தெரிந்தவர் வலையெழுதும் ஆற்றலைப் பெற வேண்டும்.
முயற்சி செய்யுங்கள்.
வாழ்த்துகிறேன்
இரவா
அன்பார்ந்தீர்!
வணக்கம்.
நல்ல முயற்சிக்கு இனிய வாழ்த்த்கள்.
அன்பிலே,
முனைவர் பா.இறையரசன்