राजेश रंजन का आलेख - अपना कंप्यूटर अपनी भाषा में - भाग 3 - इनपुट विधियाँ व भाषाई फ़ाइलें

SHARE:

(भाग 2 से जारी) 4. इनपुट विधि व गेटटेक्सट् ‌ इनपुट विधि इनपुट विधि की ज़रूरत इसलिए सामने आती है कि हरेक भाषा का स्वरूप एक सा नहीं हो...

(भाग 2 से जारी)

4. इनपुट विधि गेटटेक्सट्

इनपुट विधि

इनपुट विधि की ज़रूरत इसलिए सामने आती है कि हरेक भाषा का स्वरूप एक सा नहीं होता है और विभिन्न भाषाओं के वर्ण के रूप और आकार भिन्न भिन्न तरह से आचरण करते हैं. इनपुट विधि वास्तव में ऑपरेटिंग तंत्र अथवा किसी प्रोग्राम का हिस्सा होती है जो उपयोक्ता को उन वर्णों संकेतों को दर्ज करने में सहायक होती है जो कि उनकी इनपुट युक्ति यानी कुंजीपट पर सामान्यतः नहीं मौजूद होता है. कुछ भाषाओं में तो हज़ारों वर्ण होते हैं जिसे एक परंपरागत कुंजीपट पर फ़िट करना किसी भी तरह संभव नहीं है. इसी तरह भारतीय भाषाओं में संयुक्ताक्षर में बदलने से कई प्रकार के रूप बनते हैं.

ग़ैर लातिन वर्णों के इनपुट के लिए इनपुट विधि की ज़रूरत होती है. वास्तव में लोकलाइज़ेशन के लिए हमें इन इनपुट विधियों को सक्रिय करने की ज़रूरत होती है. लिनक्स प्लेटफ़ॉर्म पर कई इनपुट विधियाँ रही हैं. पहले की प्रमुख इनपुट विधियों में X KeyBoard Extension (XKB), X Input Method (XIM), GTK+ IM, IIIMF Framework रहे हैं. पिछले कुछ वर्षों में स्मार्ट कॉमन इनपुट मेथड (SCIM ) काफ़ी लोकप्रिय रहा है. इधर आईबस (iBus) एक बहुभाषी इनपुट विधि फ़्रेमवर्क है जिसने समुदाय में अपनी ख़ूबियों के कारण लोकप्रियता अर्जित की है.

 
  clip_image002[3]
 
  clip_image004[3]

गेटटेक्स्ट् ( Gettext)

यदि किसी भी सॉफ़्टवेयर का स्थानीयकरण किसी और भाषा में करना है, तो उन स्ट्रिंग व संदेशों को इकट्ठा करना होगा जिसे अनूदित किया जाना है. अनूदित किए जानेवाले संदेशों की पहचान के बाद उन संदेशों को एक फ़ाइल में लाना होगा ताकि उसे किसी तकनीकी अनुवादक को अनुवाद करने के लिए दिया जा सके. Gettext प्रारूप में इन फ़ाइलों को .pot एक्सटेंशन दिया जाता है और सामान्यतः उसे POT फ़ाइल कहा जाता है. POT पोर्टेबल ऑब्जेक्ट टेंपलेट का संक्षिप्ताक्षर है. यही फ़ाइल अनुवादक के लिए टेंपलेट का काम करता है. अनुवादक जब POT पर काम करना शुरू करता है तो वह POT को PO में बदल कर काम करता है.

अनुवादक अब इन फ़ाइलों के स्ट्रिंग्स या लड़ियों का बारी-बारी से अपनी भाषा में तर्जुमा कर सकता है. मूल स्ट्रिंग msgid के रूप में रहता है और अनूदित स्ट्रिंग msgstr के रूप में. इस तरह का फ़ायदा यह है कि सॉफ़्टवेयर विकास व अनुवाद दोनों काम साथ-साथ चलता रहता है. लिनक्स प्लेटफ़ॉर्म के 90 प्रतिशत से अधिक अनुप्रयोग gettext फ़्रेमवर्क के अंतर्गत स्थानीयकृत किये जाते हैं.

gettext फ़्रेमवर्क से होकर अंतरराष्ट्रीयकरण व स्थानीयकरण करने में कई चरण होते हैं. इसमें स्थानीयकरण के लिए स्रोत कोड को तैयार करना, स्ट्रिंग निकालना, उसका अनुवाद, अनुवाद को कंपाइल या समेकित करना शामिल है. स्ट्रिंग निकालने के लिए xgettext प्रोग्राम का प्रयोग किया जाता है.

ग़ैर अनूदित पीओ फ़ाइल का एक नमूना देखें:

 
 

# Copyright (C) YEAR Free Software Foundation, Inc.

# FIRST AUTHOR <EMAIL@ADDRESS>, YEAR.

#

#, fuzzy

msgid ""

msgstr ""

"Project-Id-Version: PACKAGE VERSION\n"

"POT-Creation-Date: 2002-05-28 09:28+0200\n"

"PO-Revision-Date: YEAR-MO-DA HO:MI+ZONE\n"

"Last-Translator: FULL NAME <EMAIL@ADDRESS>\n"

"Language-Team: LANGUAGE <LL@li.org>\n"

"MIME-Version: 1.0\n"

"Content-Type: text/plain; charset=CHARSET\n"

"Content-Transfer-Encoding: 8bit\n"

अनुवाद करने के लिए हेडर में परिवर्तन अपेक्षित है जो कुछ इस तरह का होता है:

clip_image005[3]

फिर अनुवाद करके कंपाइल करना पड़ता है और कंपाइल mo द्विपदीय फ़ाइल प्रारूप में करना होता है. निम्नलिखित कमांड mo फ़ाइल बनाता है...

prompt# msgfmt helloworldintl.po -o helloworldintl.mo

और निम्नलिखित जगह पर mo फ़ाइल की नक़ल रखनी पड़ती है:

/usr/share/locale/hi/LC_MESSAGES/

विस्तार से देखें:

.po फ़ाइल को .mo में निम्नलिखित कमांड के प्रयोग से बदलें:

msgfmt -o filename.mo filename.po
उदाहरण के लिए,

msgfmt gedit.po -o gedit.mo

· LC_MESSAGES निर्देशिका में जाएँ

cd /usr/share/locale/<locale-dir>/LC_MESSAGES
उदा.

cd /usr/share/locale/hi/LC_MESSAGES

· नवनिर्मित .mo फ़ाइल की यहाँ नक़ल लें और इसे पुराने .mo फ़ाइलनाम के अनुसार नाम दें (रूट अधिकार अनिवार्य)

cp filename.mo .
उदा.

cp gedit.mo . ( . मौजूदा अवस्थिति बताता है यानी /usr/share/locale/<locale-dir>/LC_MESSAGES)
mv gedit.mo gedit-2-22.mo

· इस कमांड के प्रयोग से अपने लोकेल के लिए अनुप्रयोग चलाएँ: (रूट अधिकार यहाँ ज़रूरी नहीं है)

LANG=<lang_code>.UTF-8 application name
उदा.

LANG=hi_UTF-8 gedit

जरूरी कमांड:

clip_image006[3]

जरूरी कड़ियाँ:

http://code.google.com/p/ibus/

http://en.wikipedia.org/wiki/Intelligent_Input_Bus

http://www.gnu.org/software/gettext/

http://en.wikipedia.org/wiki/GNU_gettext

 

clip_image0024_thumb

(राजेश रंजन)

राजेश रंजन विगत कई वर्षों से हिन्दी कंप्यूटरीकरण
के कार्य से जुड़े हुए हैं. वे अभी एक बहुदेशीय
सॉफ्टवेयर कंपनी रेड हैट में बतौर लैंग्वेज मेंटेनर हिन्दी
के रूप में कार्यरत हैं. वे कंप्यूटर स्थानीयकरण की कई
परियोजनाओं जैसे फेडोरा, गनोम, केडीई, ओपनऑफिस,
मोज़िला आदि से जुड़े हैं. साथ ही कंप्यूटर अनुवाद में
मानकीकरण के लिए चलाए गए एक महत्वाकांक्षी सामुदायिक
परियोजना फ़्यूल के समन्वयक भी हैं. इसके अलावे उन्होंने
मैथिली कंप्यूटिंग के कार्यों को भी अपनी देख-रेख में
मैथिली समुदाय के साथ पूरा किया है. वे प्रतिष्ठित मीडिया
समूह इंडियन एक्सप्रेस ग्रुप के जनसत्ता और लिटरेट
वर्ल्ड के साथ काम कर चुके हैं.

हिन्दी पत्रकारिता में भारतीय जनसंचार संस्थान, नई दिल्ली
से स्नातकोत्तर डिप्लोमा पाने के पहले इन्होंने नेतरहाट विद्यालय,
साइंस कॉलेज, पटना और किरोड़ीमल कॉलेज, दिल्ली जैसे
जाने-माने संस्थानों में अध्ययन किया है. भाषाई तकनीक, इंटरनेट,
कंप्यूटर पर इनके लेखादि लगातार प्रकाशित होते रहते हैं.

 

कॉपीराइट © राजेश रंजन, सर्वाधिकार सुरक्षित.

क्रियेटिव कॉमन्स एट्रीब्यूशन शेयर एलाइक लाइसेंस के अंतर्गत.

(अगले भाग 4 में जारी...)

COMMENTS

BLOGGER: 1
आपकी अमूल्य टिप्पणियों के लिए आपका हार्दिक धन्यवाद.
कृपया ध्यान दें - स्पैम (वायरस, ट्रोजन व रद्दी साइटों इत्यादि की कड़ियों युक्त)टिप्पणियों की समस्या के कारण टिप्पणियों का मॉडरेशन लागू है. अतः आपकी टिप्पणियों को यहां पर प्रकट होने में कुछ समय लग सकता है.

नाम

तकनीकी ,1,अनूप शुक्ल,1,आलेख,6,आसपास की कहानियाँ,127,एलो,1,ऐलो,1,कहानी,1,गूगल,1,गूगल एल्लो,1,चोरी,4,छींटे और बौछारें,148,छींटें और बौछारें,341,जियो सिम,1,जुगलबंदी,49,तकनीक,56,तकनीकी,709,फ़िशिंग,1,मंजीत ठाकुर,1,मोबाइल,1,रिलायंस जियो,3,रेंसमवेयर,1,विंडोज रेस्क्यू,1,विविध,384,व्यंग्य,515,संस्मरण,1,साइबर अपराध,1,साइबर क्राइम,1,स्पैम,10,स्प्लॉग,2,हास्य,2,हिंदी,5,हिन्दी,509,hindi,1,
ltr
item
छींटे और बौछारें: राजेश रंजन का आलेख - अपना कंप्यूटर अपनी भाषा में - भाग 3 - इनपुट विधियाँ व भाषाई फ़ाइलें
राजेश रंजन का आलेख - अपना कंप्यूटर अपनी भाषा में - भाग 3 - इनपुट विधियाँ व भाषाई फ़ाइलें
http://lh6.ggpht.com/-_j99PHqAKbM/UyQ56EA9DEI/AAAAAAAAXpM/DaW_wYsMGNQ/clip_image002%25255B3%25255D_thumb.png?imgmax=800
http://lh6.ggpht.com/-_j99PHqAKbM/UyQ56EA9DEI/AAAAAAAAXpM/DaW_wYsMGNQ/s72-c/clip_image002%25255B3%25255D_thumb.png?imgmax=800
छींटे और बौछारें
https://raviratlami.blogspot.com/2014/03/3.html
https://raviratlami.blogspot.com/
https://raviratlami.blogspot.com/
https://raviratlami.blogspot.com/2014/03/3.html
true
7370482
UTF-8
Loaded All Posts Not found any posts VIEW ALL Readmore Reply Cancel reply Delete By Home PAGES POSTS View All RECOMMENDED FOR YOU LABEL ARCHIVE SEARCH ALL POSTS Not found any post match with your request Back Home Sunday Monday Tuesday Wednesday Thursday Friday Saturday Sun Mon Tue Wed Thu Fri Sat January February March April May June July August September October November December Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec just now 1 minute ago $$1$$ minutes ago 1 hour ago $$1$$ hours ago Yesterday $$1$$ days ago $$1$$ weeks ago more than 5 weeks ago Followers Follow THIS PREMIUM CONTENT IS LOCKED STEP 1: Share to a social network STEP 2: Click the link on your social network Copy All Code Select All Code All codes were copied to your clipboard Can not copy the codes / texts, please press [CTRL]+[C] (or CMD+C with Mac) to copy Table of Content