ڈاکٹر حافظ صفوان محمد چوہان
hafiz.safwan@gmail.com
مشین ریڈایبل اردو رسم الخط:
حروف کی کَشتیاں، اِعراب، نقطے، شوشے اور کششیں
The conventional Urdu script is Perso-Arabic in style & structure. Diacritic marks were added to the ghost characters initially for the ease of foreign speakers and users of these languages. This article deals with the fact that characters and diacritic marks are two different things; and if they are treated as such, machine readable Urdu can benefit a lot thanks to this thesis.
In the recent past, the Unicode Consortium has allotted alphabet status to various shapes of dots on the proposal of National Language Authority of Pakistan where R&D on Urdu language is underway at the Centre of Excellence for Urdu Informatics. Putting threats such as ambiguity and spoofing aside, add to many other areas of informatics like provision of writing almost all scripts of Pakistani languages in complete machine-readable format, this approach is likely to advance a twist in the development of Urdu OCR.
کلیدی الفاظ: ضابطہ تختی (کوڈ پلیٹ)، کوڈ چارٹ، کوڈنگ نظام، نقطے، مشین ریڈایبل، (رسم ال)خط، معیار بندی
مخففات:
اردو ضابطہ تختی: UZT: Urdu Zabta Takhti: Urdu Codeplate
یونی کوڈ تکنیکی کمیٹی: UTC: Unicode Technical Committee
یورپین یونین: EU: European Union
تعارف
زبان اور بولی آوازوں کا مجموعہ ہوتی ہے۔ حروف شناختی علامات ہیں اور اِن کی حیثیت اُن لباسوں کی ہے جو اِن آوازوں کی شناخت کے لیے مقرر کیے گئے ہوتے ہیں۔ اِسی لیے ایک ہی آواز کے لیے مختلف زبانوں میں مختلف شناختی علامات ہوتی ہیں۔ جس زبان یا بولی کے حروفِ تہجی نہیں ہوتے اُسے ideograph کہتے ہیں۔
ہر زندہ زبان کا رسم الخط بھی زندہ ہوتا ہے، یعنی اُس میں اِصلاحات ہوتی رہتی ہیں۔ نئی آوازوں کے لیے نئے حروفِ تہجی بھی بنتے ہیں؛ یا کبھی کسی حرفِ تہجی کی شکل میں جزوی تبدیلی بھی کرلی جایا کرتی ہے۔ رسم الخط میں اصلاح (یا کبھی کبھی کسی تبدیلی) کی ضرورت زیادہ تر دخیل الفاظ کی وجہ سے پڑتی ہے۔ یا پھر جب کسی زبان کے استعمال کرنے والوں کا دائرہ بہت پھیل جائے اور ایسے لوگ کسی زبان کو استعمال کرنے لگیں جن کی وہ مادری زبان نہیں ہے تب بھی بڑے پیمانے پر اِصلاحات کرنا ضروری ہوجاتی ہیں۔ ہمارے تناظر میں عربی زبان اِس thesis کی سب سے بڑی، زندہ اور عام مثال ہے۔
تحریر میں نقطوں اور شوشوں کی ابتدا: تحریک، تاریخ اور جائزہ
عربی رسم الخط میں بنیادی چیز مختصر نویسی ہے۔ ’’مجرد حروف کے دائروں وغیرہ کو چھوڑ کر صرف جزوِ لازم سے کام لے کر حروف کو باہم ملانے‘‘ [1] کا طریقہ دنیا کے کسی بھی اور رسم الخط میں موجود نہیں ہے۔ جب غیر عرب لوگ عربی پڑھنے لگے یعنی جب قرآنِ پاک دنیا بھر میں پھیلنا شروع ہوا تو عربی رسم الخط میں بڑے پیمانے پر ضروری اِصلاحات کی گئیں تاکہ پڑھنے والوں کو سہولت رہے۔ یہ اِصلاحات کچھ تو خود عرب خلفائے اسلام نے کیں اور کچھ علاقائی ضروریات کے تحت اِن آخذین یعنی recipients نے موقع بموقع کیں۔ پہلی اِصلاحات کی مثال عربی کے حروف پر نقطوں کا لگایا جانا ہے جب کہ دوسری قسم کی اِصلاحات کی مثال مختلف قسم کے شوشے اور کششیں وغیرہ ہیں جو ہماری پاک و ہند کی زبانوں میں بہت کثرت سے پائے جاتے ہیں۔
اردو کے روایتی رسم الخط (یعنی Indo-Perso-Arabic Script، جسے اِس مقالے میں آئندہ ’’اردو رسم الخط‘‘ لکھا جائے گا) کا خطِ کوفی سے گہرا تعلق ہے۔ ’’خطِ کوفی دراصل خطِ نبطی، خطِ سطرنجیلی، خطِ حمیری اور خطِ حیرہ کی آمیزش اور سنبھلی ہوئی صورت تھی۔ دوسرے مقامات کے علاوہ یہ خط حجاز اور حیرہ (کوفہ کا پرانا نام) میں بھی لکھا جاتا تھا۔ حرب ابنِ امیہ اِسے حیرہ سے سیکھ کر آئے اور جزیرۃالعرب میں پھیلایا۔‘‘[2] حضورِ پاک صلی اللہ علیہ وسلم کی بعثت کے وقت حجازِ مقدس میں عام طور سے خطِ کوفی ہی رائج تھا۔ آپ صلی اللہ علیہ وسلم نے مختلف بادشاہوں اور سرداروں کو جو خطوط لکھوائے وہ خطِ حمیری اور خطِ حیرہ کی اِسی محتاط روش یعنی خطِ کوفی میں لکھے گئے تھے۔[3] ابتداء ً اِس خط میں اِعراب اور نقطوں کا چلن نہیں تھا۔ ابوالاسود دوئلی نے تقریبًا سنہ 50ھ میں نقطے ایجاد کیے۔ لیکن یہ نقطے حروف کی شناخت کے بجائے اِعراب کے طور پر استعمال ہوتے تھے۔[4]
جب اسلام مصر اور ایران تک پھیل گیا تو اکثر حروف کے ہم صورت ہونے کی وجہ سے قرآنِ مجید کی قرات میں مشکل ہونے لگی۔ مراسلت میں بھی کئی طرح کے مغالطے پیدا ہونے لگے۔ چنانچہ خلیفہ عبدالملک بن مروان نے عراق کے گورنر حجاج بن یوسف کو رسمِ خط کی اصلاح کا حکم دیا، جس نے نصر بن عاصم کو یہ کام تفویض کیا۔[5]
نصر بن عاصم نے اِعراب کے لیے نقطوں کے استعمال کو بدستور قائم رکھا لیکن اب اِن نقطوں کے لیے صرف قرمزی رنگ استعمال کرنے کی تجویز پیش کی۔ ہم شکل حروف کی تخصیص اور تشخیص کے لیے بھی اُس نے نقطے ہی ایجاد کیے لیکن اِن نقطوں کے لیے سیاہ رنگ لازم قرار دیا۔ خطِ کوفی میں یہ ترتیب تقریبًا چالیس سال تک قائم رہی حتٰی کہ عبدالرحمٰن خلیل بن احمد عروضی نے اِعراب کی شکلیں وضع کرکے اِنھیں سیاہ نقطوں سے الگ کردیا۔[6]
خطِ کوفی اپنی سادہ روش اور واضح ہونے کی وجہ سے لوگوں میں مقبول ہوا اور تقریبًا چھٹی صدی ہجری تک مستعمل رہا۔ اِس دوران میں اِس میں بعض تبدیلیاں بھی ہوئیں۔ دوسری صدی ہجری میں اِس میں زاویے نمایاں ہوگئے۔ اِس کے بعد اِس خط نے قوسی شکل اختیار کرلی اور رفتہ رفتہ تزئینی اور آرائشی ہوتا چلا گیا اور بالآخر رواج سے خارج ہوگیا۔ پھر اِس کی جگہ نسخی خط نے لے لی۔[7] اِس تبدیلی کے باوجود اِعراب، نقطے اور کششیں البتہ اپنی جگہ پر قائم رہے۔ اِن کی شکل یہ تھی کہ نقطے تو مستقلًا لگائے جانے لگے جب کہ اِعراب ضروری مقامات پر اور کہیں کہیں صرف آرائش کی خاطر استعمال کیے جاتے تھے۔ (مدتوں بعد ’’خطِ کوفی جدید‘‘ کے نام سے خطِ کوفی کا احیا ہوا لیکن اِس کے چپٹے حروف کو خطِ کوفی کی روش سے کوئی تعلق نہیں۔)
نسخ کے آرائشی ہوتے چلے جانے کے ساتھ ایران میں، جہاں نسخ اپنے پاؤں جما چکا تھا، دفتری کاموں کے لیے ’’تعلیق‘‘ خط اُبھرنا شروع ہوا۔ اِس کی کششوں میں کسی قدر ترچھاپن اور دائروں میں گراؤ نمایاں تھا اور ایک کشش کے سرے دوسرے کے حرفوں سے مل سکتے تھے، یعنی کئی حرف ایک دوسرے سے پیوستہ کرکے لکھے جاسکتے تھے۔ یہ خط زود نویسی کے کام آتا تھا۔ چنانچہ یہ خط بہت مقبول ہوا اور فرامین اور سرکاری خط کتابت کے لیے چلن دار ہوگیا۔[8] خواجہ ابوالعالی بک نے خطِ تعلیق میں انقلابی اِصلاحات کیں۔ فارسی کی مخصوص آوازوں (پ، چ، ژ اور گ) کے لیے حروف ایجاد کیے اور اِس مقصد کے لیے تین تین نقطے وضع کیے۔ ابتدا میں گ پر بھی دو ڈنڈوں (کششوں) کے بجائے تین نقطے لگائے جاتے تھے لیکن لسانی اور جمالیاتی ذوق سے ہم آہنگ نہ ہونے کے باعث یہ روش رفتہ رفتہ ترک کردی گئی اور گ پر دو کششیں لگائی جانے لگیں۔[9] ک اور گ کی کششوں کو ہماری متداول تحریروں میں ”مرکز“ بھی کہا جاتا ہے۔
نسخ میں حروف کا پھیلاؤ افقی ہوتا ہے جس سے لکھنے میں روانی پیدا ہوتی ہے۔ اِس خط نے سادگی، حسن اور حروف کی واضح اَشکال کے باعث ایک مستقل حیثیت اختیار کرلی تھی اور عربی کے ساتھ ساتھ کئی دوسری زبانوں مثلًا فارسی، سندھی، پشتو اور اردو کے لیے استعمال ہونے لگا تھا۔ ساتھ ہی ساتھ تعلیق کی مقبولیت کا دائرہ وسیع ہوا اور اِن دونوں خطوں کے اتصال سے ’’نستعلیق‘‘ بنا۔ اِسے اپنے زمانے کے دوسرے خطوں کی ترقی یافتہ شکل کہا جاسکتا ہے۔ لکھائی میں رواں تر اور حروف کے دائروں کے گول ہونے کے فطری رجحان کی وجہ سے یہ خط ایران کی حدود سے نکل کر اَکناف میں پھیل گیا۔[10]
لیکن عام تحریر کی رفتار نستعلیق کی نشست میں داخل اہتمام کی متحمل نہیں ہوئی۔ بدیں وجوہ بارہویں صدی ہجری کے اوائل میں مرتضیٰ خان شاملو نے نستعلیق سے ایک اور خط اخذ کیا جسے خطِ شکستہ کا نام دیا گیا۔ اِس سے دفتری خط کتابت اور سرکاری دستاویزات میں بہت سہولت ہوگئی۔ خطِ شکستہ میں حروف اور اُن کے دائرے اَدھورے ہوتے ہیں جنھیں لکھتے ہوئے وقت کی خاصی بچت ہوتی ہے، یعنی یہ وقت کو اَدھیا دیتا ہے۔ زود نویسی کے لیے انتہائی کارآمد ہونے اور کئی دوسری اِفادی ضرورتوں اور جمالیاتی جاذبیت کے علی الرغم آج کی عام تحریر میں نقطوں اور شوشوں کی حد تک جو بدنظمی اور انتشار پایا جاتا ہے وہ خطِ شکستہ ہی کے سبب سے ہے۔ یہ خط اگرچہ رواج سے اُٹھ چکا ہے لیکن اگر اِسے متعین اصولوں کے تحت لکھا جائے تو تیز اور گھسیٹ خطِ شکستہ بآسانی خطِ نستعلیق کی طرح پڑھا جاسکتا ہے۔[11] شوشوں اور نقطوں کی درست نشست میں باقاعدہ اہتمام کا رجحان مفقود ہونے کی وجہ یہی خط ہے۔
اردو رسم الخط: ابتدا، حروف، نقطے، شوشے
اردو کے آغاز کے ساتھ ہی برِعظیم پاک و ہند میں مسلمان اردو کو فارسی (نسخ و نستعلیق) جب کہ ہندو دیوناگری رسم الخط میں لکھنے لگے۔ اِس کی وجہ، زیادہ تر، یہی تھی کہ ناگری خط میں عربی اور فارسی کی بعض مخصوص آوازیں (مثلًا خ، ذ، ز، ض، ظ، اور ع وغیرہ) ادا کرنے کے لیے حروف موجود نہیں تھے۔ چنانچہ عربی اور فارسی کے بے شمار الفاظ ایسے تھے جو مسلمانوں اور ہندوؤں کی بولی جانے والی اردو میں مستعمل تھے لیکن اُنھیں ناگری میں لکھنا ممکن نہ تھا۔ دوسری جانب فارسی میں ہندی کی مخصوص آوازیں (مثلًا ٹ، ڈ، ڑ؛ اور 15 ہائیہ آوازیں: بھ، پھ، تھ، ٹھ، جھ، چھ، دھ، ڈھ، رھ، ڑھ، کھ، گھ، لھ، مھ، نھ [12]) ادا کرنے کے لیے حروف موجود نہیں تھے۔ اردو چونکہ اِن تینوں زبانوں کے مرکب سے پیدا ہوئی تھی لہٰذا ضروری ہوا کہ اِس میں اِن تینوں زبانوں کی آوازیں ادا کرنے کے لیے علامتیں موجود ہوں۔ چنانچہ فارسی حروف میں شکلوں کی قبیلہ وار تقسیم سے فائدہ اُٹھاکر دو نئے نشانات وضع کیے گئے جن کے ذریعے ہندی کی مخصوص آوازیں ادا کرنے کے لیے نئے حروف بنانا ممکن ہوگیا۔ چھوٹی طوئے ’’ط‘‘کی علامت کو ب، د اور ر کی قبیل کے الفاظ پر لگاکر ٹ، ڈ، اور ڑ وضع کیے گئے۔ ’’ھ‘‘ کی علامت سے بھ، پھ، تھ، ٹھ، جھ، چھ، دھ، ڈھ، رھ، ڑھ، کھ، گھ، لھ، مھ، نھ وغیرہ بنالیے گئے۔ اردو حروف کے لیے یہ اضافہ اِتنا بے ساختہ اورفطری تھا کہ اجنبیت اور مصنوعی پن کا احساس نہیں ہوتا۔ اردو کے لیے اِس نئی ابجد کو اختیار کرلیا گیا اور اِسے خطِ نستعلیق میں لکھا جانے لگا۔ حروف میں اِس قدر اِضافے کی وجہ سے ہم اِسے فارسی یا عربی نسخ کہہ کر انصاف نہیں کرتے۔
یہاں اِس بات کا ذکر ضروری ہے کہ ہائے دو چشمی (ھ) کی علامت بھی اصلاعربی ہی سے درآمدہ ہے۔ ہائے ہوز جو اردو اور فارسی میں آکر کبھی ہائے کہنی دار میں بدل جاتی ہے اور جس کی اصل شکل ہ ہے عربی کے بعضے قدیم رسوم الخط میں ھ بھی لکھی جاتی رہی ہے، اور قرآنِ پاک میں تو آج تک لکھی جاتی ہے۔ اب سے کچھ پہلے اِس ھ یعنی ہائے مخلوط کو برِعظیم پاک و ہند کی مخلوط الہا آوازوں کے لیے مخصوص کرلیا گیا ہے۔ جدید دور میں اردو کی دو چشمی ھ اور عربی کی علامت ھ میں باقاعدہ فرق ہے: عربی میں ھ کی علامت کو یونی کوڈ کے کوڈ چارٹ 0600 میں نمبر 0647 تفویض کیا گیا ہے جب کہ اردو میں مستعمل ھ کو 06BE۔ ملاحَظہ کیجیے: منسلکہ-3
اردو کا قدیم اور جدید رسم الخط مشینی دور میں
کاغذ کے دور سے سائبر دور میں داخل ہوجانے کے بعد دنیا بھر کی زبانوں نے اپنے رسوم الخط میں ایسی اِصلاحات کی ہیں جن کی بنا پر رسم الخط کو کمپیوٹر اور اِنٹرنیٹ پر پڑھا جاسکے۔ یہ بھی ضروری ہے کہ یہ پڑھا جانا صرف آنکھوں کے دیکھنے کی حد تک نہ ہو بلکہ کمپیوٹر اور اِنٹرنیٹ اِس لکھے کو ’’سمجھ‘‘ بھی سکیں۔ اِس چیز کو آسان الفاظ میں رسم الخط کا ’’مشین ریڈایبل‘‘ ہونا کہتے ہیں۔ اردو والوں نے بھی، گو کچھ دیر کرکے، اِس طرف توجہ کی ہے اور اپنے رسم الخط میں ایسی بنیادی اِصلاحات کی ہیں جن کی وجہ سے مشین ریڈایبل اردو کی طرف سفر شروع ہوگیا ہے۔ اردو کے بنیادی حروفِ تہجی کی تعداد 38 ہے جو مولوی محمد اسمٰعیل میرٹھی کے قاعدے میں موجود ہے:
ا ب پ ت ٹ ث ج چ ح خ د ڈ ذ
ر ڑ ز ژ س ش ص ض ط ظ ع غ ف
ق ک گ ل م ن و ہ ھ ء ی ے
دورِ جدید کی اردو اور اِ س اردو کو مشین ریڈایبل بنانے کے لیے مقتدرۂ قومی زبان اسلام آباد نے جو معیارات طے کیے ہیں اُن کی روشنی میں حروفِ تہجی کی تعداد اب 58 ہوگئی ہے۔ یہ فہرست ملاحَظہ کیجیے:
http://www.nla.gov.pk/beta/images/alphabetsfull.gif
مشینی دور اور رسوم الخط کی معیار بندی: یونی کوڈ کنسورشیم
مشینی دور میں داخل ہوجانے کے بعد اِس بات کی ضرورت محسوس ہوئی کہ ہر زبان کے لیے ایک کوڈ پلیٹ مہیا ہو اور لکھنے والا اِسی کے مطابق لکھے۔ اِس معیار بندی کے فائدے ظاہر و باہر ہیں۔ سب سے بڑی بات یہ ہے کہ ایک کمپیوٹر سسٹم پر لکھی گئی زبان کسی دوسرے کمپیوٹر سسٹم پر بھی یکساں سہولت سے اور کچھ کھوئے بغیر پڑھی جاسکتی ہے۔ (یہاں زبان سے مراد کمپیوٹر میں داخل کیا گیا مواد ہے۔) دوسرا بہت بڑا فائدہ یہ ہے کہ ایک کوڈ پلیٹ کی بنیاد پر لکھے گئے مواد کی کسی بھی دوسری کوڈ پلیٹ کے لیے انتقالِ حرفی (Transliterate) آسان اور ممکن ہے۔ وغیرہ وغیرہ۔ اِس بنیادی ضرورت کو یونی کوڈ (www.unicode.org) نے پورا کیا۔ اِس کا مختصر تعارف یہ ہے کہ یہ ہر حرفِ تہجی کو ایک منفرد نمبر (unique number) تفویض کرتا ہے جو کسی بھی پلیٹ فارم، کسی بھی پروگرام اور کسی بھی زبان میں کام کرنے کے لیے یکساں رہتا ہے۔ اِس کی ترتیب یہ ہے کہ کمپیوٹر بنیادی طور پر صرف نمبرات سے واسطہ رکھتا ہے۔ جو بھی ہندسہ یا حرف کمپیوٹر پر لکھا جاتا ہے، وہ اِسے کوئی نہ کوئی نمبر دے کر اپنے پاس محفوظ کرلیتا ہے اور پھر اُس پر عمل (processing) کرتا ہے۔ یونی کوڈ سے پہلے کوڈنگ کے لیے سیکڑوں طرح کے نظامات تھے۔ لیکن کوئی بھی ایک نظام سارے الفاظ کی سہار نہیں رکھتا تھا۔ مثلًا صرف یورپین یونین (EU)ہی کو اپنی تمام زبانیں کمپیوٹر پر پڑھے جانے کے قابل بنانے کے لیے کوڈنگ کے کئی ایک نظامات درکار تھے۔ اِسی پر بس نہیں بلکہ کسی بھی ایک زبان، جیسے مثلًا انگریزی، کے لیے کوڈنگ کا کوئی ایسا نظام موجود نہیں تھا جو تمام حروف، رموزِ اوقاف اور تکنیکی اِصطلاحات وغیرہ کو مناسب انداز میں برت سکتا۔ یونی کوڈ نے اِس بے ہنگم پن کو دور کرکے معیار بندی کو فروغ دیا ہے۔[13]
مشینی دور اور اردو رسم الخط کی دشواریاں: معیار بندی کی طرف سفر
اردو رسم الخط کی بنیادی دشواریوں کو ہم دو حصوں میں تقسیم کرسکتے ہیں۔
1۔ اتصالی مشکلات: وہ دشواریاں جو اَشکالِ حروف (یعنی تناظر کے بدل جانے سے ایک ہی حرف کی کئی کئی شکلوں کا وجود میں آجانا)، اتصالِ حروف، شوشوں، مرکز اور اِعراب وغیرہ سے متعلق ہیں۔
2۔ صوتی مشکلات: وہ دشواریاں جو مشتبہ الصوت حروف اور الفاظ وغیرہ سے متعلق ہیں۔[14]
خطِ نستعلیق میں ایک ہی حرف کی کئی کئی شکلیں بننا بہت عام ہے۔ مثلًا ب ہی کی کم سے کم 14 شکلیں موجود ہیں۔[15] تکنیکی زبان میں حرفوں کی اِن شکلوں کو Glyphs (حرفچے) کہتے ہیں۔ چنانچہ ایک کوڈ پلیٹ کی بنیادی ضرورت سے اردو زبان بھی بے نیاز نہیں ہے۔ مقتدرہٴ قومی زبان اسلام آباد نے اِس سلسلے میں تگ و دو کی اور اردو ضابطہ تختی (UZT) کا پہلا ورژن سامنے آیا۔ ملاحَظہ کیجیے: منسلکہ-1
اردو ضابطہ تختی کے پہلے ورژن کے بعد کئی اجلاسوں میں اِس پر بحث مباحثہ ہوا اور بہتر سے بہتر کی طرف سفر شروع ہوا۔ اِس تفصیل اور ضابطہ تختی کی مختلف روایتوں (versions) کے لیے رک: http://www.nlauit.gov.pk/zabta.htm
اردو کے لیے یونی کوڈ کا نظام
یونی کوڈ کنسورشیم نے پہلے پہل اردو کے لیے جزوی سہولت مہیا کی۔ ملاحَظہ کیجیے: منسلکہ-2۔ دراصل دائیں سے بائیں لکھی جانے زبانوں میں سب سے پہلے عربی کے لیے یونی کوڈ میں سہولت دی گئی۔ (اِس عنایت کی ظاہری وجہ عربوں کی تیل کی دولت سے منتفع ہونا ہے۔) لیکن حروفِ تہجی کی تعداد کے اعتبار سے چونکہ عربی کا ابجد فارسی کا تحتی سیٹ ہے اور فارسی کا ابجد اردو کا تحتی سیٹ بنتا ہے اِسی لیے یہ نظام ذرا سی مشکل کا شکار ہوگیا۔ تاہم یہ حقیقت ظاہر ہونے کے بعد کہ اردو میں حروف کی تعداد عربی اور فارسی سے زیادہ ہے، یونی کوڈ نے اردو کے لیے حروفِ تہجی داخل کرنے کا راستہ کھول دیا۔ اردو اگرچہ اب بھی عربی کے کوڈ چارٹ یعنی 0600 ہی سے متعلق ہے، اور ایسا ہونا بالکل فطری بھی ہے، تاہم اب اِس کوڈ چارٹ میں اردو کے لیے تمام سہولت مہیا ہے۔
یونی کوڈ کے ورژن 4.0 اور 5.0 میں اردو کے لیے مزید علامات اور نشانات داخل کیے گئے۔ ملاحَظہ کیجیے: منسلکہ-3
اردو کے حروفِ تہجی میں حروف اور نقاط میں اِفتراق: پہلی کوشش
اوپر کی بحث میں یہ بات واضح ہوچکی ہے کہ عربی رسم الخط میں حروف پر نقطے اور اِعراب بہت بعد میں لگائے گئے۔ لیکن ٹائپنگ میں یہ ترتیب سب سے پہلے 1949ء میں محمد قطب الدین نے پیش کی۔ اُنھوں نے حروف کی قبیلہ وار تقسیم سے فائدہ اُٹھایا اور بتایا کہ اردو کے حروف بنیادی طور پر 18 قبیلوں میں منقسم ہیں جنھیں محض چار طرح کے نقطوں اور چھوٹی ’’ط‘‘ کی مدد سے لکھا جاسکتا ہے۔ اِس تصور کی مکمل تفصیل ملاحَظہ کیجیے: [16]
محمد قطب الدین کے اِس تصور میں دورِ جدید کی ضروریات کے موافق بہت کچھ اضافے کرکے ڈاکٹر عطش درانی نے 2005ء میں یونی کوڈ کنسورشیم میں منظوری کے لیے پیش کیا۔ اگرچہ یونی کوڈ کنسورشیم اپنے ورژن 3.00 میں ”ف“ خالی کشتی کو باقاعدہ نمبر 06A1 تفویض کرچکا تھا [17] لیکن مجرد نقطوں اور کچھ مخصوص شکلوں کو الگ حیثیت سے باقاعدہ نمبرات تفویض کرنے میں یونی کوڈ تکنیکی کمیٹی (UTC) کے ماہرین کو شدید تحفظات تھے۔ اِس سے بھی بہت پہلے عربی میں ا، ٓ اور آ کے لیے الگ الگ نمبرات دیے گئے تھے۔ (اِن کے نمبر علی الترتیب یہ ہیں: ۱=0627، ٓ=0653 اور آ=0622) جب کہ تکنیکی طور پر آ=ا+ ٓ ہے۔ لیکن اِن سب حقائق کے باوجود اِس تجویز کی منظوری میں وقت لگ گیا۔
یونی کوڈ کی نقطوں اور حروف کی خالی کشتیوں کے لیے جدا جدا نمبروں کی فراہمی
بالآخر یونی کوڈ کنسورشیم نے 17 اپریل 2008ء کو یہ تجویز منظور کرکے 22 نقاط اور مختلف شکلوں کو کوڈ چارٹ میں جگہ تفویض کردی ہے اور اِنھیں باقاعدہ حروف کا درجہ (character status) دے دیا ہے۔ اِس کے مطابق اردو کے 6، پشتو کے 2، سندھی کے 6 اور عربی کے 8 نقاط اور مختلف شکلوں کو یہ جگہ ملی ہے۔ کوڈ چارٹ کے اندر یہ 22 جگہیں 0880 تا 0889، 088A تا 088F اور 0890 تا 0895 تک دی گئی ہیں۔ اِس طرح اب حروف کی خالی کشتیاں اور مجرد نقطے الگ الگ حیثیت میں چہرہ دار ہوگئے ہیں۔ یونی کوڈ کے اِس تازہ کوڈچارٹ کی تصویر ملاحَظہ کیجیے: منسلکہ-4 (0880 Arabic Glyph Parts)
یہاں اِس بات کی وضاحت ضروری ہے کہ اِس کوڈ چارٹ کا نام گو ”Arabic Glyph Parts“ ہے لیکن یہ نقاط اور شکلیں صرف عربی کے لیے مخصوص نہیں ہیں بلکہ دائیں سے بائیں لکھی جانے والی کسی بھی زبان کے لیے مکمل طور پر کارگزار ہیں۔
یونی کوڈ کنسورشیم نے اِن 22 نقاط اور شکلوں کے لیے کوڈ چارٹ میں جگہ اگرچہ تفویض کردی ہے لیکن ابھی تک اِن میں کے 16 کو باقاعدہ تسلیم کیا ہے؛ بقیہ 6 کے لیے ابھی بات چیت چل رہی ہے۔ مقتدرہٴ قومی زبان اسلام آباد کے نام یونی کوڈ کنسورشیم کی اِس سلسلے کی ای میل ملاحَظہ کیجیے: منسلکہ-5
نقطوں اور حروف کی خالی کشتیوں کے جدا جدا کردار کے فوائد
چونکہ اردو کا رسم الخط ایک معتدبہ حد تک عربی و فارسی رسوم الخط ہی کی توسیع (Extension) ہے اور یہ پاکستان میں بولی اور لکھی جانے والی قریب قریب تمام زبانوں کا بھی یکساں رسم الخط ہے، اِس لیے سب پاکستانی زبانیں اب اِسی ایک کوڈ چارٹ (0880) اور حروف کی خالی کشتیوں کی مدد سے لکھی جاسکتی ہیں۔ ایک نقطہ، دو نقطے، تین نقطے، چار نقطے، چھوٹی طوئے نقطے اُلٹے چاہیے ہوں یا سیدھے وغیرہ، کا کسی بھی حرف کے اوپر یا نیچے لکھنا ممکن ہوگیا ہے۔ بلکہ نقطے کے اوپر چھوٹی طوئے اور حرف کے نیچے ش کے اوپر والے تین نقطے لگانا بھی ممکن ہے۔
نقطوں اور حروف کی جدا جدا حیثیت کی وجہ سے اردو بصری حرف شناسی (Optical Character Recognition) میں بھی سہولت متوقع ہے۔
سب سے بڑی بات یہ ہے کہ صرف 44 شکلوں (22 مجرد حروف + 22 نقاط اور متعلقہ شکلیں[18]) کی مدد سے تمام پاکستانی زبانوں کا لکھا جانا ممکن ہوگیا ہے۔ تعداد میں کم الفاظ کے استعمال کی وجہ سے Rendering میں بھی آسانی در آئے گی۔ فائلوں کو زِپ (Zip) کرنے کی صورت میں File Compression بھی یقینًا زیادہ (یعنی بہتر) ہوجائے گا۔
نقطوں اور حروف کی خالی کشتیوں کے الگ الگ کردار پر متوقع تحفظات
اِس ضمن میں ایک سوال یہ کیا جاسکتا ہے کہ کمپیوٹر کو حرف اور نقطے الگ الگ پراسیس کرنا پڑیں گے جس سے سپیڈ میں کمی ہوگی۔ دوسرا اِعتراض وہی ہوسکتا ہے جو محمد قطب الدین کے مجوزہ ٹائپ رائٹر پر کیا گیا تھا کہ ٹائپسٹ کو ایک ہی وقت میں زیادہ کلیدیں دبانا پڑیں گی جس کی وجہ سے وقت زیادہ لگے گا۔
اِس سلسلے میں عرض ہے آج کے دور میں کمپیوٹر کی پراسیسنگ سپیڈ اِتنی ہوگئی ہے (اور ابھی تیز تر ہورہی ہے) کہ پراسیسنگ سپیڈ کا سوال ہی لایعنی ہوگیا ہے۔ دوسرے سوال کے دو جواب ہیں: آپ کوئی حرف جو مجرد شکل میں بھی آتا ہے اور نقطوں کے ساتھ کسی اور حرف کے طور پر بھی آتا ہے، جیسے مثلًا س جو تین نقطوں کے اضافے سے ش بن جاتا ہے لکھیے تو یہ ازخود س+تین نقطے=ش بن کر treat ہوگا۔ اور اِس پراسیسنگ میں استعمال کنندہ کو کچھ نہیں کرنا پڑے گا۔ علاوہ ازیں یونی کوڈ کا ہر نیا چارٹ اپنے تمام پیش رو چارٹوں کو مکمل معاونت (support) دیتا ہے۔ لہٰذا یہ دونوں تحفظات بھی دور ہوگئے۔
ایک سوال کوڈ چارٹوں میں حروفِ تہجی کی redundancy کا بھی ہوسکتا ہے۔ اِس ضمن میں عرض ہے کہ یہ مسئلہ صرف یونی کوڈ کنسورشیم کا تکنیکی مسئلہ ہے۔ کمپیوٹر اور اِنٹرنیٹ کے کسی بھی استعمال کنندہ کو اِس سے کسی طور کوئی تنگی یا پریشانی نہیں ہوتی۔
مندرجہٴ بالا تحفظات اور اُن پر گفتگو محض نظَری ہے۔ ممکن ہے کہ اِس تکنیک کے کمپیوٹر پر استعمال کے وقت میں کچھ عملی مسائل اور تحفظات (Implementation issues) بھی سامنے آجائیں جیسے مثلًا باہم مختلف حروف کے لیے ایک جیسی شکلوں کی وجہ سے الجھن (confusion) اور ابہام (ambiguity)، اور کچھ مخصوص مسائل جیسے spoofing، وغیرہ۔ ایسے مسائل سے نمٹنا بھی برموقع ہی ممکن ہوگا۔
خاتمہ
اردو رسم الخط کو آج کے مشینی دور میں کمپیوٹر اور اِنٹرنیٹ پر درست طور پر لکھنے، پڑھنے اور سمجھنے کے لیے اِس کا مکمل طور پر مشین ریڈایبل ہونا اور ایک کوڈنگ نظام کے مطابق اِس کی ضابطہ تختی کی معیار بندی ضروری ہے۔ انگریزی سمیت دنیا کی وہ سب زبانیں جن کے حروفِ تہجی میں نقطے اور کشیدے آتے ہیں، کو لکھنے کی فطری ترتیب یہی ہے کہ پہلے حرف کی خالی کشتی بنائی جاتی ہے اور اُس کے بعد نقطے اور کشیدے لگائے جاتے ہیں۔ مشین ریڈایبل رسم الخط میں بھی حروف کو خالی کشتیوں اور نقطوں میں بانٹ کر کام کرنا ایک فطری ضرورت ہے؛ اردو بھی اِس ضرورت سے مستثنٰی نہیں۔ یونی کوڈ کے کوڈ چارٹ 0880 Arabic Glyph Parts نے ظاہراً اردو اور دائیں سے بائیں لکھی جانے والی تمام زبانوں کے لیے یہ ضرورت احسن طریقے پر پوری کردی ہے۔
٭٭٭
19 مئی 2008ء
14 جمادی الاولی 1429ھ
مزید مطالعہ:
1. بخاری، ڈاکٹر سہیل: ”لسانی مقالات (جلد سوم)“ (1991ء)، مقتدرہٴ قومی زبان، اسلام آباد۔
2. حقی، شان الحق: ”لسانی لطائف و مسائل“ (1996ء)، مقتدرہٴ قومی زبان، اسلام آباد۔
3. حقی، شان الحق: ”نقد و نگارش“ (1985ء)، مکتبہ اسلوب، کراچی۔
4. خاں، رشید حسن: ”اردو املاء“ (1974ء)، نیشنل اکادمی، دریا گنج، نئی دہلی، بھارت۔
5. طارق عزیز، ڈاکٹر: ”اردو رسم الخط اور ٹائپ“ (1987ء)، مقتدرہٴ قومی زبان، اسلام آباد۔
6. نارنگ، ڈاکٹر گوپی چند: ”اردو زبان اور لسانیات“ (2006ء)، رام پور رضا لائبریری، رام پور، بھارت۔
7. The Unicode Standard 5.0, The Unicode Consortium, Addison-Wesley, 2006
8. http://en.wikipedia.org/wiki/Urdu_language
حواشی:
[1] ’’دلی کی آخری شمع۔ ش ح ح‘‘ از حافظ صفوان محمد چوہان، مشمولہ جرنل آف ریسرچ، بہاء الدین زکریا یونیورسٹی ملتان۔ شمارہ۔10 (2006ء)، ص۔193
[2] ’’خط و خطاطی‘‘ از شیخ ممتاز حسین جونپوری، اکیڈمی آف ایجوکیشنل ریسرچ، کراچی۔ 1961ء، ص۔31
[3] ’’اردو رسم الخط اور ٹائپ‘‘ از ڈاکٹر طارق عزیز، مقتدرۂ قومی زبان، اسلام آباد۔ 1987ء، ص۔14
[4] ’’اردو رسمِ خط‘‘ از محمد سجاد مرزا، عثمانیہ ٹریننگ کالج، حیدرآباد دکن۔ 1940ء، ص۔6
[5] بحوالہ ’’اردو رسم الخط اور ٹائپ‘‘ از ڈاکٹر طارق عزیز، مقتدرۂ قومی زبان، اسلام آباد۔ 1987ء، ص۔14
[6] ’’اردو رسمِ خط‘‘ از محمد سجاد مرزا، عثمانیہ ٹریننگ کالج، حیدرآباد دکن۔ 1940ء، ص۔6
[7] بحوالہ ’’اردو رسم الخط اور ٹائپ‘‘ از ڈاکٹر طارق عزیز، مقتدرۂ قومی زبان، اسلام آباد۔ 1987ء، ص۔16
[8] بحوالہ ’’اردو املاء‘‘ از رشید حسن خاں، نیشنل اکادمی، دریا گنج، نئی دہلی۔ 1974ء، ص۔483
[9] ’’اردو رسم الخط اور ٹائپ‘‘ از ڈاکٹر طارق عزیز، مقتدرۂ قومی زبان، اسلام آباد۔ 1987ء، ص۔19
[10] ایضًا، ص۔22
[11] ایضًا، ص۔23
[12] بعض لوگ اِن آوازوں میں ’’وھ‘‘ اور ’’یھ‘‘ کا اضافہ کرتے ہیں اور بعض ’’رھ‘‘ اور ’’لھ‘‘ کی نسبت شک کرتے ہیں کہ اِنھیں مخلوط مانا جائے یا نہیں۔ تفصیل ملاحَظہ کیجیے: ’’اردو کی گنتی کے چند پہلو‘‘ مشمولہ ’’لسانی لطائف و مسائل‘‘ از شان الحق حقی، مقتدرۂ قومی زبان، اسلام آباد۔ 1996ء، ص۔154
[13] http://www.unicode.org/standard/WhatIsUnicode.html سے ترجمہ
[14] بحوالہ ’’اردو رسم الخط اور ٹائپ‘‘ از ڈاکٹر طارق عزیز، مقتدرۂ قومی زبان، اسلام آباد۔ 1987ء، ص۔27
[15] خطِ نستعلیق کی نزاکتیں بہت زیادہ ہیں۔ اردو کے صرف ایک حرف ”و“ کے علاوہ سارے ہی حروف ایسے ہیں جن کی شکل اور کرسی یا نشست، کہ کس طرح شروع ہوں گے اور کتنی جگہ لیں گے، متعین نہیں کی جاسکتی۔ اکثر حرفِ ماقبل اور حرفِ مابعد کی مناسبت سے قلم، نشست اور صورت بدلتی رہتی ہے۔ مثلًا نستعلیق لکھائی میں ”ب“ کی 14 مختلف شکلیں اور نشستیں بنتی ہیں جو افادہٴ عوام و خواص اور حوالے کے لیے شان الحق حقی صاحب نے اپنے ایک شعر میں جمع کردی ہیں:
بل میں بلبل، بانس پہ بطخ، بوتل میں بیل، آب میں بندر
بمبئی میں سبحان اللہ مچھلی ڈوبی بیچ سمندر
[16] ’’اردو رسم الخط اور ٹائپ‘‘ از ڈاکٹر طارق عزیز، مقتدرۂ قومی زبان، اسلام آباد۔ 1987ء، ص۔471 تا 479
[17] جب کہ یونی کوڈ کے اِسی ورژن یعنی 3.00 میں 066E اور 066F کی جگہیں خالی تھیں جو بعد ازاں ”ب“ اور ”ق“ کی خالی کشتیوں کو علی الترتیب تفویض کی گئیں۔ منسلکہ-2-1 میں یہ مقامات ملاحَظہ کیجیے، اور منسلکہ-3 کے اِنھی مقامات سے تقابل کیجیے جہاں یہ خالی کشتیاں موجود ہیں۔
[18] یعنی یہ 22 نقاط اور شکلیں اگر تمام کی تمام تسلیم کرلی جائیں۔ ملاحَظہ کیجیے: منسلکہ-5
منسلکات:
[1] ’’اردو ضابطہ تختی‘‘ پہلا ورژن
[2] یونی کوڈ 3.00 میں اردو کے لیے سہولت
[3] یونی کوڈ 4.0 اور 5.0 میں اردو کے لیے سہولیات
[4] یونی کوڈ چارٹ: 0880 Arabic Glyph Parts
[5] یونی کوڈ کنسورشیم کی جانب سے مقتدرہٴ قومی زبان اسلام آباد کو ای میل
مآخذ:
۱لف: کتابیات
1. بخاری، ڈاکٹر سہیل: ”لسانی مقالات (جلد سوم)“ (1991ء)، مقتدرہٴ قومی زبان، اسلام آباد۔
2. حقی، شان الحق: ”لسانی لطائف و مسائل“ (1996ء)، مقتدرہٴ قومی زبان، اسلام آباد۔
3. حقی، شان الحق: ”نقد و نگارش“ (1985ء)، مکتبہ اسلوب، کراچی۔
4. خاں، رشید حسن: ”اردو املاء“ (1974ء)، نیشنل اکادمی، دریا گنج، نئی دہلی، بھارت۔
5. طارق عزیز، ڈاکٹر: ”اردو رسم الخط اور ٹائپ“ (1987ء)، مقتدرہٴ قومی زبان، اسلام آباد۔
6. نارنگ، ڈاکٹر گوپی چند: ”اردو زبان اور لسانیات“ (2006ء)، رام پور رضا لائبریری، رام پور، بھارت۔
7. The Unicode Standard 5.0, The Unicode Consortium, Addison-Wesley, 2006
ب: رسائل اور تحقیقی جرائد
1. جرنل آف ریسرچ، بہاء الدین زکریا یونیورسٹی ملتان۔ شمارہ-10 (2006ء)
2. سہ ماہی ”الزبیر“، اردو اکادمی بہاول پور۔ شمارہ-2،3 (2007ء)
ج: اِنٹرنیٹ سائٹس (چند منتخب سائٹس)
1. http://www.microsoft.com
2. http://www.unicode.org
3. http://www.nla.gov.pk/beta
ہ: تکنیکی مشاورت
1. ڈاکٹر خواجہ محمد زکریا، سابق پرنسپل، اورینٹل کالج، جامعۂ پنجاب، لاہور (اِملائی مسائل، لسانی اور اِصطلاحاتی تشکیلات وغیرہ کے لیے)
2. ڈاکٹر شمس الرحمن فاروقی، 29/C, Hastings Road, Allahabad-211001, India
3. ڈاکٹر عطش درانی، پراجیکٹ ڈائریکٹر، مرکزِفضیلت برائے اردو اِطلاعیات، مقتدرۂ قومی زبان، اسلام آباد
4. جناب وصی اللہ کھوکھر، ایم جی ایچ سالوشنز، کامونکے
و: مواد کی فراہمی میں معاونت
اِس مقالے کی تیاری کے دوران میں باربار جناب محبوب خان ، پروگرام منیجر اور محمد اکبر سجاد، اسسٹنٹ انفارمیٹکس آفیسر، مرکزِ فضیلت برائے اردو اطلاعیات، مقتدرۂ قومی زبان اسلام آباد کو تکلیف دی گئی۔ میں اِن دونوں کا انتہائی شکرگزار ہوں۔
٭٭٭
hafiz.safwan@gmail.com
مشین ریڈایبل اردو رسم الخط:
حروف کی کَشتیاں، اِعراب، نقطے، شوشے اور کششیں
The conventional Urdu script is Perso-Arabic in style & structure. Diacritic marks were added to the ghost characters initially for the ease of foreign speakers and users of these languages. This article deals with the fact that characters and diacritic marks are two different things; and if they are treated as such, machine readable Urdu can benefit a lot thanks to this thesis.
In the recent past, the Unicode Consortium has allotted alphabet status to various shapes of dots on the proposal of National Language Authority of Pakistan where R&D on Urdu language is underway at the Centre of Excellence for Urdu Informatics. Putting threats such as ambiguity and spoofing aside, add to many other areas of informatics like provision of writing almost all scripts of Pakistani languages in complete machine-readable format, this approach is likely to advance a twist in the development of Urdu OCR.
کلیدی الفاظ: ضابطہ تختی (کوڈ پلیٹ)، کوڈ چارٹ، کوڈنگ نظام، نقطے، مشین ریڈایبل، (رسم ال)خط، معیار بندی
مخففات:
اردو ضابطہ تختی: UZT: Urdu Zabta Takhti: Urdu Codeplate
یونی کوڈ تکنیکی کمیٹی: UTC: Unicode Technical Committee
یورپین یونین: EU: European Union
تعارف
زبان اور بولی آوازوں کا مجموعہ ہوتی ہے۔ حروف شناختی علامات ہیں اور اِن کی حیثیت اُن لباسوں کی ہے جو اِن آوازوں کی شناخت کے لیے مقرر کیے گئے ہوتے ہیں۔ اِسی لیے ایک ہی آواز کے لیے مختلف زبانوں میں مختلف شناختی علامات ہوتی ہیں۔ جس زبان یا بولی کے حروفِ تہجی نہیں ہوتے اُسے ideograph کہتے ہیں۔
ہر زندہ زبان کا رسم الخط بھی زندہ ہوتا ہے، یعنی اُس میں اِصلاحات ہوتی رہتی ہیں۔ نئی آوازوں کے لیے نئے حروفِ تہجی بھی بنتے ہیں؛ یا کبھی کسی حرفِ تہجی کی شکل میں جزوی تبدیلی بھی کرلی جایا کرتی ہے۔ رسم الخط میں اصلاح (یا کبھی کبھی کسی تبدیلی) کی ضرورت زیادہ تر دخیل الفاظ کی وجہ سے پڑتی ہے۔ یا پھر جب کسی زبان کے استعمال کرنے والوں کا دائرہ بہت پھیل جائے اور ایسے لوگ کسی زبان کو استعمال کرنے لگیں جن کی وہ مادری زبان نہیں ہے تب بھی بڑے پیمانے پر اِصلاحات کرنا ضروری ہوجاتی ہیں۔ ہمارے تناظر میں عربی زبان اِس thesis کی سب سے بڑی، زندہ اور عام مثال ہے۔
تحریر میں نقطوں اور شوشوں کی ابتدا: تحریک، تاریخ اور جائزہ
عربی رسم الخط میں بنیادی چیز مختصر نویسی ہے۔ ’’مجرد حروف کے دائروں وغیرہ کو چھوڑ کر صرف جزوِ لازم سے کام لے کر حروف کو باہم ملانے‘‘ [1] کا طریقہ دنیا کے کسی بھی اور رسم الخط میں موجود نہیں ہے۔ جب غیر عرب لوگ عربی پڑھنے لگے یعنی جب قرآنِ پاک دنیا بھر میں پھیلنا شروع ہوا تو عربی رسم الخط میں بڑے پیمانے پر ضروری اِصلاحات کی گئیں تاکہ پڑھنے والوں کو سہولت رہے۔ یہ اِصلاحات کچھ تو خود عرب خلفائے اسلام نے کیں اور کچھ علاقائی ضروریات کے تحت اِن آخذین یعنی recipients نے موقع بموقع کیں۔ پہلی اِصلاحات کی مثال عربی کے حروف پر نقطوں کا لگایا جانا ہے جب کہ دوسری قسم کی اِصلاحات کی مثال مختلف قسم کے شوشے اور کششیں وغیرہ ہیں جو ہماری پاک و ہند کی زبانوں میں بہت کثرت سے پائے جاتے ہیں۔
اردو کے روایتی رسم الخط (یعنی Indo-Perso-Arabic Script، جسے اِس مقالے میں آئندہ ’’اردو رسم الخط‘‘ لکھا جائے گا) کا خطِ کوفی سے گہرا تعلق ہے۔ ’’خطِ کوفی دراصل خطِ نبطی، خطِ سطرنجیلی، خطِ حمیری اور خطِ حیرہ کی آمیزش اور سنبھلی ہوئی صورت تھی۔ دوسرے مقامات کے علاوہ یہ خط حجاز اور حیرہ (کوفہ کا پرانا نام) میں بھی لکھا جاتا تھا۔ حرب ابنِ امیہ اِسے حیرہ سے سیکھ کر آئے اور جزیرۃالعرب میں پھیلایا۔‘‘[2] حضورِ پاک صلی اللہ علیہ وسلم کی بعثت کے وقت حجازِ مقدس میں عام طور سے خطِ کوفی ہی رائج تھا۔ آپ صلی اللہ علیہ وسلم نے مختلف بادشاہوں اور سرداروں کو جو خطوط لکھوائے وہ خطِ حمیری اور خطِ حیرہ کی اِسی محتاط روش یعنی خطِ کوفی میں لکھے گئے تھے۔[3] ابتداء ً اِس خط میں اِعراب اور نقطوں کا چلن نہیں تھا۔ ابوالاسود دوئلی نے تقریبًا سنہ 50ھ میں نقطے ایجاد کیے۔ لیکن یہ نقطے حروف کی شناخت کے بجائے اِعراب کے طور پر استعمال ہوتے تھے۔[4]
جب اسلام مصر اور ایران تک پھیل گیا تو اکثر حروف کے ہم صورت ہونے کی وجہ سے قرآنِ مجید کی قرات میں مشکل ہونے لگی۔ مراسلت میں بھی کئی طرح کے مغالطے پیدا ہونے لگے۔ چنانچہ خلیفہ عبدالملک بن مروان نے عراق کے گورنر حجاج بن یوسف کو رسمِ خط کی اصلاح کا حکم دیا، جس نے نصر بن عاصم کو یہ کام تفویض کیا۔[5]
نصر بن عاصم نے اِعراب کے لیے نقطوں کے استعمال کو بدستور قائم رکھا لیکن اب اِن نقطوں کے لیے صرف قرمزی رنگ استعمال کرنے کی تجویز پیش کی۔ ہم شکل حروف کی تخصیص اور تشخیص کے لیے بھی اُس نے نقطے ہی ایجاد کیے لیکن اِن نقطوں کے لیے سیاہ رنگ لازم قرار دیا۔ خطِ کوفی میں یہ ترتیب تقریبًا چالیس سال تک قائم رہی حتٰی کہ عبدالرحمٰن خلیل بن احمد عروضی نے اِعراب کی شکلیں وضع کرکے اِنھیں سیاہ نقطوں سے الگ کردیا۔[6]
خطِ کوفی اپنی سادہ روش اور واضح ہونے کی وجہ سے لوگوں میں مقبول ہوا اور تقریبًا چھٹی صدی ہجری تک مستعمل رہا۔ اِس دوران میں اِس میں بعض تبدیلیاں بھی ہوئیں۔ دوسری صدی ہجری میں اِس میں زاویے نمایاں ہوگئے۔ اِس کے بعد اِس خط نے قوسی شکل اختیار کرلی اور رفتہ رفتہ تزئینی اور آرائشی ہوتا چلا گیا اور بالآخر رواج سے خارج ہوگیا۔ پھر اِس کی جگہ نسخی خط نے لے لی۔[7] اِس تبدیلی کے باوجود اِعراب، نقطے اور کششیں البتہ اپنی جگہ پر قائم رہے۔ اِن کی شکل یہ تھی کہ نقطے تو مستقلًا لگائے جانے لگے جب کہ اِعراب ضروری مقامات پر اور کہیں کہیں صرف آرائش کی خاطر استعمال کیے جاتے تھے۔ (مدتوں بعد ’’خطِ کوفی جدید‘‘ کے نام سے خطِ کوفی کا احیا ہوا لیکن اِس کے چپٹے حروف کو خطِ کوفی کی روش سے کوئی تعلق نہیں۔)
نسخ کے آرائشی ہوتے چلے جانے کے ساتھ ایران میں، جہاں نسخ اپنے پاؤں جما چکا تھا، دفتری کاموں کے لیے ’’تعلیق‘‘ خط اُبھرنا شروع ہوا۔ اِس کی کششوں میں کسی قدر ترچھاپن اور دائروں میں گراؤ نمایاں تھا اور ایک کشش کے سرے دوسرے کے حرفوں سے مل سکتے تھے، یعنی کئی حرف ایک دوسرے سے پیوستہ کرکے لکھے جاسکتے تھے۔ یہ خط زود نویسی کے کام آتا تھا۔ چنانچہ یہ خط بہت مقبول ہوا اور فرامین اور سرکاری خط کتابت کے لیے چلن دار ہوگیا۔[8] خواجہ ابوالعالی بک نے خطِ تعلیق میں انقلابی اِصلاحات کیں۔ فارسی کی مخصوص آوازوں (پ، چ، ژ اور گ) کے لیے حروف ایجاد کیے اور اِس مقصد کے لیے تین تین نقطے وضع کیے۔ ابتدا میں گ پر بھی دو ڈنڈوں (کششوں) کے بجائے تین نقطے لگائے جاتے تھے لیکن لسانی اور جمالیاتی ذوق سے ہم آہنگ نہ ہونے کے باعث یہ روش رفتہ رفتہ ترک کردی گئی اور گ پر دو کششیں لگائی جانے لگیں۔[9] ک اور گ کی کششوں کو ہماری متداول تحریروں میں ”مرکز“ بھی کہا جاتا ہے۔
نسخ میں حروف کا پھیلاؤ افقی ہوتا ہے جس سے لکھنے میں روانی پیدا ہوتی ہے۔ اِس خط نے سادگی، حسن اور حروف کی واضح اَشکال کے باعث ایک مستقل حیثیت اختیار کرلی تھی اور عربی کے ساتھ ساتھ کئی دوسری زبانوں مثلًا فارسی، سندھی، پشتو اور اردو کے لیے استعمال ہونے لگا تھا۔ ساتھ ہی ساتھ تعلیق کی مقبولیت کا دائرہ وسیع ہوا اور اِن دونوں خطوں کے اتصال سے ’’نستعلیق‘‘ بنا۔ اِسے اپنے زمانے کے دوسرے خطوں کی ترقی یافتہ شکل کہا جاسکتا ہے۔ لکھائی میں رواں تر اور حروف کے دائروں کے گول ہونے کے فطری رجحان کی وجہ سے یہ خط ایران کی حدود سے نکل کر اَکناف میں پھیل گیا۔[10]
لیکن عام تحریر کی رفتار نستعلیق کی نشست میں داخل اہتمام کی متحمل نہیں ہوئی۔ بدیں وجوہ بارہویں صدی ہجری کے اوائل میں مرتضیٰ خان شاملو نے نستعلیق سے ایک اور خط اخذ کیا جسے خطِ شکستہ کا نام دیا گیا۔ اِس سے دفتری خط کتابت اور سرکاری دستاویزات میں بہت سہولت ہوگئی۔ خطِ شکستہ میں حروف اور اُن کے دائرے اَدھورے ہوتے ہیں جنھیں لکھتے ہوئے وقت کی خاصی بچت ہوتی ہے، یعنی یہ وقت کو اَدھیا دیتا ہے۔ زود نویسی کے لیے انتہائی کارآمد ہونے اور کئی دوسری اِفادی ضرورتوں اور جمالیاتی جاذبیت کے علی الرغم آج کی عام تحریر میں نقطوں اور شوشوں کی حد تک جو بدنظمی اور انتشار پایا جاتا ہے وہ خطِ شکستہ ہی کے سبب سے ہے۔ یہ خط اگرچہ رواج سے اُٹھ چکا ہے لیکن اگر اِسے متعین اصولوں کے تحت لکھا جائے تو تیز اور گھسیٹ خطِ شکستہ بآسانی خطِ نستعلیق کی طرح پڑھا جاسکتا ہے۔[11] شوشوں اور نقطوں کی درست نشست میں باقاعدہ اہتمام کا رجحان مفقود ہونے کی وجہ یہی خط ہے۔
اردو رسم الخط: ابتدا، حروف، نقطے، شوشے
اردو کے آغاز کے ساتھ ہی برِعظیم پاک و ہند میں مسلمان اردو کو فارسی (نسخ و نستعلیق) جب کہ ہندو دیوناگری رسم الخط میں لکھنے لگے۔ اِس کی وجہ، زیادہ تر، یہی تھی کہ ناگری خط میں عربی اور فارسی کی بعض مخصوص آوازیں (مثلًا خ، ذ، ز، ض، ظ، اور ع وغیرہ) ادا کرنے کے لیے حروف موجود نہیں تھے۔ چنانچہ عربی اور فارسی کے بے شمار الفاظ ایسے تھے جو مسلمانوں اور ہندوؤں کی بولی جانے والی اردو میں مستعمل تھے لیکن اُنھیں ناگری میں لکھنا ممکن نہ تھا۔ دوسری جانب فارسی میں ہندی کی مخصوص آوازیں (مثلًا ٹ، ڈ، ڑ؛ اور 15 ہائیہ آوازیں: بھ، پھ، تھ، ٹھ، جھ، چھ، دھ، ڈھ، رھ، ڑھ، کھ، گھ، لھ، مھ، نھ [12]) ادا کرنے کے لیے حروف موجود نہیں تھے۔ اردو چونکہ اِن تینوں زبانوں کے مرکب سے پیدا ہوئی تھی لہٰذا ضروری ہوا کہ اِس میں اِن تینوں زبانوں کی آوازیں ادا کرنے کے لیے علامتیں موجود ہوں۔ چنانچہ فارسی حروف میں شکلوں کی قبیلہ وار تقسیم سے فائدہ اُٹھاکر دو نئے نشانات وضع کیے گئے جن کے ذریعے ہندی کی مخصوص آوازیں ادا کرنے کے لیے نئے حروف بنانا ممکن ہوگیا۔ چھوٹی طوئے ’’ط‘‘کی علامت کو ب، د اور ر کی قبیل کے الفاظ پر لگاکر ٹ، ڈ، اور ڑ وضع کیے گئے۔ ’’ھ‘‘ کی علامت سے بھ، پھ، تھ، ٹھ، جھ، چھ، دھ، ڈھ، رھ، ڑھ، کھ، گھ، لھ، مھ، نھ وغیرہ بنالیے گئے۔ اردو حروف کے لیے یہ اضافہ اِتنا بے ساختہ اورفطری تھا کہ اجنبیت اور مصنوعی پن کا احساس نہیں ہوتا۔ اردو کے لیے اِس نئی ابجد کو اختیار کرلیا گیا اور اِسے خطِ نستعلیق میں لکھا جانے لگا۔ حروف میں اِس قدر اِضافے کی وجہ سے ہم اِسے فارسی یا عربی نسخ کہہ کر انصاف نہیں کرتے۔
یہاں اِس بات کا ذکر ضروری ہے کہ ہائے دو چشمی (ھ) کی علامت بھی اصلاعربی ہی سے درآمدہ ہے۔ ہائے ہوز جو اردو اور فارسی میں آکر کبھی ہائے کہنی دار میں بدل جاتی ہے اور جس کی اصل شکل ہ ہے عربی کے بعضے قدیم رسوم الخط میں ھ بھی لکھی جاتی رہی ہے، اور قرآنِ پاک میں تو آج تک لکھی جاتی ہے۔ اب سے کچھ پہلے اِس ھ یعنی ہائے مخلوط کو برِعظیم پاک و ہند کی مخلوط الہا آوازوں کے لیے مخصوص کرلیا گیا ہے۔ جدید دور میں اردو کی دو چشمی ھ اور عربی کی علامت ھ میں باقاعدہ فرق ہے: عربی میں ھ کی علامت کو یونی کوڈ کے کوڈ چارٹ 0600 میں نمبر 0647 تفویض کیا گیا ہے جب کہ اردو میں مستعمل ھ کو 06BE۔ ملاحَظہ کیجیے: منسلکہ-3
اردو کا قدیم اور جدید رسم الخط مشینی دور میں
کاغذ کے دور سے سائبر دور میں داخل ہوجانے کے بعد دنیا بھر کی زبانوں نے اپنے رسوم الخط میں ایسی اِصلاحات کی ہیں جن کی بنا پر رسم الخط کو کمپیوٹر اور اِنٹرنیٹ پر پڑھا جاسکے۔ یہ بھی ضروری ہے کہ یہ پڑھا جانا صرف آنکھوں کے دیکھنے کی حد تک نہ ہو بلکہ کمپیوٹر اور اِنٹرنیٹ اِس لکھے کو ’’سمجھ‘‘ بھی سکیں۔ اِس چیز کو آسان الفاظ میں رسم الخط کا ’’مشین ریڈایبل‘‘ ہونا کہتے ہیں۔ اردو والوں نے بھی، گو کچھ دیر کرکے، اِس طرف توجہ کی ہے اور اپنے رسم الخط میں ایسی بنیادی اِصلاحات کی ہیں جن کی وجہ سے مشین ریڈایبل اردو کی طرف سفر شروع ہوگیا ہے۔ اردو کے بنیادی حروفِ تہجی کی تعداد 38 ہے جو مولوی محمد اسمٰعیل میرٹھی کے قاعدے میں موجود ہے:
ا ب پ ت ٹ ث ج چ ح خ د ڈ ذ
ر ڑ ز ژ س ش ص ض ط ظ ع غ ف
ق ک گ ل م ن و ہ ھ ء ی ے
دورِ جدید کی اردو اور اِ س اردو کو مشین ریڈایبل بنانے کے لیے مقتدرۂ قومی زبان اسلام آباد نے جو معیارات طے کیے ہیں اُن کی روشنی میں حروفِ تہجی کی تعداد اب 58 ہوگئی ہے۔ یہ فہرست ملاحَظہ کیجیے:
http://www.nla.gov.pk/beta/images/alphabetsfull.gif
مشینی دور اور رسوم الخط کی معیار بندی: یونی کوڈ کنسورشیم
مشینی دور میں داخل ہوجانے کے بعد اِس بات کی ضرورت محسوس ہوئی کہ ہر زبان کے لیے ایک کوڈ پلیٹ مہیا ہو اور لکھنے والا اِسی کے مطابق لکھے۔ اِس معیار بندی کے فائدے ظاہر و باہر ہیں۔ سب سے بڑی بات یہ ہے کہ ایک کمپیوٹر سسٹم پر لکھی گئی زبان کسی دوسرے کمپیوٹر سسٹم پر بھی یکساں سہولت سے اور کچھ کھوئے بغیر پڑھی جاسکتی ہے۔ (یہاں زبان سے مراد کمپیوٹر میں داخل کیا گیا مواد ہے۔) دوسرا بہت بڑا فائدہ یہ ہے کہ ایک کوڈ پلیٹ کی بنیاد پر لکھے گئے مواد کی کسی بھی دوسری کوڈ پلیٹ کے لیے انتقالِ حرفی (Transliterate) آسان اور ممکن ہے۔ وغیرہ وغیرہ۔ اِس بنیادی ضرورت کو یونی کوڈ (www.unicode.org) نے پورا کیا۔ اِس کا مختصر تعارف یہ ہے کہ یہ ہر حرفِ تہجی کو ایک منفرد نمبر (unique number) تفویض کرتا ہے جو کسی بھی پلیٹ فارم، کسی بھی پروگرام اور کسی بھی زبان میں کام کرنے کے لیے یکساں رہتا ہے۔ اِس کی ترتیب یہ ہے کہ کمپیوٹر بنیادی طور پر صرف نمبرات سے واسطہ رکھتا ہے۔ جو بھی ہندسہ یا حرف کمپیوٹر پر لکھا جاتا ہے، وہ اِسے کوئی نہ کوئی نمبر دے کر اپنے پاس محفوظ کرلیتا ہے اور پھر اُس پر عمل (processing) کرتا ہے۔ یونی کوڈ سے پہلے کوڈنگ کے لیے سیکڑوں طرح کے نظامات تھے۔ لیکن کوئی بھی ایک نظام سارے الفاظ کی سہار نہیں رکھتا تھا۔ مثلًا صرف یورپین یونین (EU)ہی کو اپنی تمام زبانیں کمپیوٹر پر پڑھے جانے کے قابل بنانے کے لیے کوڈنگ کے کئی ایک نظامات درکار تھے۔ اِسی پر بس نہیں بلکہ کسی بھی ایک زبان، جیسے مثلًا انگریزی، کے لیے کوڈنگ کا کوئی ایسا نظام موجود نہیں تھا جو تمام حروف، رموزِ اوقاف اور تکنیکی اِصطلاحات وغیرہ کو مناسب انداز میں برت سکتا۔ یونی کوڈ نے اِس بے ہنگم پن کو دور کرکے معیار بندی کو فروغ دیا ہے۔[13]
مشینی دور اور اردو رسم الخط کی دشواریاں: معیار بندی کی طرف سفر
اردو رسم الخط کی بنیادی دشواریوں کو ہم دو حصوں میں تقسیم کرسکتے ہیں۔
1۔ اتصالی مشکلات: وہ دشواریاں جو اَشکالِ حروف (یعنی تناظر کے بدل جانے سے ایک ہی حرف کی کئی کئی شکلوں کا وجود میں آجانا)، اتصالِ حروف، شوشوں، مرکز اور اِعراب وغیرہ سے متعلق ہیں۔
2۔ صوتی مشکلات: وہ دشواریاں جو مشتبہ الصوت حروف اور الفاظ وغیرہ سے متعلق ہیں۔[14]
خطِ نستعلیق میں ایک ہی حرف کی کئی کئی شکلیں بننا بہت عام ہے۔ مثلًا ب ہی کی کم سے کم 14 شکلیں موجود ہیں۔[15] تکنیکی زبان میں حرفوں کی اِن شکلوں کو Glyphs (حرفچے) کہتے ہیں۔ چنانچہ ایک کوڈ پلیٹ کی بنیادی ضرورت سے اردو زبان بھی بے نیاز نہیں ہے۔ مقتدرہٴ قومی زبان اسلام آباد نے اِس سلسلے میں تگ و دو کی اور اردو ضابطہ تختی (UZT) کا پہلا ورژن سامنے آیا۔ ملاحَظہ کیجیے: منسلکہ-1
اردو ضابطہ تختی کے پہلے ورژن کے بعد کئی اجلاسوں میں اِس پر بحث مباحثہ ہوا اور بہتر سے بہتر کی طرف سفر شروع ہوا۔ اِس تفصیل اور ضابطہ تختی کی مختلف روایتوں (versions) کے لیے رک: http://www.nlauit.gov.pk/zabta.htm
اردو کے لیے یونی کوڈ کا نظام
یونی کوڈ کنسورشیم نے پہلے پہل اردو کے لیے جزوی سہولت مہیا کی۔ ملاحَظہ کیجیے: منسلکہ-2۔ دراصل دائیں سے بائیں لکھی جانے زبانوں میں سب سے پہلے عربی کے لیے یونی کوڈ میں سہولت دی گئی۔ (اِس عنایت کی ظاہری وجہ عربوں کی تیل کی دولت سے منتفع ہونا ہے۔) لیکن حروفِ تہجی کی تعداد کے اعتبار سے چونکہ عربی کا ابجد فارسی کا تحتی سیٹ ہے اور فارسی کا ابجد اردو کا تحتی سیٹ بنتا ہے اِسی لیے یہ نظام ذرا سی مشکل کا شکار ہوگیا۔ تاہم یہ حقیقت ظاہر ہونے کے بعد کہ اردو میں حروف کی تعداد عربی اور فارسی سے زیادہ ہے، یونی کوڈ نے اردو کے لیے حروفِ تہجی داخل کرنے کا راستہ کھول دیا۔ اردو اگرچہ اب بھی عربی کے کوڈ چارٹ یعنی 0600 ہی سے متعلق ہے، اور ایسا ہونا بالکل فطری بھی ہے، تاہم اب اِس کوڈ چارٹ میں اردو کے لیے تمام سہولت مہیا ہے۔
یونی کوڈ کے ورژن 4.0 اور 5.0 میں اردو کے لیے مزید علامات اور نشانات داخل کیے گئے۔ ملاحَظہ کیجیے: منسلکہ-3
اردو کے حروفِ تہجی میں حروف اور نقاط میں اِفتراق: پہلی کوشش
اوپر کی بحث میں یہ بات واضح ہوچکی ہے کہ عربی رسم الخط میں حروف پر نقطے اور اِعراب بہت بعد میں لگائے گئے۔ لیکن ٹائپنگ میں یہ ترتیب سب سے پہلے 1949ء میں محمد قطب الدین نے پیش کی۔ اُنھوں نے حروف کی قبیلہ وار تقسیم سے فائدہ اُٹھایا اور بتایا کہ اردو کے حروف بنیادی طور پر 18 قبیلوں میں منقسم ہیں جنھیں محض چار طرح کے نقطوں اور چھوٹی ’’ط‘‘ کی مدد سے لکھا جاسکتا ہے۔ اِس تصور کی مکمل تفصیل ملاحَظہ کیجیے: [16]
محمد قطب الدین کے اِس تصور میں دورِ جدید کی ضروریات کے موافق بہت کچھ اضافے کرکے ڈاکٹر عطش درانی نے 2005ء میں یونی کوڈ کنسورشیم میں منظوری کے لیے پیش کیا۔ اگرچہ یونی کوڈ کنسورشیم اپنے ورژن 3.00 میں ”ف“ خالی کشتی کو باقاعدہ نمبر 06A1 تفویض کرچکا تھا [17] لیکن مجرد نقطوں اور کچھ مخصوص شکلوں کو الگ حیثیت سے باقاعدہ نمبرات تفویض کرنے میں یونی کوڈ تکنیکی کمیٹی (UTC) کے ماہرین کو شدید تحفظات تھے۔ اِس سے بھی بہت پہلے عربی میں ا، ٓ اور آ کے لیے الگ الگ نمبرات دیے گئے تھے۔ (اِن کے نمبر علی الترتیب یہ ہیں: ۱=0627، ٓ=0653 اور آ=0622) جب کہ تکنیکی طور پر آ=ا+ ٓ ہے۔ لیکن اِن سب حقائق کے باوجود اِس تجویز کی منظوری میں وقت لگ گیا۔
یونی کوڈ کی نقطوں اور حروف کی خالی کشتیوں کے لیے جدا جدا نمبروں کی فراہمی
بالآخر یونی کوڈ کنسورشیم نے 17 اپریل 2008ء کو یہ تجویز منظور کرکے 22 نقاط اور مختلف شکلوں کو کوڈ چارٹ میں جگہ تفویض کردی ہے اور اِنھیں باقاعدہ حروف کا درجہ (character status) دے دیا ہے۔ اِس کے مطابق اردو کے 6، پشتو کے 2، سندھی کے 6 اور عربی کے 8 نقاط اور مختلف شکلوں کو یہ جگہ ملی ہے۔ کوڈ چارٹ کے اندر یہ 22 جگہیں 0880 تا 0889، 088A تا 088F اور 0890 تا 0895 تک دی گئی ہیں۔ اِس طرح اب حروف کی خالی کشتیاں اور مجرد نقطے الگ الگ حیثیت میں چہرہ دار ہوگئے ہیں۔ یونی کوڈ کے اِس تازہ کوڈچارٹ کی تصویر ملاحَظہ کیجیے: منسلکہ-4 (0880 Arabic Glyph Parts)
یہاں اِس بات کی وضاحت ضروری ہے کہ اِس کوڈ چارٹ کا نام گو ”Arabic Glyph Parts“ ہے لیکن یہ نقاط اور شکلیں صرف عربی کے لیے مخصوص نہیں ہیں بلکہ دائیں سے بائیں لکھی جانے والی کسی بھی زبان کے لیے مکمل طور پر کارگزار ہیں۔
یونی کوڈ کنسورشیم نے اِن 22 نقاط اور شکلوں کے لیے کوڈ چارٹ میں جگہ اگرچہ تفویض کردی ہے لیکن ابھی تک اِن میں کے 16 کو باقاعدہ تسلیم کیا ہے؛ بقیہ 6 کے لیے ابھی بات چیت چل رہی ہے۔ مقتدرہٴ قومی زبان اسلام آباد کے نام یونی کوڈ کنسورشیم کی اِس سلسلے کی ای میل ملاحَظہ کیجیے: منسلکہ-5
نقطوں اور حروف کی خالی کشتیوں کے جدا جدا کردار کے فوائد
چونکہ اردو کا رسم الخط ایک معتدبہ حد تک عربی و فارسی رسوم الخط ہی کی توسیع (Extension) ہے اور یہ پاکستان میں بولی اور لکھی جانے والی قریب قریب تمام زبانوں کا بھی یکساں رسم الخط ہے، اِس لیے سب پاکستانی زبانیں اب اِسی ایک کوڈ چارٹ (0880) اور حروف کی خالی کشتیوں کی مدد سے لکھی جاسکتی ہیں۔ ایک نقطہ، دو نقطے، تین نقطے، چار نقطے، چھوٹی طوئے نقطے اُلٹے چاہیے ہوں یا سیدھے وغیرہ، کا کسی بھی حرف کے اوپر یا نیچے لکھنا ممکن ہوگیا ہے۔ بلکہ نقطے کے اوپر چھوٹی طوئے اور حرف کے نیچے ش کے اوپر والے تین نقطے لگانا بھی ممکن ہے۔
نقطوں اور حروف کی جدا جدا حیثیت کی وجہ سے اردو بصری حرف شناسی (Optical Character Recognition) میں بھی سہولت متوقع ہے۔
سب سے بڑی بات یہ ہے کہ صرف 44 شکلوں (22 مجرد حروف + 22 نقاط اور متعلقہ شکلیں[18]) کی مدد سے تمام پاکستانی زبانوں کا لکھا جانا ممکن ہوگیا ہے۔ تعداد میں کم الفاظ کے استعمال کی وجہ سے Rendering میں بھی آسانی در آئے گی۔ فائلوں کو زِپ (Zip) کرنے کی صورت میں File Compression بھی یقینًا زیادہ (یعنی بہتر) ہوجائے گا۔
نقطوں اور حروف کی خالی کشتیوں کے الگ الگ کردار پر متوقع تحفظات
اِس ضمن میں ایک سوال یہ کیا جاسکتا ہے کہ کمپیوٹر کو حرف اور نقطے الگ الگ پراسیس کرنا پڑیں گے جس سے سپیڈ میں کمی ہوگی۔ دوسرا اِعتراض وہی ہوسکتا ہے جو محمد قطب الدین کے مجوزہ ٹائپ رائٹر پر کیا گیا تھا کہ ٹائپسٹ کو ایک ہی وقت میں زیادہ کلیدیں دبانا پڑیں گی جس کی وجہ سے وقت زیادہ لگے گا۔
اِس سلسلے میں عرض ہے آج کے دور میں کمپیوٹر کی پراسیسنگ سپیڈ اِتنی ہوگئی ہے (اور ابھی تیز تر ہورہی ہے) کہ پراسیسنگ سپیڈ کا سوال ہی لایعنی ہوگیا ہے۔ دوسرے سوال کے دو جواب ہیں: آپ کوئی حرف جو مجرد شکل میں بھی آتا ہے اور نقطوں کے ساتھ کسی اور حرف کے طور پر بھی آتا ہے، جیسے مثلًا س جو تین نقطوں کے اضافے سے ش بن جاتا ہے لکھیے تو یہ ازخود س+تین نقطے=ش بن کر treat ہوگا۔ اور اِس پراسیسنگ میں استعمال کنندہ کو کچھ نہیں کرنا پڑے گا۔ علاوہ ازیں یونی کوڈ کا ہر نیا چارٹ اپنے تمام پیش رو چارٹوں کو مکمل معاونت (support) دیتا ہے۔ لہٰذا یہ دونوں تحفظات بھی دور ہوگئے۔
ایک سوال کوڈ چارٹوں میں حروفِ تہجی کی redundancy کا بھی ہوسکتا ہے۔ اِس ضمن میں عرض ہے کہ یہ مسئلہ صرف یونی کوڈ کنسورشیم کا تکنیکی مسئلہ ہے۔ کمپیوٹر اور اِنٹرنیٹ کے کسی بھی استعمال کنندہ کو اِس سے کسی طور کوئی تنگی یا پریشانی نہیں ہوتی۔
مندرجہٴ بالا تحفظات اور اُن پر گفتگو محض نظَری ہے۔ ممکن ہے کہ اِس تکنیک کے کمپیوٹر پر استعمال کے وقت میں کچھ عملی مسائل اور تحفظات (Implementation issues) بھی سامنے آجائیں جیسے مثلًا باہم مختلف حروف کے لیے ایک جیسی شکلوں کی وجہ سے الجھن (confusion) اور ابہام (ambiguity)، اور کچھ مخصوص مسائل جیسے spoofing، وغیرہ۔ ایسے مسائل سے نمٹنا بھی برموقع ہی ممکن ہوگا۔
خاتمہ
اردو رسم الخط کو آج کے مشینی دور میں کمپیوٹر اور اِنٹرنیٹ پر درست طور پر لکھنے، پڑھنے اور سمجھنے کے لیے اِس کا مکمل طور پر مشین ریڈایبل ہونا اور ایک کوڈنگ نظام کے مطابق اِس کی ضابطہ تختی کی معیار بندی ضروری ہے۔ انگریزی سمیت دنیا کی وہ سب زبانیں جن کے حروفِ تہجی میں نقطے اور کشیدے آتے ہیں، کو لکھنے کی فطری ترتیب یہی ہے کہ پہلے حرف کی خالی کشتی بنائی جاتی ہے اور اُس کے بعد نقطے اور کشیدے لگائے جاتے ہیں۔ مشین ریڈایبل رسم الخط میں بھی حروف کو خالی کشتیوں اور نقطوں میں بانٹ کر کام کرنا ایک فطری ضرورت ہے؛ اردو بھی اِس ضرورت سے مستثنٰی نہیں۔ یونی کوڈ کے کوڈ چارٹ 0880 Arabic Glyph Parts نے ظاہراً اردو اور دائیں سے بائیں لکھی جانے والی تمام زبانوں کے لیے یہ ضرورت احسن طریقے پر پوری کردی ہے۔
٭٭٭
19 مئی 2008ء
14 جمادی الاولی 1429ھ
مزید مطالعہ:
1. بخاری، ڈاکٹر سہیل: ”لسانی مقالات (جلد سوم)“ (1991ء)، مقتدرہٴ قومی زبان، اسلام آباد۔
2. حقی، شان الحق: ”لسانی لطائف و مسائل“ (1996ء)، مقتدرہٴ قومی زبان، اسلام آباد۔
3. حقی، شان الحق: ”نقد و نگارش“ (1985ء)، مکتبہ اسلوب، کراچی۔
4. خاں، رشید حسن: ”اردو املاء“ (1974ء)، نیشنل اکادمی، دریا گنج، نئی دہلی، بھارت۔
5. طارق عزیز، ڈاکٹر: ”اردو رسم الخط اور ٹائپ“ (1987ء)، مقتدرہٴ قومی زبان، اسلام آباد۔
6. نارنگ، ڈاکٹر گوپی چند: ”اردو زبان اور لسانیات“ (2006ء)، رام پور رضا لائبریری، رام پور، بھارت۔
7. The Unicode Standard 5.0, The Unicode Consortium, Addison-Wesley, 2006
8. http://en.wikipedia.org/wiki/Urdu_language
حواشی:
[1] ’’دلی کی آخری شمع۔ ش ح ح‘‘ از حافظ صفوان محمد چوہان، مشمولہ جرنل آف ریسرچ، بہاء الدین زکریا یونیورسٹی ملتان۔ شمارہ۔10 (2006ء)، ص۔193
[2] ’’خط و خطاطی‘‘ از شیخ ممتاز حسین جونپوری، اکیڈمی آف ایجوکیشنل ریسرچ، کراچی۔ 1961ء، ص۔31
[3] ’’اردو رسم الخط اور ٹائپ‘‘ از ڈاکٹر طارق عزیز، مقتدرۂ قومی زبان، اسلام آباد۔ 1987ء، ص۔14
[4] ’’اردو رسمِ خط‘‘ از محمد سجاد مرزا، عثمانیہ ٹریننگ کالج، حیدرآباد دکن۔ 1940ء، ص۔6
[5] بحوالہ ’’اردو رسم الخط اور ٹائپ‘‘ از ڈاکٹر طارق عزیز، مقتدرۂ قومی زبان، اسلام آباد۔ 1987ء، ص۔14
[6] ’’اردو رسمِ خط‘‘ از محمد سجاد مرزا، عثمانیہ ٹریننگ کالج، حیدرآباد دکن۔ 1940ء، ص۔6
[7] بحوالہ ’’اردو رسم الخط اور ٹائپ‘‘ از ڈاکٹر طارق عزیز، مقتدرۂ قومی زبان، اسلام آباد۔ 1987ء، ص۔16
[8] بحوالہ ’’اردو املاء‘‘ از رشید حسن خاں، نیشنل اکادمی، دریا گنج، نئی دہلی۔ 1974ء، ص۔483
[9] ’’اردو رسم الخط اور ٹائپ‘‘ از ڈاکٹر طارق عزیز، مقتدرۂ قومی زبان، اسلام آباد۔ 1987ء، ص۔19
[10] ایضًا، ص۔22
[11] ایضًا، ص۔23
[12] بعض لوگ اِن آوازوں میں ’’وھ‘‘ اور ’’یھ‘‘ کا اضافہ کرتے ہیں اور بعض ’’رھ‘‘ اور ’’لھ‘‘ کی نسبت شک کرتے ہیں کہ اِنھیں مخلوط مانا جائے یا نہیں۔ تفصیل ملاحَظہ کیجیے: ’’اردو کی گنتی کے چند پہلو‘‘ مشمولہ ’’لسانی لطائف و مسائل‘‘ از شان الحق حقی، مقتدرۂ قومی زبان، اسلام آباد۔ 1996ء، ص۔154
[13] http://www.unicode.org/standard/WhatIsUnicode.html سے ترجمہ
[14] بحوالہ ’’اردو رسم الخط اور ٹائپ‘‘ از ڈاکٹر طارق عزیز، مقتدرۂ قومی زبان، اسلام آباد۔ 1987ء، ص۔27
[15] خطِ نستعلیق کی نزاکتیں بہت زیادہ ہیں۔ اردو کے صرف ایک حرف ”و“ کے علاوہ سارے ہی حروف ایسے ہیں جن کی شکل اور کرسی یا نشست، کہ کس طرح شروع ہوں گے اور کتنی جگہ لیں گے، متعین نہیں کی جاسکتی۔ اکثر حرفِ ماقبل اور حرفِ مابعد کی مناسبت سے قلم، نشست اور صورت بدلتی رہتی ہے۔ مثلًا نستعلیق لکھائی میں ”ب“ کی 14 مختلف شکلیں اور نشستیں بنتی ہیں جو افادہٴ عوام و خواص اور حوالے کے لیے شان الحق حقی صاحب نے اپنے ایک شعر میں جمع کردی ہیں:
بل میں بلبل، بانس پہ بطخ، بوتل میں بیل، آب میں بندر
بمبئی میں سبحان اللہ مچھلی ڈوبی بیچ سمندر
[16] ’’اردو رسم الخط اور ٹائپ‘‘ از ڈاکٹر طارق عزیز، مقتدرۂ قومی زبان، اسلام آباد۔ 1987ء، ص۔471 تا 479
[17] جب کہ یونی کوڈ کے اِسی ورژن یعنی 3.00 میں 066E اور 066F کی جگہیں خالی تھیں جو بعد ازاں ”ب“ اور ”ق“ کی خالی کشتیوں کو علی الترتیب تفویض کی گئیں۔ منسلکہ-2-1 میں یہ مقامات ملاحَظہ کیجیے، اور منسلکہ-3 کے اِنھی مقامات سے تقابل کیجیے جہاں یہ خالی کشتیاں موجود ہیں۔
[18] یعنی یہ 22 نقاط اور شکلیں اگر تمام کی تمام تسلیم کرلی جائیں۔ ملاحَظہ کیجیے: منسلکہ-5
منسلکات:
[1] ’’اردو ضابطہ تختی‘‘ پہلا ورژن
[2] یونی کوڈ 3.00 میں اردو کے لیے سہولت
[3] یونی کوڈ 4.0 اور 5.0 میں اردو کے لیے سہولیات
[4] یونی کوڈ چارٹ: 0880 Arabic Glyph Parts
[5] یونی کوڈ کنسورشیم کی جانب سے مقتدرہٴ قومی زبان اسلام آباد کو ای میل
مآخذ:
۱لف: کتابیات
1. بخاری، ڈاکٹر سہیل: ”لسانی مقالات (جلد سوم)“ (1991ء)، مقتدرہٴ قومی زبان، اسلام آباد۔
2. حقی، شان الحق: ”لسانی لطائف و مسائل“ (1996ء)، مقتدرہٴ قومی زبان، اسلام آباد۔
3. حقی، شان الحق: ”نقد و نگارش“ (1985ء)، مکتبہ اسلوب، کراچی۔
4. خاں، رشید حسن: ”اردو املاء“ (1974ء)، نیشنل اکادمی، دریا گنج، نئی دہلی، بھارت۔
5. طارق عزیز، ڈاکٹر: ”اردو رسم الخط اور ٹائپ“ (1987ء)، مقتدرہٴ قومی زبان، اسلام آباد۔
6. نارنگ، ڈاکٹر گوپی چند: ”اردو زبان اور لسانیات“ (2006ء)، رام پور رضا لائبریری، رام پور، بھارت۔
7. The Unicode Standard 5.0, The Unicode Consortium, Addison-Wesley, 2006
ب: رسائل اور تحقیقی جرائد
1. جرنل آف ریسرچ، بہاء الدین زکریا یونیورسٹی ملتان۔ شمارہ-10 (2006ء)
2. سہ ماہی ”الزبیر“، اردو اکادمی بہاول پور۔ شمارہ-2،3 (2007ء)
ج: اِنٹرنیٹ سائٹس (چند منتخب سائٹس)
1. http://www.microsoft.com
2. http://www.unicode.org
3. http://www.nla.gov.pk/beta
ہ: تکنیکی مشاورت
1. ڈاکٹر خواجہ محمد زکریا، سابق پرنسپل، اورینٹل کالج، جامعۂ پنجاب، لاہور (اِملائی مسائل، لسانی اور اِصطلاحاتی تشکیلات وغیرہ کے لیے)
2. ڈاکٹر شمس الرحمن فاروقی، 29/C, Hastings Road, Allahabad-211001, India
3. ڈاکٹر عطش درانی، پراجیکٹ ڈائریکٹر، مرکزِفضیلت برائے اردو اِطلاعیات، مقتدرۂ قومی زبان، اسلام آباد
4. جناب وصی اللہ کھوکھر، ایم جی ایچ سالوشنز، کامونکے
و: مواد کی فراہمی میں معاونت
اِس مقالے کی تیاری کے دوران میں باربار جناب محبوب خان ، پروگرام منیجر اور محمد اکبر سجاد، اسسٹنٹ انفارمیٹکس آفیسر، مرکزِ فضیلت برائے اردو اطلاعیات، مقتدرۂ قومی زبان اسلام آباد کو تکلیف دی گئی۔ میں اِن دونوں کا انتہائی شکرگزار ہوں۔
٭٭٭