نبیل
تکنیکی معاون
السلام علیکم،
میں یہاں پر ایک پرانے ہنوز غیر تکمیل شدہ پراجیکٹ پر ازسرنو کام کا آغاز کرنا چاہتا ہوں۔ ہمیں ایک اردو سے رومن اردو کنورٹر کی طویل عرصے ضرورت ہے۔ یہ بظاہر آسان نظر آنے والا لیکن درحقیقت ایک پیچیدہ کام ہے، اور اس کی عدم تکمیل کے باعث ایک اور نہایت اہم پراجیکٹ یعنی اردو سپیچ ریکگنیشن پر پراگریس کئی سال سے تعطل کا شکار ہے۔ میری کوشش ہوگی کہ مختلف ریسورسز کو اکٹھا کرکے اس بارے میں تحقیق کی جائے اور اردو سے رومن اردو میں ٹرانسلٹریشن کا نظام وضع کیا جائے۔ اس سے کئی مفید نتائج حاصل کیے جا سکیں گے۔
اردو سے رومن اردو کنورژن کی ضرورت
اردو سے رومن اردو کنورژن جہاں دوسرے تحقیقی مقاصد کےلیے مفید ثابت ہوگی، وہاں یہ اردو کے ان شائقین کے لیے بھی فائدہ مند ثابت ہوگی جو اردو رسم الخط نہیں پڑھ سکتے۔ دوسرے ایک مرتبہ اردو ٹو رومن اردو کنورژن کا نظام وضع ہو جائے تو اس سے الٹی جانب یعنی رومن اردو سے یونیکوڈ اردو میں ٹرانسلٹریشن کا کام نہایت آسان ہو جائے گا۔ اور سب سے زیادہ اہمیت اصل میں اس چیز کی ہے کہ ہم بالآخر اردو سپیچ ریکگنیشن پر کام میں پیشرفت ممکن ہو جائے گی۔
اردو ٹو رومن اردو ٹرانسلٹریشن کا طریقہ
اب ہم کچھ اس بارے میں بات کرتے ہیں کہ یہ سب کچھ کیسے ممکن ہوگا۔ اس کا سب سے آسان طریقہ یہی ہوتا اگر کوئی اردو سے رومن اردو ڈکشنری دستیاب ہوتی۔ ایسی کسی ڈکشنری کی عدم موجودگی میں ہمیں اسے خود سے تیار کرنا ہوگا۔ یہ کوئی آسان کام نہیں ہوگا۔ البتہ چند روز قبل میری ابن سعید سے اس موضوع پر گفتگو ہوئی ہے، اور اس گفتگو کے دوران ہم نے کچھ لائحہ عمل وضع کیا ہے کہ کس طرح جلد اس طرح کی ڈکشنری ابتدائی صورت میں حاصل کی جا سکتی ہے۔ ہمارا خیال ہے کہ شروع میں ہم کم از کم 30 یا چالیس ہزار الفاظ پر مبنی ایسی ڈکشنری حاصل کرنے میں کامیاب ہو جائیں گے۔
اردو سے رومن اردو ٹرانسلٹریشن الگورتھم
جیسا کہ اوپر بیان کیا جا چکا ہے، اردو سے رومن اردو اردو کنورژن کے لیے ایک ڈکشنری کی ضرورت ہوگی، لیکن اس کے ساتھ ہی ایک ایسے میکنزم کی ضرورت بھی پڑے گی، جس کے ذریعے نئے الفاظ کو اس لغت میں شامل کیا جا سکے یا کسی اصول کے تحت اردو سے رومن اردو میں کنورٹ کیا جا سکے۔ دوسرے الفاظ میں ہمیں ایک معیار کی ضرورت ہے جس کو بنیاد بنا کر اردو سے رومن اردو میں خودکار تبدیلی کا نظام وضع کیا جا سکے۔ اگر کسی لفظ کا رومن متبادل ڈکشنری میں موجود نہ ہو تو اس الگورتھم کے ذریعے اس کا رومن متبادل حاصل کیا جا سکے گا۔ اس طرح اگرچہ سو فیصد درست نتائج حاصل نہیں ہو سکیں گے، لیکن ان پر نظر ثانی اور تصحیح کے ذریعے پہلے سے موجود ڈکشنری ڈیٹابیس کو بہتر بنانا ضرور ممکن ہوگا۔ میری نظر میں یہ ایک طرح سے مشین لرننگ کی شکل ہے۔
رومن اردو کا معیار
یہ موضوع بذات خود ایک وسیع تحقیق کا تقاضا کرتا ہے۔ میری کوشش ہوگی کہ یہاں اس موضوع کا اختصار سے احاطہ کر سکوں۔ اگرچہ رومن اردو کے ایک معیار کی اشد ضرورت ہے، لیکن بد قسمتی سے فی الحال ہمارے پاس ایسا کوئی معیار موجود نہیں ہے۔ میری دانست میں محض انگریزی حروف تہجی رومن اردو کا پوری طرح سے احاطہ بھی نہیں کر سکتے۔ مثال کے طور پر اعلی کا رومن متبادل alaa ہوگا، لیکن آلہ کا رومن متبادل بھی یہی ہوگا۔ ایسی صورت حرف ع کے استعمال میں دیکھنے میں آتی ہے۔ اس کا ایک حل حرف ع کے لیے رومن اردو میں حرف تہجی a کے ساتھ اپوسٹروف کا استعمال ہے۔ اس طرح اعلی کا رومن متبادل ہوگا a'alaa۔ میرا مقصد یہاں صرف ایسی صورتحال کو اجاگر کرنا تھا جہاں ایسا معیار وضع کرنے میں دقت پیش آ سکتی ہے، اور یہاں میں تمام ماہرین کو اظہار خیال کی دعوت دوں گا۔
رومن اردو سے اردو ٹرانسلٹریشن، ایک اور طریقہ
اگرچہ ہمیں اردو سے رومن اردو حاصل کرنے کے لیے یہ سارا تردد کرنے کی ضرورت ہے، لیکن انٹرنیٹ پر دستیاب وسائل پر نظر ڈالی جائے تو غالبا اس سے الٹ یعنی رومن اردو سے یونیکوڈ اردو کا حصول نسبتا آسان کام ہے۔ انٹرنیٹ پر رومن اردو الفاظ کی فہرستیں موجود ہیں جو قدرے مختصر ہیں۔ اس کے علاوہ رومن اردو پر موجود متعدد سائٹس موجود ہیں جن کا ڈیٹا حاصل کیا جا سکتا ہے۔ ابن سعید نے ایک سکرپٹ لکھی ہوئی جس کے ذریعے رومن اردو کو یونیکوڈ اردو میں کنورٹ کیا جا سکتا ہے۔ ایک مرتبہ رومن اردو الفاظ کی فہرست کو یونیکوڈ میں کنورٹ کر لیا جائے تو اس کو دوسری سمت میں استعمال کرنا نہایت آسان ہوگا۔ یہ تھیوری میں آسان ضرور ہے اس طریقے پر عمل کرنے میں بھی کئی رکاوٹیں حائل ہوں گی۔
روابط
Algorithm of Urdu Translation Engine
Roman to Urdu Transliteration using word list
Urdu Dictionary - Roman Urdu Words and Meanings
Romanized School Dictionary: English and Urdu
Roman Urdu Dictionary
برائے توجہ:
ابن سعید
سید ذیشان
زیک
رانا
اسد
میں یہاں پر ایک پرانے ہنوز غیر تکمیل شدہ پراجیکٹ پر ازسرنو کام کا آغاز کرنا چاہتا ہوں۔ ہمیں ایک اردو سے رومن اردو کنورٹر کی طویل عرصے ضرورت ہے۔ یہ بظاہر آسان نظر آنے والا لیکن درحقیقت ایک پیچیدہ کام ہے، اور اس کی عدم تکمیل کے باعث ایک اور نہایت اہم پراجیکٹ یعنی اردو سپیچ ریکگنیشن پر پراگریس کئی سال سے تعطل کا شکار ہے۔ میری کوشش ہوگی کہ مختلف ریسورسز کو اکٹھا کرکے اس بارے میں تحقیق کی جائے اور اردو سے رومن اردو میں ٹرانسلٹریشن کا نظام وضع کیا جائے۔ اس سے کئی مفید نتائج حاصل کیے جا سکیں گے۔
اردو سے رومن اردو کنورژن کی ضرورت
اردو سے رومن اردو کنورژن جہاں دوسرے تحقیقی مقاصد کےلیے مفید ثابت ہوگی، وہاں یہ اردو کے ان شائقین کے لیے بھی فائدہ مند ثابت ہوگی جو اردو رسم الخط نہیں پڑھ سکتے۔ دوسرے ایک مرتبہ اردو ٹو رومن اردو کنورژن کا نظام وضع ہو جائے تو اس سے الٹی جانب یعنی رومن اردو سے یونیکوڈ اردو میں ٹرانسلٹریشن کا کام نہایت آسان ہو جائے گا۔ اور سب سے زیادہ اہمیت اصل میں اس چیز کی ہے کہ ہم بالآخر اردو سپیچ ریکگنیشن پر کام میں پیشرفت ممکن ہو جائے گی۔
اردو ٹو رومن اردو ٹرانسلٹریشن کا طریقہ
اب ہم کچھ اس بارے میں بات کرتے ہیں کہ یہ سب کچھ کیسے ممکن ہوگا۔ اس کا سب سے آسان طریقہ یہی ہوتا اگر کوئی اردو سے رومن اردو ڈکشنری دستیاب ہوتی۔ ایسی کسی ڈکشنری کی عدم موجودگی میں ہمیں اسے خود سے تیار کرنا ہوگا۔ یہ کوئی آسان کام نہیں ہوگا۔ البتہ چند روز قبل میری ابن سعید سے اس موضوع پر گفتگو ہوئی ہے، اور اس گفتگو کے دوران ہم نے کچھ لائحہ عمل وضع کیا ہے کہ کس طرح جلد اس طرح کی ڈکشنری ابتدائی صورت میں حاصل کی جا سکتی ہے۔ ہمارا خیال ہے کہ شروع میں ہم کم از کم 30 یا چالیس ہزار الفاظ پر مبنی ایسی ڈکشنری حاصل کرنے میں کامیاب ہو جائیں گے۔
اردو سے رومن اردو ٹرانسلٹریشن الگورتھم
جیسا کہ اوپر بیان کیا جا چکا ہے، اردو سے رومن اردو اردو کنورژن کے لیے ایک ڈکشنری کی ضرورت ہوگی، لیکن اس کے ساتھ ہی ایک ایسے میکنزم کی ضرورت بھی پڑے گی، جس کے ذریعے نئے الفاظ کو اس لغت میں شامل کیا جا سکے یا کسی اصول کے تحت اردو سے رومن اردو میں کنورٹ کیا جا سکے۔ دوسرے الفاظ میں ہمیں ایک معیار کی ضرورت ہے جس کو بنیاد بنا کر اردو سے رومن اردو میں خودکار تبدیلی کا نظام وضع کیا جا سکے۔ اگر کسی لفظ کا رومن متبادل ڈکشنری میں موجود نہ ہو تو اس الگورتھم کے ذریعے اس کا رومن متبادل حاصل کیا جا سکے گا۔ اس طرح اگرچہ سو فیصد درست نتائج حاصل نہیں ہو سکیں گے، لیکن ان پر نظر ثانی اور تصحیح کے ذریعے پہلے سے موجود ڈکشنری ڈیٹابیس کو بہتر بنانا ضرور ممکن ہوگا۔ میری نظر میں یہ ایک طرح سے مشین لرننگ کی شکل ہے۔
رومن اردو کا معیار
یہ موضوع بذات خود ایک وسیع تحقیق کا تقاضا کرتا ہے۔ میری کوشش ہوگی کہ یہاں اس موضوع کا اختصار سے احاطہ کر سکوں۔ اگرچہ رومن اردو کے ایک معیار کی اشد ضرورت ہے، لیکن بد قسمتی سے فی الحال ہمارے پاس ایسا کوئی معیار موجود نہیں ہے۔ میری دانست میں محض انگریزی حروف تہجی رومن اردو کا پوری طرح سے احاطہ بھی نہیں کر سکتے۔ مثال کے طور پر اعلی کا رومن متبادل alaa ہوگا، لیکن آلہ کا رومن متبادل بھی یہی ہوگا۔ ایسی صورت حرف ع کے استعمال میں دیکھنے میں آتی ہے۔ اس کا ایک حل حرف ع کے لیے رومن اردو میں حرف تہجی a کے ساتھ اپوسٹروف کا استعمال ہے۔ اس طرح اعلی کا رومن متبادل ہوگا a'alaa۔ میرا مقصد یہاں صرف ایسی صورتحال کو اجاگر کرنا تھا جہاں ایسا معیار وضع کرنے میں دقت پیش آ سکتی ہے، اور یہاں میں تمام ماہرین کو اظہار خیال کی دعوت دوں گا۔
رومن اردو سے اردو ٹرانسلٹریشن، ایک اور طریقہ
اگرچہ ہمیں اردو سے رومن اردو حاصل کرنے کے لیے یہ سارا تردد کرنے کی ضرورت ہے، لیکن انٹرنیٹ پر دستیاب وسائل پر نظر ڈالی جائے تو غالبا اس سے الٹ یعنی رومن اردو سے یونیکوڈ اردو کا حصول نسبتا آسان کام ہے۔ انٹرنیٹ پر رومن اردو الفاظ کی فہرستیں موجود ہیں جو قدرے مختصر ہیں۔ اس کے علاوہ رومن اردو پر موجود متعدد سائٹس موجود ہیں جن کا ڈیٹا حاصل کیا جا سکتا ہے۔ ابن سعید نے ایک سکرپٹ لکھی ہوئی جس کے ذریعے رومن اردو کو یونیکوڈ اردو میں کنورٹ کیا جا سکتا ہے۔ ایک مرتبہ رومن اردو الفاظ کی فہرست کو یونیکوڈ میں کنورٹ کر لیا جائے تو اس کو دوسری سمت میں استعمال کرنا نہایت آسان ہوگا۔ یہ تھیوری میں آسان ضرور ہے اس طریقے پر عمل کرنے میں بھی کئی رکاوٹیں حائل ہوں گی۔
روابط
Algorithm of Urdu Translation Engine
Roman to Urdu Transliteration using word list
Urdu Dictionary - Roman Urdu Words and Meanings
Romanized School Dictionary: English and Urdu
Roman Urdu Dictionary
برائے توجہ:
ابن سعید
سید ذیشان
زیک
رانا
اسد