import os
import codecs
basedir = "C:\\Data"
FILE_NAME = os.path.join(basedir,"sampdict.txt")
roman_urdu = {}
try:
if os.path.isfile(FILE_NAME):
store = codecs.open(FILE_NAME,'r','utf-8')
for line in store.readlines():
eng,urdu = line.strip().split(':',1)
roman_urdu[eng] = urdu
except IOError:
print("Error: can't find file or read data")
else:
print("Path is not correct")
print(roman_urdu.keys())
print(roman_urdu.values())
کیا ہمیں اس وقت ضرورت اردو کو رومن میں تبدیل کرنے کی نہیں ہے؟
import codecs
import os
def dict_populate(FILE_NAME):
try:
if os.path.isfile(FILE_NAME):
store = codecs.open(FILE_NAME,'r','utf-8')
for line in store.readlines():
eng,urdu = line.strip().split(':',1)
roman_urdu[eng] = urdu
except:
print("Path is not correct")
basedir = "C:\\Data"
FILE_NAME = os.path.join(basedir,"dict.txt")
#input_file = 'C:\Data\input.txt'
#output_file = 'C:\Data\output.txt'
input_file = os.path.join(basedir,"input.txt")
output_file = os.path.join(basedir,"output.txt")
roman_urdu = {}
#Populate the dictionary with Roman(keys) and Urdu(values) words
dict_populate(FILE_NAME)
# read the whole file at once
f = codecs.open(input_file,'r','ascii')
data = f.read()
f.close()
# perform all the replacements
for k,v in roman_urdu.items():
data = data.replace(k,v)
# write the whole file result
f = codecs.open(output_file,'w','utf-8')
f.write(data)
f.close()
کیا رومن ٹیکسٹ کو رومن اردو بھی کہتے ہیں، اگر ہاں تو رومن اردو اور نستعلیق اردو میں صرف فونٹ کا فرق رہ جاتا ہے۔ تو پھر لمبا چوڑا کوڈ کیوں؟اس دھاگے میں پائتھون میں رومن ٹیکسٹ کو اردو تحریر میں تبدیل کرنے کے لیے کوڈ مہیا کیا جائے گا اور اس پر بحث و تبصرے ہوں گے۔
کوڈ کی مشق میری ذاتی ہے اور اس کا مقصد اطلاقیہ بنانا نہیں بلکہ کچھ چیزوں کی پڑتال کرنا ہے۔کیا رومن ٹیکسٹ کو رومن اردو بھی کہتے ہیں، اگر ہاں تو رومن اردو اور نستعلیق اردو میں صرف فونٹ کا فرق رہ جاتا ہے۔ تو پھر لمبا چوڑا کوڈ کیوں؟
رومن انداز تحریر میں ایک ایک لفظ کو بیسیوں طرح سے لکھا جاتا ہے یعنی کوئی سٹینڈرڈ نہیں ہے۔۔۔ اس طرح صرف ایک کالم رومن کا کیا فائدہ؟ اگر کسی نے محب علوی کے سٹینڈرڈ کے مطابق رومن نہیں لکھی ہو گی تو یہ کوڈ کام نہیں کرے گا۔
ابن سعید اور نبیل برادران نے ایک ایک اطلاقیہ بنایا تھا جس میں گوگل کے سرور کو رومن بھیج کر اردو میں تبدیل کروایا جاتا ہے۔ میرے خیال میں وہ طریقہ کہیں زیادہ قابل عمل ہے۔
برادرم نبیل ، اگر اردو سے رومن میں تبدیل کروانا چاہتے ہیں تو چند ایک رومن ڈکشنریاں موجود ہیں جن کو استعمال میں لایا جا سکتا ہے مثلاً ہندوستانی ٹو انگلش ڈکشنری جو کہ آرکائیو ڈاٹ آرگ پر موجود بھی ہے۔
اس قدر مبہم جواب سے مزید ابہام پیدا ہو گئے۔۔۔ دور کیا خاک ہونے تھےکچھ نکات میں نے اوپر بیان کیے ہیں جس میں تمہارے چند اعتراضات کے جواب ہیں۔
میں کوئی معیار نہیں بنا رہا اور نہ ہی ایسی کوشش کا فی الحال کوئی ارادہ ہے۔ دوسرا کوڈ میں یہ لچک رکھی جا سکتی ہے کہ وہ معیار سے ہٹ کر بھی لکھی ہوئی چیزوں کی درستگی کر سکے مگر ابھی یہ بھی ارادہ نہیں۔
مقصد اس وقت اردو سے رومن(اس میں صوتی الفاظ شامل ہوں گے) میں الفاظ کی ایسی ضخیم فہرست تیار کرنا ہے جسے بنیاد بنا کر کئی سافٹ ویئر میں استعمال کیا جا سکے جس میں سر فہرست
ڈریگن نیچرل اسپیکنگ ٹیکسٹ ٹو اسپیچ ہے
اس کے علاوہ اس فہرست کو اسپیل چیکر کے طور پر استعمال کیا جا سکے گا۔
اس کے علاوہ اسے باقیوں کے استعمال کے لیے آزاد رکھا جائے گا اور اس میں اضافہ و تدوین بھی ہوتی رہے گی۔
اس قسم کی فہرست کی ضرورت عرصہ سے محسوس کی جاتی رہی ہے اور اب اسے بنانے اور پروف ریڈ کرنے کے لیے کام کا آغاز کیا جا رہا ہے۔
میرے خیال سے اب کافی ابہام دور ہو گئے ہوں گے۔
اس قدر مبہم جواب سے مزید ابہام پیدا ہو گئے۔۔۔ دور کیا خاک ہونے تھے