ان پیج سے یونیکوڈ میں تبدیلی کے مسائل کم کیسے؟

الف عین

لائبریرین
کل ان پیج فائل کو جب میں نے اردو تحریر میں کنورٹ کیا تو محض اعداد اور ’ؤ‘ کے علاوہ کوئ مسئلہ نہیں ہوا۔ جب کہ دوسروں کی ٹائپ کی ہوئ فائلوں میں "آ" کا مسئلہ بھی ہوتا ہے۔ اور ان پیج ٹائپ کرنے والے تو درمیانی ی کو بڑی ے بھی ٹائپ کر دیتے ہیں اور ایسے ویسے کیسے کیسے ہی نہیں کےسے کے سے اور کےسے کےسے اےسے وےسے بھی ہو جاتے ہیں۔ اس غلطی کی تو عادت ہی نہیں مجھے، لیکن باقی مسائل کیوں پیش نہیں آئے؟ یہ عجیب سوال ہے۔

آج جس مضمون کی بات میں نے کی ہے (اسے الگ پوسٹ کر رہا ہوں اردو نامہ فورم میں) کنورٹ کرنے کے بعد کچھ جملوں میں تبدیلی کی اور خیال آیا کہ ان جملوں کو بھی اردو یونیکوڈ سالوشن سے پھر ان پیج میں کنورٹ کروں تو یہ بری طرح ناکام رہا!! مختلف تحریروں سے آزمایا، یونیکوڈ سے ان پیج میں ذرا بھی صحیح کنورٹ نہیں ہوتی تحریر۔
 
ایک ان پیج ٹو یونی کوڈ کنورٹر پر کچھ تجربات

اعجاز صاحب ان پیج کے حوالے سے آپ کی متعدد شکایات نے مجھے اس طرف راغب کیا ہے اور میں نے ایک ان پیج ٹو یونی کوڈ کنورٹر پر کچھ تجربات کیے ہیں جس کے ابھی تک کے نتائج اچھے ہیں۔ جو لوگ ان پیج استعمال کرتے ہیں ان سے درخواست کروں گا کہ کچھ نمونہ فائلیں مہیّا کریں۔ اس طرح عملی مشکلات کو سامنے رکھتے ہوئے ممکن ہے بہتر سلوشن مہیا کیا جاسکے۔
 
متنوع قسم کا متن

اعجاز صاحب آپ ایسی فائلیں مہیا کردیں جن میں اچھا خاصا متنوع قسم کا متن موجود ہو اور آپ کے خیال میں ان میں غلطی کے زیادہ امکانات سامنے آتے ہوں۔

قیصرانی بھائی آپ سافٹ ویئر کی ٹیسٹنگ میں بہت فائدہ مند ہوسکتے ہیں۔ کیا آپ ان پیج استعمال کرتے ہیں؟
 
جہاں تک ے اور ی والے مسئلے کا تعلق ہے تو مجھے بھی اس کا سامنا کرنا پڑا۔ اس کاایک ہی واحد حل ہے۔ کہ ایم ایس ورڈ میں ری پیلس میں ے کو ی سے ایک ایک کرکے بدل دیا جائے۔ اور میں نے بھی یہی کیا۔
 

زیک

مسافر
لفظ کے درمیان میں ی کی بجائے ے استعمال کرنے کا مسئلہ تو programmatically حل کیا جا سکتا ہے۔ سیدھا سادا حل تو یہ ہے کہ اگر ے کے بعد کوئی حرف ہو نہ کہ وائٹ سپیس تو ے کو ی سے بدل دیا جائے۔ یہ کنورٹر پروگرام میں شامل کیا جا سکتا ہے۔
 

الف عین

لائبریرین
سوال ٹائپ کرنے والوں کی غلطی کا ہے، جو درمیان میں بھی ے ٹائپ کر دیتے ہیں۔ کنورٹر اونچہ ہمزہ کو ک ورٹ نہیں کر پاتا، اور اسی وجہ سے أ اور ۂ میں ڈبے یا الٹا سوالیہ نشان آجاتا ہے۔ ٹائپ کرنے والے بھی اکثر واؤ پر بھی اوپر ہمزہ دیتے ہیں‌ان پیج میں، اور ۂ کو تو اتنے طریقوں سے لکھا جاتا ہے کہ کنورٹ کرنے پر معلوم ہوتا ہے کہ ۂ کو بھی ئہ لکھا گیا ہے مثلاً۔ کچھ ان پیج کی غلطی ہے کہ اس پروگرام میں بھی ایسا نظم ہونا تھا کہ درست طریقہ ایک ہی ہو، اگر غلط ٹائپ کرےں تو یونی کوڈ کی طرح ڈبہ یا گولہ بن جائے۔
 
غلط لکھنے پر تصحیح

یہ تو میرا بھی خیال ہے کہ غلط چیز کو غلط ہی نظر آنا چاہیے۔ اس پر کیا کہیے کہ ان پیج غلط لکھنے پر تصحیح کرتا چلا جاتا ہے۔ میری نظر میں نئے ان پیج ٹو یونی کنورٹر کا یہی خاکہ ہے کہ ایک تو یہ معروف انداز سے کیریکٹر کو کنورٹ کرے، دوسرے عمومی غلطیوں کی (اگر یوزر چاہے تو) تصحیح بھی کرتا چلا جائے جیسا زکریا نے کہا۔ اس سلسلے میں پہلی کاوش یہاں لاد دی ہے:

http://www.boriat.com/test/Inpage2Uni.zip

اعجاز صاحب، وہاب صاحب اور دوسرے احباب: میں آپ کی طرف سے ان پیج فائلوں کا منتظر ہوں۔ اگر پروگرام چیک کرسکیں تو مزید عنایت ہوگی۔

قیصرانی صاحب: پروگرام کی ٹیسٹنگ آپ کے ذمہ کر رہا ہوں۔ امید ہے جلد جواب سے مطلع فرمائیں گے۔
 

قیصرانی

لائبریرین
غلط لکھنے پر تصحیح

شارق مستقیم نے کہا:
قیصرانی صاحب: پروگرام کی ٹیسٹنگ آپ کے ذمہ کر رہا ہوں۔ امید ہے جلد جواب سے مطلع فرمائیں گے۔
شکریہ شارق بھائی

ویسے یہ مسئلہ جو ے کا ہوتا ہے، اسے میں اس طرح حل کرتا ہوں‌کہ

ہےں

کو منتخب کر کے اسے

ہیں

سے بدل دیتا ہوں یعنی ری پلیس آل :)
 

قیصرانی

لائبریرین
شارق بھائی، میں نے ان پیج کی اصل فائل، وہ فائل جس میں ان پیج سے کاپی کرکے جو ڈیٹا نوٹ پیڈ میں‌ رکھایعنی سورس فائل، کنورژن سے حاصل ہونے والی فائل، اور فیڈ بیک، تمام کی تمام یہاں رکھ دیں‌ہیں۔ زپ فائل ہے 161 کلو بائٹس کی۔ وہ دیکھ لیں

لنک یہ ہے

باقی ابھی تک جو فیڈ بیک حاصل ہوا ہے، وہ یہاں‌ درج ہے

مجھے ذاتی طور پر یہ پروگرام اردو یونی کوڈ سالوشن کی نسبت بہت زیادہ اچھا لگا ہے۔ یہ عربی متن اور اعراب کو بہت زیادہ سپورٹ کرتا ہے بہ نسبت اردو یونی کوڈ سالوشن کے

ہارڈ وئیر اور سافٹ وئیر: میرا پیی سی انٹل تین گیگا ہرٹز انٹل اوریجنل ایچ ٹی ان ایبلڈ ود فی میل پروسیسر ہے۔ مدر بورڈ انٹل 915 جی اے جی ہے۔ ہارڈ ڈسک اسی گیگا بائٹس، ونڈوز ایکس پی میڈیا سینٹر ایڈیشن ہے

فانٹس اور اردو سپورٹ: اردو سپورٹ انسٹالڈ ہے۔ اردو فانٹس انسٹالڈ ہیں، محفل والے۔ صوتی-2 کی بورڈ ہے

براؤزر: انٹرنیٹ ایکسپلورر 0۔6 ہے اور موذیلا فائر فاکس کا 6۔0۔5۔1 ورژن ہے

ان پٹ فائل: میں نے پچاس سے زائد صفحات کی ان پیج فائل کو تجربہ کی بنیاد رکھا۔ اس میں اعراب، اردو اور عربی متن تھا (عربی متن یعنی کہ آیات)۔ تو مندرجہ ذیل نتائج حاصل ہوئے

طریقہ کار یہ تھا کہ میں نے ان پیج سے ڈیٹا کاپی کر کے نوٹ پیڈ میں رکھا اور وہاں سے فائل کو ان پیج 2 یونی کوڈ کنورٹر میں براؤز کرکے لایا اور کنورٹ کیا

ضروری نوٹ: نتائج سے قطع نظر، مجھے اس پروگرام کی پرفارمنس نے بہت زیادہ متائثر کیا ہے

مندرجہ ذیل نتائج حاصل ہوئے

الٰہ میں ل ٰ اور ہ کا جوڑ غلط بنتا ہے

زیر کی پوزیشن بالکل درست ہے

ہےں والا مسئلہ ہے

شد درست دکھائی دے رہی ہے

اگر بسم اللہ الرحمان الرحیم لکھا جائے تو للہ کی جگہ یہ کوڈ دکھائی دیتا ہے [L:4 R:203]

عام لکھے گئےاللہ کے تمام حروف درست ہیں

پیش درست کام کرتی ہے

زبر بھی درست منتقل ہوئی ہے

کسی حرف پر اگر چھوٹا د (مجھے اس کا نام نہیں پتہ، لیکن یہ حرف کو ساکن بنا دیتی ہے، ہو تو اس د کی جگہ یہ کوڈ دکھائی دیتا ہے [L:4 R:177]، باقی تمام حروف درست ہوتے ہیں

اگر ہ پر ہمزہ ہو تو وہ دوسرے فانٹ کا ہ بمع ہمزہ یعنی ۂ دکھائی دیتا ہے

اگر ا پر ہمزہ ہو تو وہ بھی اسی طرح الگ حرف بن جاتا ہے، جیسے الا میں دوسرے الف پر ہمزہ ہو تو وہ الگ ہو جاتا ہے اور دوسرے فانٹ کا حرف یعنی أ دکھائی دیتا ہے

صلی اللہ علیہ وآلہ وسلم کی جگہ چوکور ڈبہ دکھائی دیتا ہے جو پوسٹ ہو کر اس محفل میں ﷺ دکھائی دیتا ہے

اگر وحیء الٰہی کو دیکھیں تو و، ح اور ئ الگ دکھائی دیتے ہیں، غور کیجئے گا کہ ئ دکھائی دیتا ہے نہ کہ ئی۔ جیسا کہ یہ یٔ

عَجِزَ فُلَانٌ عَنِ میں دیکھیں کہ فلا کو فُلَا دکھاتا ہے

: کی جگہ [L:4 R:224] دکھائی دیتا ہے

رح کی جگہ ؒ دکھائی دیتا ہے

اردو ہندسے عربی والے آتے ہیں جیسا کہ (الشفائ،۱:۹۴۳) اسی طرح دیکھیں کہ خالی ہمزہ کیسے دکھائی دیتی ہے، (الشفائ،۱:۹۴۳)

اردو فل سٹاپ یعنی - کی جگہ [L:4 R:245] دکھائی دیتا ہے

آیت کا اختتامی گول دائرہ ایسے دکھائی دیتا ہے o

خواجہ اجمیر رحمتہ اللہ علیہ کو ایسے دیکھ سکتے ہیں حضرت خواجۂ اجمیرؒ

حضر موسٰی علیہ السلام کو ایسے دکھاتا ہے حضرت موسیٰ ں

گئیں کو گئےں دیکھ سکتے ہیں

حضرت عیسٰی علیہ السلام کو حضرت عیسیٰں

حضرت یعقوب علیہ السلام کو حضرت یعقوب ں یعنی علیہ السلام کو ں سے ظاہر کر رہا ہے
 

قیصرانی

لائبریرین
اس کے علاوہ یہ بھی دیکھیں کہ کئی الفاظ ایسے ہیں جو نوٹ پیڈ میں غلط مگر محفل پر پوسٹ ہو کر درست دکھائی دے رہے ہیں اور کئی ایسے ہیں جو دونوں‌جگہ غلط ہیں۔ نوٹ پیڈ‌ کی فائل کو میں نے یونی کوڈ میں محفوظ کیا ہے، نہ کہ یونی کوڈ 8 بٍگ اینڈین
 

منہاجین

محفلین
منتقلی کےدوران خراب ہونےوالےحروف اور نئے مسائل

امانت علی گوہر کے پروگرام میں بعض اوقات آ اور اکثر اوقات ؤ اور ہمزہ اضافت درست طور پر منتقل نہیں ہوتے۔ اور ے کے بعد فاصلہ ختم ہو جاتا ہے اور وہ (ے) اگلے لفظ کے ساتھ جڑ جاتی ہے۔

شارق مستقیم کے پروگرام میں ان پیج سے یونیکوڈ میں منتقلی کے بعد ہٹمل فائل کو جب فرنٹ پیج، نوٹ پیڈ وغیرہ میں کھولتے ہیں تو آ، ؤ اور ہمزہ اضافت درست طور پر منتقل ہوتے ہیں۔ اور ے کے بعد فاصلہ برقرار رہتا ہے اور وہ (ے) اگلے لفظ کے ساتھ نہیں جڑتی۔

شارق مستقیم کے پروگرام کے مسائل

لائن بریک
کے بعد کا ٹیکسٹ اسی سطر میں ظاہر ہوتا ہے، نتیجۃً سارا صفحہ ایک ہی لائن میں ظاہر ہوتا ہے۔

منتقل شدہ ٹیکسٹ لفظوں کی بجائے نمبروں میں دکھائی دیتا ہے، جس کی وجہ سے اسے نوٹ پیڈ میں رہتے ہوئے ایڈٹ کرنا ممکن نہیں رہتا۔

امانت علی گوہر کے پروگرام میں ان پیج سے یونیکوڈ میں منتقلی کے بعد ٹیکسٹ کو جب فرنٹ پیج میں پیسٹ کرتے وقت اگر پہلے ہی کریکٹر سیٹ utf-8 کر دیا جائے تو پیسٹ کرنے کے بعد نمبروں میں لکھی گئی عبارت خود بخود لفظوں میں دکھائی دینے لگتی ہے، جس سے بعد میں ٹیکسٹ میں کسی قسم کی تبدیلی آسانی سے کی جا سکتی ہے۔


ان پیج سےیونیکوڈ میں منتقلی کےدوران خراب ہونےوالےحروف کی فہرست - گوہر کے پروگرام کے مطابق
الف مد
آ
واو¿ ہمزہ والی
و¿
ہمزہ¿ اضافت
¿
بڑی ےکےبعد سپیس کا مسئلہ
ی
الف اور ہمزہ
ا¿
الف نیچےہمزہ

تا مدورہ
ة
الٹا پیش

تنوین

جزم سادہ

جزم گول

یا ہمزہ
ی¿
یا نقطہ دار

رضی اللہ عنہ

رحمة اللہ علیہ

علامتِ شعر

علامتِ تخلص

علامتِ سن



ان پیج سے یونیکوڈ میں منتقلی کے دوران خراب ہونے والے حروف کی فہرست - شارق کے پروگرام کے مطابق
الف مد
آ
واؤ ہمزہ والی
ؤ
ہمزۂ اضافت
ٔ
بڑی ے کے بعد سپیس کا مسئلہ
ے
الف اور ہمزہ
أ
الف نیچے ہمزہ
[L:4 R:202]
تا مدورہ
ۃ
الٹا پیش
[L:4 R:190]
تنوین
ٌ
جزم سادہ
[L:4 R:177]
جزم گول
[#]
یا ہمزہ
یٔ
یا نقطہ دار
ي
رضی اللہ عنہ
ؓ
رحمۃ اللہ علیہ
ؒ
علامتِ شعر
؂
علامتِ تخلص
ؔ
علامتِ سن
[L:4 R:247]


شارق بھائی! میں آپ کو ان پیج سے یونیکوڈ میں منتقلی کے حوالے سے میں آپ کو ایک نمونہ فائل بھیجنا چاہتا ہوں، جس میں دورانِ منتقلی خراب ہونے والے تمام حروف لکھے ہیں۔ اگر آپ مجھے اپنا ای میل ایڈریس ذ پ کر دیں تو مہربانی ہو گی۔ شکریہ
 
ان پیج فائل مہیا کر دیجیے

قیصرانی بھائی اور مناجین بھائی آپ لوگوں کے مفصل تجزیے کے لیے مشکور ہوں۔ خلاف توقع ایپلی کیشن میں بہت زیادہ اغلاط نہیں ملیں۔

آپ کے فیڈ بیک کی روشنی میں مَیں نے دوبارہ نظر ثانی کرتے ہوئے پروگرام میں سے کئی غلطیاں ختم کی ہیں تاہم مجھے جزم سادہ اور گول کی یونی کوڈ ویلیوز نہیں مل رہی ہیں۔

قیصرانی بھائی کی سیمپل فائل میں اب بہت کم غلطیاں نظر آرہی ہیں۔ میں مشورہ دوں گا کہ آپ لوگ فائل کو نفیس ویب نسخ کی روشنی میں جانچیں کیونکہ وہ یونی کوڈ کو درست فالو کرتا ہے۔ مناجین بھائی آپ مجھے ان پیج فائل مہیا کر دیجیے۔

اپ ڈیٹ یہاں لاد دی گئی ہے:

http://www.boriat.com/test/Inpage2Uni_0.1.zip
 

صابرحسین

محفلین
شارق کے نئے ورژن کے ذریعے یونیکوڈ تبدیلی کے دوران خراب ہونے والے حروف میں یہ بھی شامل ہیں:

" سے [L: 34]

ؤ سے ئو

آپ کے دیئے گئے فونٹ اردو ویب نسخ میں (آ) درست نظر آتا ہے مگر اردو نسخ ایشیاء ٹائپ میں دیکھنے پر ( آ) کی جگہ ڈبہ نظر آتا ہے۔

نئے کنورٹر نے سیمینارز کو (سےمےنار ز) بنا دیا حالانکہ پرانے کنورٹر نے بالکل صحیح حالت میں تبدیل کیا۔

آپ کو بطور نمونہ ایک فائل بھیج رہا ہوں چیک کر لیں۔
 

قیصرانی

لائبریرین
شکریہ شارق بھائی، ابھی اس نئی اپ ڈیٹ کو کس طرح سے جانچنا ہے۔ کیا وہی سیمپل فائل رکھوں‌ یا نئی فائل کو بنیاد بناؤں؟
 

دوست

محفلین
اس بات سے قطع نظر کہ یونیکوڈ متبدل کی ترقی کہاں پہنچی۔ مجھے صابر حسین کی آمد نے یہ پیغام لکھنے پر مجبور کیا۔
یہ صاحب مجھ سے بھی سینیر ہیں‌ محفل میں‌ لیکن پھر ایسے غائب ہوئے کہ اب نظر آئے ہیں۔
خوش آمدید بھائی جی۔ اور امید ہے آپ اب آتے جاتے رہیں گے۔ یہ اس وقت یہاں رونق لگایا کرتے تھے جب محفل کے اراکین سو سے بھی کم تھے۔
منہاجین، قدیر، نبیل بھائی اور صابر حسین کی پوسٹس اور گپ شپ بالکل شروع کے دھاگوں‌ میں پڑھی جاسکتی ہے۔
 

صابرحسین

محفلین
بہت شکریہ دوست بھائی، یہ آپ جیسے دوستوں کی محبت ہے کہ مجھے بھی یاد رکھا۔

کچھ مصروفیات اس طرح کی تھیں کہ حاضری نہیں ہو سکی، اب ان شاء اللہ حاضری ہوا کرے گی۔
 
تیسری کاوش

ان پیج سے یونی کوڈ میں تبدیل کرنے والے سافٹ ویئر کی تیسری کاوش پیش ہے۔ اگر قیصرانی صاحب آپ نے پچھلا ورژن ٹیسٹ نہیں کیا تو اب اِس کو چیک کریں۔ نئے ورژن سے قیصرانی بھائی، منہاجین بھائی اور صابر بھائی کے سیمپلز تمام کے تمام درست کنورٹ ہو رہے ہیں۔

http://www.boriat.com/test/Inpage2Uni_0.3.zip
 
Top