ان پیج ٹو یونی کوڈ کنورٹر کی اصلاح کریں

نعیم سعید

محفلین
میں یہاں صرف یہ اطلاع دینا چاہ رہا تھا کہ میں نے فی الحال شارق کے ان پیج ٹو یونیکوڈ کنورٹر کو ہی سی شارپ پر پورٹ کرنے کا آغاز کیا ہے۔ یہ ان پیج کی ایکسپورٹ کردہ فائل کو ہی یونیکوڈ میں کنورٹ کرے گا۔ میرے خیال میں پہلے سٹیپ کے طور پر اس کنورٹر کو سی شارپ پر پورٹ کرنا ہی درست رہے گا۔ ایک مرتبہ یہ ٹھیک کام کرنے لگ جاتا ہے تو اس کے بعد براہ راست inp فائلوں کو کنورٹ کرنے اور ان پیج ڈاکومنٹس سے دوسرے فارمیٹنگ آپشنز پڑھنے کے بارے میں تحقیق کی جا سکے گی۔ میں کوشش کروں گا کہ جلد ہی اس کام کے ابتدائی نتائج یہاں فراہم کر دوں۔ مجھے اس کام میں شارق اور باقی دوستوں کی رہنمائی کی ضرورت رہے گی۔

نبیل بھائی! ان شاء اللہ ہر ممکن تعاون کے لیے بندہ کی خدمات حاضر ہیں۔
 

الف عین

لائبریرین
درست ہے نعیم، میں نے اصل شارق کی فائل کی جگہ اپنی رپلیس مینٹ والی فائل استعمال کی تو یہ درست کام کر رہا ہے۔ ’ڑ‘ والا مسئلہ بھی حل ہو گیا۔ اب میں اپنی اسی فائل کے ساتھ ای سنپ فولڈر میں اپ لوڈ کر دوں گا، ذرا کچھ اور ٹیسٹنگ ہو جائے۔
 
شارق بھائی!
جزاک اللہ۔
نیا ورجن چیک کیا ہے، الحمد للہ کچھ مسائل کا حل مل گیا، اور چند ایک ابھی باقی ہیں، قوی امید ہے کہ بہت جلد ان کا مناسب حل بھی نکل ہی جائے گا۔
’’ان پیج‘‘ کے جن کریکٹرز کو آپ تلاش نہیں کر پائے اس کے لئے میں نے ذیل میں ’’ان پیج‘‘ 2.4 کی ایک فائل رکھی ہے، امید ہے اس کی مدد سے آپ کریکٹر بھی تلاش کر سکیں گے اور ان مسائل کو بھی سمجھ جائیں گے جو ابھی باقی رہ گئے ہیں۔
http://dl.getdropbox.com/u/2483063/inpage sample file for shariq bhai.rar

اعجاز صاحب!
جی ابھی پہلی فرصت میں تفصیل جائزہ لیتا ہوں۔
کیا آپ نے اپنی ’’رپلیسمنٹ فائل‘‘ کو یونی کوڈ میں تبدیل کر لیا ہے؟ اگر نہیں کیا تو ضرور کر لیں جب ہی یہ کام کرے گی۔

شکریہ نعیم میں اسے چیک کرکے بتاتا ہوں
 

نبیل

تکنیکی معاون
شارق، میں نے اپنے سی شارپ والے پروٹو ٹائپ میں رپلیسمنٹ فائل کو نہ صرف یونیکوڈ میں بدل دیا ہے بلکہ اس کے لیے ایک ایکس ایم ایل فارمیٹ بھی تشکیل دے دی ہے۔ اب اسے ایک انٹرفیس کی مدد سے مدون کیا جانا ممکن ہو جائے گا۔ میں جلد ہی اس کا سورس کوڈ پیش کرتا ہوں۔
 

سعادت

تکنیکی معاون
پہلی بار شریکِ محفل ہو رہا ہوں۔ امید ہے آپ حضرات برا نہیں منائیں گے۔ :)

اس تھریڈ میں جاری گفتگو کو پڑھ کر مجھے تجسس ہوا تو اِن پیج کے فائل فارمیٹ پر تھوڑی سی تحقیق کر ڈالی۔ اس کے نتائج یہاں بیان کر رہا ہوں تاکہ مستقبل میں کام آ سکیں۔ (درج ذیل تمام باتیں اِن پیج ۳ سے سابقہ ورژن کے لیے ہیں۔)

لینکس میں اِن پیج کی فائل کی properties دیکھی جائیں تو وہ اسے OLE compound document storage کی حیثیت سے پہچانتا ہے۔ یہ مائکروسوفٹ کی تیار کردہ ایک ٹیکنالوجی ہے، اور خود مائکروسوفٹ نے اس ٹیکنالوجی کی جو implementation کر رکھی ہے، اُسے compound storage/file کہا جاتا ہے۔ (مائکروسوفٹ آفس میں اس فارمیٹ کا کثرت سے استعمال ہوتا ہے۔) اوپن آفس والوں نے (اللہ ان کا بھلا کرے) اس کمپاؤنڈ ڈاکیومنٹ فارمیٹ کی ریورس انجینیئرنگ پہلے ہی کر رکھی ہے، جس کی تفصیل یہاں (۱) دیکھی جا سکتی ہے۔ میں نے ایک اِن پیج فائل کو hex editor میں کھول کر اس کا header دیکھا تو اس بات کی تصدیق ہو گئی کہ اِن پیج کا فائل فارمیٹ یہی کمپاؤنڈ ڈاکیومنٹ ہے۔

پیچھے کہیں شارق بھائی کے کنورٹر کو سی شارپ پر پورٹ کرنے کا ذکر کیا گیا تھا۔ سی شارپ میں میرا تجربہ نہ ہونے کے برابر ہے، اور وِنڈوز پروگرامنگ میں بھی مَیں کوئی خاص مہارت نہیں رکھتا، لیکن MSDN پر موجود ان مثالوں (۲) کو دیکھتے ہوئے میرا قوی قیاس ہے کہ سی پلس پلس کی طرح سی شارپ کے لیے بھی ایسی کلاسز موجود ہوں گی جن کی مدد سے کسی کمپاؤنڈ فائل کو پڑھا جا سکے اور اس کی streams تک رسائی ہو سکے۔ اِن پیج اپنی فائل کے متن کو ایکسپورٹ کرتے ہوئے جو فائل بناتا ہے، اس کے اندر وہی کیریکٹرز موجود ہوتے ہیں جو اِن پیج فائل کی کسی stream میں محفوظ ہوتے ہیں۔ (اس بات کی تصدیق بھی میں نے hex editor کے ذریعے کی تھی۔ اس کے علاوہ اس پوسٹ (۳) میں نبیل بھائی نے جو output فراہم کی ہے، اُس سے بھی یہی ظاہر ہوتا ہے۔) چنانچہ اگر کسی اِن پیج فائل کی تمام streams میں سے کیریکٹرز کشید کر کے شارق بھائی کے کنورٹر کو پاس کیے جائیں تو ہو سکتا ہے کہ کامیابی حاصل ہو۔ اصل صورتحال مزید پیچیدہ بھی ہو سکتی ہے -- مثلاً فریمز اور دیگر فارمیٹنگ آپشنز میں سے کیریکٹرز کی کشیدگی شاید اتنی آسان نہ ہو -- لیکن فی الحال مَیں صرف ایک آئیڈیا پیش کر رہا ہوں۔

(میری یہ پوسٹ اس تھریڈ کے اصل موضوع سے کچھ ہٹ کے ہی ہے، جس کے لیے معذرت۔ پوسٹ کاؤنٹ کم ہونے کی وجہ سے روابط بھی درست طریقے سے embed نہیں کر پا رہا، اس کے لیے بھی معذرت۔)

(۱) sc.openoffice.org/compdocfileformat.pdf
(۲) msdn.microsoft.com/en-us/library/aa380308%28VS.85%29.aspx
(۳) urduweb.org/mehfil/showpost.php?p=581220&postcount=58
 

arifkarim

معطل
محفل پر خوش آمدید سعادت۔ یہ تو بہت اچھی خبر ہے کہ انپیج کا ڈیفالٹ فارمیٹ اور اوپن آفس آپس میں ایک ربط رکھتا ہے گو کہ یہ ربط ڈیکوڈ کرنے میں کافی وقت لگے گا، مگر ایک ہی بار کی محنت سے ٹیکسٹ فارمیٹنگ اور ایکسپورٹنگ جیسے مسائل پر قابو پایا جا سکے گا!
 

نبیل

تکنیکی معاون
بہت شکریہ سعادت۔ آپ نے بہت کارآمد معلومات فراہم کی ہیں۔ اس سے ہماری تحقیق میں کافی مدد مل سکتی ہے۔ آپ پلیز اس تھریڈ کو اور اس سے متعلقہ تھریڈز کو نظر میں رکھیں۔ میں نے شارق کے کنورٹر کو سی شارپ پر پورٹ کرنے کا کام تقریباً مکمل کر لیا ہے۔ ابھی صرف پروگرام کی آپشنز کو فائل میں پڑھنے والا حصہ باقی رہ گیا ہے۔ ڈاٹ نیٹ میں ini فائل کی بجائے appSettings آبجیکٹ کے ذریعے پروگرام کی سیٹنگز پڑھی جاتی ہیں۔ اس کے استعمال میں کچھ دقت پیش آ رہی ہے۔ کچھ وقت ملتا ہے تو اس کو بھی دیکھ لیتا ہوں۔ اس کے بعد اس پروٹوٹائپ کو یہاں فراہم کر دوں گا۔ ڈاٹ‌نیٹ کے ذریعے پرانے com انٹرفیس کو استعمال کرنا ممکن ہے۔ سی شارپ میں بھی سٹرکچرڈ سٹوریج کو پڑھنے کا کوئی نہ کوئی طریقہ مل جائے گا۔
 
پہلی بار شریکِ محفل ہو رہا ہوں۔ امید ہے آپ حضرات برا نہیں منائیں گے۔ :)

اس تھریڈ میں جاری گفتگو کو پڑھ کر مجھے تجسس ہوا تو اِن پیج کے فائل فارمیٹ پر تھوڑی سی تحقیق کر ڈالی۔ اس کے نتائج یہاں بیان کر رہا ہوں تاکہ مستقبل میں کام آ سکیں۔ (درج ذیل تمام باتیں اِن پیج ۳ سے سابقہ ورژن کے لیے ہیں۔)

لینکس میں اِن پیج کی فائل کی properties دیکھی جائیں تو وہ اسے ole compound document storage کی حیثیت سے پہچانتا ہے۔ یہ مائکروسوفٹ کی تیار کردہ ایک ٹیکنالوجی ہے، اور خود مائکروسوفٹ نے اس ٹیکنالوجی کی جو implementation کر رکھی ہے، اُسے compound storage/file کہا جاتا ہے۔ (مائکروسوفٹ آفس میں اس فارمیٹ کا کثرت سے استعمال ہوتا ہے۔) اوپن آفس والوں نے (اللہ ان کا بھلا کرے) اس کمپاؤنڈ ڈاکیومنٹ فارمیٹ کی ریورس انجینیئرنگ پہلے ہی کر رکھی ہے، جس کی تفصیل یہاں (۱) دیکھی جا سکتی ہے۔ میں نے ایک اِن پیج فائل کو hex editor میں کھول کر اس کا header دیکھا تو اس بات کی تصدیق ہو گئی کہ اِن پیج کا فائل فارمیٹ یہی کمپاؤنڈ ڈاکیومنٹ ہے۔

پیچھے کہیں شارق بھائی کے کنورٹر کو سی شارپ پر پورٹ کرنے کا ذکر کیا گیا تھا۔ سی شارپ میں میرا تجربہ نہ ہونے کے برابر ہے، اور وِنڈوز پروگرامنگ میں بھی مَیں کوئی خاص مہارت نہیں رکھتا، لیکن msdn پر موجود ان مثالوں (۲) کو دیکھتے ہوئے میرا قوی قیاس ہے کہ سی پلس پلس کی طرح سی شارپ کے لیے بھی ایسی کلاسز موجود ہوں گی جن کی مدد سے کسی کمپاؤنڈ فائل کو پڑھا جا سکے اور اس کی streams تک رسائی ہو سکے۔ اِن پیج اپنی فائل کے متن کو ایکسپورٹ کرتے ہوئے جو فائل بناتا ہے، اس کے اندر وہی کیریکٹرز موجود ہوتے ہیں جو اِن پیج فائل کی کسی stream میں محفوظ ہوتے ہیں۔ (اس بات کی تصدیق بھی میں نے hex editor کے ذریعے کی تھی۔ اس کے علاوہ اس پوسٹ (۳) میں نبیل بھائی نے جو output فراہم کی ہے، اُس سے بھی یہی ظاہر ہوتا ہے۔) چنانچہ اگر کسی اِن پیج فائل کی تمام streams میں سے کیریکٹرز کشید کر کے شارق بھائی کے کنورٹر کو پاس کیے جائیں تو ہو سکتا ہے کہ کامیابی حاصل ہو۔ اصل صورتحال مزید پیچیدہ بھی ہو سکتی ہے -- مثلاً فریمز اور دیگر فارمیٹنگ آپشنز میں سے کیریکٹرز کی کشیدگی شاید اتنی آسان نہ ہو -- لیکن فی الحال مَیں صرف ایک آئیڈیا پیش کر رہا ہوں۔

(میری یہ پوسٹ اس تھریڈ کے اصل موضوع سے کچھ ہٹ کے ہی ہے، جس کے لیے معذرت۔ پوسٹ کاؤنٹ کم ہونے کی وجہ سے روابط بھی درست طریقے سے embed نہیں کر پا رہا، اس کے لیے بھی معذرت۔)

(۱) sc.openoffice.org/compdocfileformat.pdf
(۲) msdn.microsoft.com/en-us/library/aa380308%28vs.85%29.aspx
(۳) urduweb.org/mehfil/showpost.php?p=581220&postcount=58

سعادت بھائی پہلے ہی مراسلے کے ساتھ آپ چھا گئے ہیں۔

بہت اچھی معلومات کا تبادلہ کیا ہے اور آپ کے فراہم کردہ روابط کا مطالعہ کرنے کے بعد تو مجھے آئی این پی فائل سے براہ راست یونی کوڈ میں تبدیلی بہت مشکل کام محسوس نہیں ہورہی۔ اچھی بات یہ ہے کہ کنورٹر پر ہماری حالیہ کوششیں رائیگاں نہیں جائیں گی اور انہی کنورژن کو آگے بڑھا کر ایک بہتر مبدل تک رسائی حاصل کی جا سکتی ہے۔
 

نبیل

تکنیکی معاون
یہاں میں سی شارپ والے پروٹوٹائپ کے چند سکرین شاٹ پیش کر رہا ہوں۔ ذیل میں پروگرام کا مین فارم ہے:
screen1.gif

کنورژن میں استعمال ہونے والی تصحیحات کو پروگرام میں مدون کیا جا سکتا ہے جیسا کہ ذیل میں دکھایا گیا ہے:

screen2.gif


screen3.gif

ذیل کی تصویر میں ان پیج فائل منتخب کرنے اور اسے یونیکوڈ میں کنورٹ کرنے والا ڈائیلاگ دکھایا گیا ہے:

screen4.gif
 

نعیم سعید

محفلین
نبیل بھائی!
جزاک اللہ! اسکرین شاٹ دیکھ کر بہت خوشی ہوئی۔ اور اب بہت شدت سے پروگرام کا انتظار ہے۔
کیا اس میں کنورٹنگ صرف ’’ٹیکسٹ‘‘ فائل کی صورت میں ہوگی یا شارق بھائی کے کنورٹر کی طرح ’’ایچ ٹی ایم ایل‘‘ فائل بھی کنورٹ ہوگی۔مزید یہ کہ کیا ان پیج کی فائل زیادہ بڑی ہونے کی صورت میں بھی ٹیکسٹ فائل بن پائے گی؟ یا کوئی اور حل نکالنا پڑے گا۔
 

الف عین

لائبریرین
ایچ ٹی ایم ایل کی میں تو کوئی ضرورت محسوس نہیں کرتا تھا، میں نے آئ این آئ فائل میں اس کی قدر صفر کر رکھی تھی۔
نبیل، سکرین شاٹ سے تو بہت خوشی ہو رہی ہے۔ لیکن یہ بتائیں کہ کیا مکمل فائل۔۔ جس میں ممکن ہے کہ ایک سے زائد ٹیکسٹ باکس ہوں، ایک ساتھ کنورٹ ہو سکتے ہیں۔ اگر ایسا ممکن ہوا تو تمہارے کی بورڈ/ماؤس میں گھی شکر!!
 

نبیل

تکنیکی معاون
نعیم، فی الحال یہ صرف ایک پروٹوٹائپ ہے۔ ابھی اس میں صرف ٹیکسٹ‌ فائل میں آؤٹ پٹ جنریٹ کی جا رہی ہے۔ ایچ ٹی ایم ایل آؤٹ پٹ فیچر کو بعد میں شامل کر لیا جائے گا۔
 

نبیل

تکنیکی معاون
ایچ ٹی ایم ایل کی میں تو کوئی ضرورت محسوس نہیں کرتا تھا، میں نے آئ این آئ فائل میں اس کی قدر صفر کر رکھی تھی۔
نبیل، سکرین شاٹ سے تو بہت خوشی ہو رہی ہے۔ لیکن یہ بتائیں کہ کیا مکمل فائل۔۔ جس میں ممکن ہے کہ ایک سے زائد ٹیکسٹ باکس ہوں، ایک ساتھ کنورٹ ہو سکتے ہیں۔ اگر ایسا ممکن ہوا تو تمہارے کی بورڈ/ماؤس میں گھی شکر!!
اعجاز اختر صاحب، میں عرض کر چکا ہوں کہ فی الحال ان پیج سے ایکسپورٹ شدہ فائل کو ہی یونیکوڈ کرنے پر کام کیا جائے گا۔ ایک مرتبہ یہ آپریشن کچھ سٹیبل ہو جائے تو اس کے بعد براہ راست انپیج ڈاکومنٹ کو ہی کنورٹ کرنے پر کام کیا جائے گا۔
 

طمیم

محفلین
انپیج ٹیکسٹ سے یونیکوڈ

جیسا کہ اوپر بیان کیا گیا ہے کہ یونی کوڈ میں‌کنورٹ کرنے کے لئے انپیج سے ٹیکسٹ ایکسپورٹ کرکے فائل بنانی ہوگی ۔ کیا اس کے علاوہ اس میں انپیج ٹیکسٹ سے کاپی پیسٹ کے ذریعہ بھی یونی کوڈ میں کنورٹ کرنے کی سہولت ہوگی جیسا کہ http://urdu.ca/convert آن لائن کنورٹر میں موجود ہے
 

نبیل

تکنیکی معاون
شارق نے اس پوسٹ میں جو اپڈیٹ مہیا کی تھی وہ اب دستیاب نہیں ہے۔ :(
اگر کسی دوست کے پاس ہو تو پلیز یہاں شیئر کر دیں۔
 

arifkarim

معطل
شارق نے اس پوسٹ میں جو اپڈیٹ مہیا کی تھی وہ اب دستیاب نہیں ہے۔ :(
اگر کسی دوست کے پاس ہو تو پلیز یہاں شیئر کر دیں۔

میں کافی عرصہ سے یہاں چیخ چیخ کر تھک گیا ہوں کہ پلیز یہاں فائلز پوسٹ کرتے وقت ایک "قابل اعتماد" ہوسٹ استعمال کیا کریں۔ لیکن لگتا ہے اثر نہیں ہوتا :chatterbox:
مطلوبہ فائلز کے ان ایکسپائرڈ لنکس:
http://arifkarim.no/Public/Inpage2UNI_WEB_0.9.4.zip
http://arifkarim.no/Public/Inpage2UNI_SRC_0.9.4.zip
 
مدیر کی آخری تدوین:
میں کافی عرصہ سے یہاں چیخ چیخ کر تھک گیا ہوں کہ پلیز یہاں فائلز پوسٹ کرتے وقت ایک "قابل اعتماد" ہوسٹ استعمال کیا کریں۔ لیکن لگتا ہے اثر نہیں ہوتا :chatterbox:
مطلوبہ فائلز کے ان ایکسپائرڈ لنکس:
http://arifkarim.no/Public/inpage2uni_web_0.9.4.zip
http://arifkarim.no/Public/inpage2uni_src_0.9.4.zip
عارف بھائی ایک تھریڈ بنا کر شیئر کر دیں،جس میں ڈراپ باکس کا طریقہ بتایا گیا ہو،اور جہاں ضرورت ہو اس کا حوالہ دے دیا کریں، خیر میں تو اب استمال کرنے لگا ہوں ، مجھ سے جو غلطی ہورہی تھی کہ میں فائل کو پبلک فولڈر میں ڈالے بغیر اس کا پبلک لنک لینا چاہتا تھا ،بعد میں اس پر نظر پڑی تو فورا سمجھ آگئی
 
مدیر کی آخری تدوین:
Top