ان پیج کی پی ڈی ایف سے متن اخذ کرنے کی ایک ناکام کوشش

رانا

محفلین
کئی دوستوں کے زہن میں گھنٹی بجی ہوگی کہ جب کوشش ناکام ہوگئی تو یہاں ذکر کرنے کی کیا تک ہے۔ لیکن میرے خیال میں ایسی ناکام کوشش کا تذکرہ ضرور کرنا چاہئے جس کے بارے میں یہ امید ہو کہ ان خطوط پر کوئی دوسرا کام شروع کرکے کامیابی سے ہمکنار ہوسکتا ہے۔

پس منظر اس کا یہ ہے کہ کافی عرصے سے خاکسار کی یہ خواہش تھی کہ کسی طرح ان پیج کی پی ڈی ایف سے متن یونی کوڈ میں اخذ کیا جاسکے۔ اس خواہش کا ذکر ایک بار محفل پر بھی کئی سال پہلے کیا تھا جس کا جواب یہ ملا تھا کہ یہ ناممکن کام ہی ہے۔ لیکن اسکے باوجود فرصت کے اوقات میں کبھی کبھی تجربات کرنے کی کوشش کرتا تھا ۔ پھر کوئی ایک سال پہلے ایک خیال زہن میں آیا کہ مختلف پی ڈی ایف ریڈرز ان پیج کی فائل کو بالکل درست طریقے پر دکھاتے ہیں۔ چاہے وہ ایکروبیٹ ریڈر ہو یا فاکس ریڈر یا کوئی اور تھرڈ پارٹی ریڈر۔ تو جب وہ ریڈر ان پیج کی پی ڈی ایف سے متن درست طور پر اخذ کرسکتے ہیں تو انہیں بنیادوں پر ہم کیوں نہیں کرسکتے۔ اس بات سے اس طرف توجہ مبذول ہوئی کہ ضرور پی ڈی ایف کا کوئی نہ کوئی اسٹینڈرڈ ہوگا جس کی بنیاد پر مختلف پی ڈی ایف ریڈر ایک ہی نتیجہ دکھاتے ہیں۔

چنانچہ جب اس حوالے سے چھان بین کی گئی تو پتہ لگا کہ ایڈوب والوں نے سن 2007 میں پی ڈی ایف کے اسٹرکچر کو ایک معیار بنانے کے لئے آئی ایس او کے حوالے کردیا تھا۔اس وقت سے اس کے اسٹینڈرڈ کو آئی ایس او دیکھ رہی ہے اور یہ ایک عالمی اسٹینڈرڈ کا فائل فارمیٹ بن چکا ہے جس کی بنیاد پر کوئی بھی اپنا پی ڈی ایف ریڈر تیار کرسکتا ہے۔ جب اس اسٹینڈرڈ کے لئے آئی ایس او کی ویب سائٹ پر گیا تو پتہ لگا کہ اسکی دستاویز مفت نہیں ہے کچھ ڈالر خرچ کرنے پڑیں گے۔ لیکن چھان بین کے دوران ایک اچھی بات یہ پتہ لگی کہ جب ایڈوب نے 2007 مین یہ دستاویز آئی ایس او کے حوالے کی تھی تو اس کی ایک کاپی اپنی ویب سائٹ پر بھی استفادہ عام کے لئے رکھ دی تھی۔ چنانچہ ایڈوب کی ویب سائٹ سے وہ دستاویز اتار ی جو 750 کے قریب صفحات پر مشتمل تھی۔ اس کا مطالعہ شروع کیا لیکن ایک تو وقت کی کمی دوسرے اعلیٰ قسم کے دماغ کی کمی کہ اس دستاویز کو پوری طرح گھول کر نہ پی سکے۔ لیکن پھر بھی اسکے مطالعہ سے بہت مفید باتوں کا پتہ لگا۔ کیونکہ میں مطالعہ کے دوران کوئی چھوٹی سی پی ڈی ایف لے کر اسے نوٹ پیڈ میں کھول کر اسکا تجزیہ بھی کرتارہتا تھا کہ جو کچھ دستاویز میں لکھا ہے اس کی عملی شکل کیسی ہے۔ جو کچھ اس دستاویز سے معلوم ہوا اسکا خلاصہ یہ تھا کہ اس فارمیٹ میں ہر چیز ایک آبجیکٹ کے طور پر ہینڈل ہوتی ہے۔ مثلا ٹیکسٹ ایک آبجیکٹ ہے، تصویری مواد ایک آبجیکٹ ہے۔ پھر ان کا میٹا ڈیٹا کہ ٹیکسٹ کا فونٹ کیا ہے سائز کیا ہے اور صفحے پر اسکی لوکیشن کیا ہے وغیرہ یہ سب بھی ٹیکسٹ کے ساتھ ہی ایک ڈکشنری کی صورت میں محفوظ ہوتے ہیں۔ اور اسی فائل میں فونٹ کے وہ گلفس بھی بائٹس کی شکل میں محفوظ کردئیے جاتے ہیں جو اس فائل کے متن میں استعمال کئے گئے ہوتے ہیں۔ نیز ایک فونٹ رینڈرنگ کا طریقہ کار بھی اسی میں موجود ہوتا ہے۔

اس دستاویز کے مطالعے کے دوران ایک اور بات زہن میں آئی کہ جب یہ دستاویز اس طرح اوپن رکھی ہوئی ہے تو بعید نہیں کہ مائکروسافٹ نے اس کے لئے کوئی لائبریری تیار کر کے بھی ڈاٹ نیٹ پلیٹ فارم پر مہیا کی ہو۔ جب اس حوالے سے چھان بین کی گئی تو مائکروسافٹ کی تو کوئی لائبریری نہیں ملی لیکن کچھ تھرڈ پارٹی لائبریریز ملیں جو قیمتا دستیاب تھیں۔ لیکن ایک لائبریری بنام آئی ٹیکسٹ شارپ اوپن سورس بھی مل گئی جو جاوا اور ڈاٹ نیٹ دونوں کے لئے دستیاب تھی۔ اس لائبیری کو استعمال کرکے ڈاٹ نیٹ میں ایک تجرباتی پروگرام لکھا جس کے لئے انگریزی کے ایک جملے پر مشتمل پی ڈی ایف فائل بنا کر استعمال کی گئی۔اس لائبریری کی بدولت اس ایک جملے میں استعمال کئے گئے فونٹ کے نام بمع ان کیریکٹرز کے ایسکی کوڈز کے مل گئے۔ پھر یہی تجربہ ایک اردو کے جملے پر مشتمل پی ڈی ایف فائل ان پیج کی مدد سے بنا کر اس پر کیا گیا۔ تو اس اردو کے جملے میں استعمال کئے فونٹس کے نام اور ایسکی کوڈز بھی مل گئے۔ ظاہر ہے کہ وہ کوڈ ان پیج کی فونٹس فائلز کے مطابق تھے اس لئے اس شکل میں قابل استعمال نہ تھے۔

اگلے مرحلے میں ایک انتہائی ہلکا پھلکا فونٹ ایڈیٹر ڈاون لوڈ کیا گیا اور ان پیج کے جمیل نستعلیق فونٹ کی 89 فائلز کو اس میں باری باری کھول کر ان کا ڈیٹا ایک ایکسل فائل میں منتقل کیا۔ اس طرح کہ ایکسل فائل میں تین کالم تھے۔ ایک میں فونٹ فائل کا نام، دوسرے میں اس فائل میں درج ایک ترسیمے کا ایسکی کوڈ اور تیسرے کالم میں اس ایسکی کوڈ کے لئے ڈیفائن کئے گئے گلف کو یونی کوڈمیں ٹائپ کیا گیا۔ روزانہ ڈیڑھ گھنٹہ اس پر خرچ کرنے کے بعد کوئی تین ہفتے میں یہ کام مکمل ہوا۔ یہ کام کرتے ہوئے کئی فائلز میں خالی کشتیوں اور آزاد نقطوں سے واسطہ پڑا ۔ ان کو دیکھ کر تو سر چکرا گیا اور دماغ میں گھنٹی بجی کہ ان پیج کی یہ گھٹیا حرکت ضرور ہماری راہ میں روڑے اٹکائے گی۔ ایسے ترسیموں کو بھی ایکسل میں فونٹ فائل کے نام اور ایسکی کوڈ کے ساتھ جگہ تو ضرور دی گئی لیکن ان کے سامنے یونی کوڈمیں کیا ٹائپ کرتے؟ مجبورا خالی جگہ چھوڑنا پڑی۔ اور بعد کو انہی خالی کشتیوں اور نقطوں نے رنگ میں بھنگ ڈالا۔

پھر ایک چھوٹا سا پروگرام بنایا گیا جس میں کوڈنگ کی ترتیب یہ رکھی گئی کہ پہلے ایکسل کا تمام ڈیٹامیموری میں اٹھا لیا جائے۔پھر اس اوپن سورس پی ڈی ایف لائبریری کی مدد سے ان پیج کی پی ڈی ایف فائل کو پراسس کرنا شروع کیا۔ ایک کیریکٹرلیا اور اسکے فونٹ فائل کے نام اور اسکی ایسکی ویلیو کے مطابق ایکسل کے ڈیٹا سے ریکارڈ اٹھا کر اسکے سامنے یونی کوڈ میں لکھے گئے ترسیمہ کو اٹھا لیا گیا۔ اس طرح ترتیب سے پوری پی ڈی ایف فائل کو پراسس کرکے ان ترسیموں کو ایک ٹیکسٹ باکس میں ڈسپلے کرایا گیا۔ نتیجہ یہ نکلا کہ پی ڈی ایف سے یونی کوڈ متن حاصل تو ضرور ہوا لیکن خالی کشتیوں اور نقطوں والے ترسیمے جہاں جہاں بھی ان پیج میں استعال کئے گئے تھے ان کی جگہ کچھ بھی نہیں تھا جس کا نتیجہ یہ نکلا کہ متن کے الفاظ کئی جگہوں سے ٹوٹے ہوئے تھے۔ ڈسپلے کرائے گئے ٹیکسٹ پر غور کرنے سے تین طرح کے مسائل نظر آئے۔ تینوں طرح کے مسائل بمعہ ان کے ممکنہ حل کے ذیل میں درج کئے جارہے ہیں۔

اول: خالی کشتیوں اور آزاد نقطوں کی غیر حاضری کی وجہ سے الفاظ کا ٹوٹنا
اسکا جو حل میرے زہن میں آیا وہ یہ تھا کہ ایسی تمام جگہوں پر جہاں آزاد کشتیاں اور نقطوں کے ملاپ سے ترسیمے جنریٹ ہورہے ہیں وہاں لازما دو ایسکی کوڈز کے پئیر ملیں گے۔ ایک آزاد کشتی کا اور دوسرا آزاد نقطوں کا۔ مختلف پی ڈی ایف فائلز کو مستقل مزاجی سے پراسس کرانا شروع کیا جائے اور جہاں جہاں یہ پئیر ملیں ان پئیر کی ایسکی ویلیوز کو ایکسل فائل میں درج کرکے ان کے سامنے یونی کوڈمیں وہ ترسیمہ لکھ دیا جائے جو ان دونوں کے ملاپ سے بن رہا ہے۔ اسطرح مستقل مزاجی سے تین چار ماہ کام کرنے سے سارے نہیں تو اکثر ترسیمے یونی کوڈ صورت میں ایکسل فائل میں درج ہوجائیں گے۔ پھر پروگرام میں یہ کنڈیشن اپلائی کردی جائے کہ جہاں جہاں یہ پئیرز ملیں وہاں مطلوبہ ترسیمہ ڈسپلے کرادیا جائے۔

دوم: بعض جگہوں پر پی ڈی ایف لائبیری ایسکی کوڈ کو ہی مس کررہی تھی۔ اسکی وجہ سمجھ میں نہیں آئی۔ کہ اکثر جگہوں پر بالکل ٹھیک پراسسنگ ہورہی ہے لیکن بعض الفاظ کو اسکپ کرجاتی تھی۔ ہوسکتا ہے کہ یہ اس لابئریری کا کوئی بگ ہو کہ اوپن سورس میں مسائل تو ہو ہی سکتے ہیں۔ دوسرا یہ بھی ہوسکتا ہے کہ میں ہی کہیں غلطی کررہا ہوں۔ بہرحال ایسے الفاظ جن کے ایسکی کوڈ لائبیری مس کررہی تھی ان کی جگہ بھی مجھے خالی جگہ دکھانی پڑی۔ یہ تو مکمل طور پر تکنیکی مسئلہ ہے جس پر غور کرکے اسکا کوئی نہ کوئی حل سامنے آجائے گا یا وجہ پتہ لگ جائے گی کہ لائبریری بعض ترسیمے کیوں مس کررہی تھی۔ میرے زہن میں ایک یہ خیال بھی آیا تھا کہ کسی اچھی پی ڈی ایف لائبریری کا جو قیمتا دستیاب ہو اس کا ٹرائل ورژن حاصل کرکے اس کے ساتھ یہ تجربہ کیا جائے۔

سوم: یہ مسئلہ سامنے آیا کہ پی ڈی ایف میں اسپیس کا کیرکٹر نہیں ہوتا۔ بلکہ اسپیس کی جگہ پی ڈی ایف کا اسٹینڈرڈ ایک فاصلے کا تعین کرکے اگلے حرف کو اتنے فاصلے سے شروع کرتا تھا۔ یہ بھی ایک مسئلہ تھا۔ لیکن اسکو بھی تھوڑی سی ریسرچ کے بعد حل کیا جاسکتا ہے۔ کیونکہ یہی مسئلہ انگلش حروف کے ساتھ بھی آتا ہے تو اسکے لئے مختلف فورمز پر کچھ حل بتائے گئے تھے کہ پی ڈی ایف میں جو فاصلہ ہوتا ہے وہ بھی لائبریری کی مدد سے مل جاتا ہے تو اسکو کیلکولیٹ کرکے ایک اسپیس کی مقدار کا تعین کیا جاسکتا ہے۔ میں نے عارضی طور پر اسی طرح کا ایک تجربہ کرکے کچھ حد تک اس مسئلے پر قابو پالیا تھا۔ لیکن مکمل طور پر اس مسئلے کو حل کرنا ابھی باقی تھا۔ لیکن ایک تاثر میرے زہن مین تھا کہ یہ مسئلہ تھوڑی سی توجہ سے حل ہوسکتا ہے۔

میں نے جو اس پر مزید کام روک دیا تھا وہ پہلے مسئلے کے ممکنہ حل کی وجہ سے تھا۔ کہ تین چارہ ماہ مسلسل کچھ گھنٹے روزانہ خرچ کرنے کے بعد اس مسئلے کے حل کی امید ہوتی۔ لہذا پھر اس وقت تو ہمت ہی نہیں ہوئی۔ یہ سب یہاں شئیر کرنے کا مقصد یہ تھا کہ بعض اوقات ایک کی کوشش ناکام ہوجاتی ہے لیکن اسی ناکام کوشش سے کسی اور کو کامیابی کا کوئی اور راستہ نظر آنا شروع ہوجاتا ہے۔

ایک دلچسپ بات کہ اسی پی ڈی ایف والے کام کے چکر میں سرچنگ کرتے ہوئے ایک پیپر نظر سے گزرا تھا جس میں ان پیج کی اینکوڈنگ پر کسی نے ایک مقالہ لکھا تھا۔ شائد کوئی انڈیا کی یونیورسٹی کا مقالہ تھا۔ اس پیپر کو دلچسپی سے پڑھا اور آگے بڑھ گیا۔ دو چار دن بعد ہی شاکر بھائی کا ایک دھاگہ نظر سے گزرا جس میں انہوں نے یونی کوڈ سے ان پیج کنورٹر کی عدم دستیابی کا تذکرہ کیا تھا۔ شاکر بھائی کا دھاگہ دیکھ کر زہن اس پیپر کی طرف گیا اور خیال آیا کہ یہ تو دو تین گھنٹے میں بن سکتا ہے۔ اگر واقعی یونی کوڈ سے ان پیج کنورٹر موجود نہیں تو چلو دو تین گھنٹے اس کام پر خرچ کرتے ہیں کچھ نہ کچھ ہمارا حصہ بھی ہوجائے گا اردو ایپلیکیشن پروگرامنگ میں۔ اندازہ درست نکلا اور کوئی تین گھنٹے میں کنورٹر بن گیا لیکن اس کے مسائل دور کرتے ہوئے ایک ہفتہ لگ گیا۔ پھر جب دوبارہ شاکر بھائی کا دھاگہ دیکھا تو پتہ لگا کہ ابرار بھائی کے کنورٹر میں اسکی سہولت پہلے سے موجود ہے جس کی طرف شاکر بھائی کا دھیان نہیں گیا تھا۔ بہرحال ہمیں اس سے کنورٹر بنانے کا ایک تجربہ ہی ہوا ۔ ہم نے کیونکہ یہ کام بھی ایکسل فائل میں ان پیج کی اینکوڈنگ کا ڈیٹا بیس بنا کر کیا تھا اس لئے تھوڑا سا وقت لگا کہ وائس ورسا کنورٹر بھی بنا ڈالا اور سرد خانے میں ڈال دیا۔
 
آخری تدوین:

arifkarim

معطل
ان پیج کے جمیل نستعلیق فونٹ کی 89 فائلز
پہلی بات تو یہ ہے کہ یہ جمیل نستعلیق کی نہیں بلکہ انپیج کے نوری نستعلیق فانٹس کی فائلز ہیں۔ یہ وہی ”آفت زدہ“ فائلز ہیں جنہیں ہمنے علوی نستعلیق اور پھر جمیل نوری نستعلیق میں رو رو کر سنہ 2008 میں پہنچایا تھا۔ اور انکی وجہ سے آج بھی ان دونوں فانٹس میں ترسیموں کے متعدد مسائل موجود ہیں۔ :)

یہ کام کرتے ہوئے کئی فائلز میں خالی کشتیوں اور آزاد نقطوں سے واسطہ پڑا ۔ ان کو دیکھ کر تو سر چکرا گیا اور دماغ میں گھنٹی بجی کہ ان پیج کی یہ گھٹیا حرکت ضرور ہماری راہ میں روڑے اٹکائے گی۔
ہاہاہا! آپکے دماغ میں تو محض ایک گھنٹی ہی بجی تھی۔ ہمارے سامنے تو یہ خالی کشتیاں اور نقطے کسی گھنٹا گھر سے کم نہیں تھے۔ انہی کی وجہ سے علوی نستعلیق میں ترسیموں کی کُل تعداد 16000 سے تجاوز نہیں کر پا رہی تھی۔
بہرحال انپیج کے ایسا کرنے کی اصل وجہ حال ہی میں نعیم سعید کے توسط سے یہ معلوم ہوئی کہ ان ترسیموں کے اصل خالق مرزا احمد جمیل صاحب مرحوم نے انہیں اتنی ہی تعداد میں لکھا تھا۔ یوں انپیج کے پہلے ورژن میں جو غالباً 90 کی دہائی میں آیا صرف یہی ترسیمے موجود تھے۔ بعد ازاں انہوں نے اپنے پروگرام کی بڑھتی ہوئی مقبولیت اور صارفین کی ڈیمانڈ کو دیکھتے ہوئے اسمیں مزید ترسیموں کا اضافہ کر دیا۔ اور پھر انہیں دیسی ’’چوری‘‘’’چکاری‘‘ سے بچانے کیلئے نقطوں اور کشتیوں میں تقسیم کر دیا۔ یہی وجہ ہے کہ ہمیں یہ نئے ترسیمے ’’ڈھونڈنے‘‘ میں کئی ماہ کا عرصہ لگ گیا اور یوں جمیل نوری نستعلیق ، علوی نستعلیق کے مقابلہ میں خاصی تاخیر کا شکار بھی ہوا۔ البتہ اس دماغ کی دہی والے عمل سے گزرنے کے بعد ہم بالآخر انپیج 3 کے تمام ترسیموں کو حاصل کرنے میں بفضل تعالیٰ کامیاب ہو گئے۔ :)

ایسے ترسیموں کو بھی ایکسل میں فونٹ فائل کے نام اور ایسکی کوڈ کے ساتھ جگہ تو ضرور دی گئی لیکن ان کے سامنے یونی کوڈمیں کیا ٹائپ کرتے؟ مجبورا خالی جگہ چھوڑنا پڑی۔ اور بعد کو انہی خالی کشتیوں اور نقطوں نے رنگ میں بھنگ ڈالا۔
تو پھر آپ اس بھنگ میں مزید رنگ کیوں نہیں ڈالتے؟ جب اتنی ساری محنت پہلے ہی کر لی تھی تو تھوڑی سی اور کر لینے میں کیا حرج تھا جی؟ کم از کم آج ہمارے پاس ایک قابل استعمال پی ڈی ایف ٹو یونیکوڈ کنورٹر تو موجود ہوتا :)

لیکن اس کے مسائل دور کرتے ہوئے ایک ہفتہ لگ گیا
اور ہفتے بعد کیا نیت خراب ہو گئی تھی؟ اسکے اجراء سے بہتوں کو فائدہ ہوجاتا ایک متبادل کنورٹر کی صورت میں :)

اور سرد خانے میں ڈال دیا۔
تو پھر جلدی سے اسے باہر نکالئیے۔ محفل کی سالگرہ پر اسکا اجراء بہت مفید ثابت ہوگا :)

میں نے جو اس پر مزید کام روک دیا تھا وہ پہلے مسئلے کے ممکنہ حل کی وجہ سے تھا۔
اس مسئلہ کا حل تو نہایت ہی آسان ہے۔ ہم آپکو انپیج کے نوری نستعلیق فانٹ کی 89 ہیک شدہ فائلز فراہم کر دیتے ہیں۔ انکی مدد سے آپ اپنی ڈیٹا بیس مکمل کر لیں۔ مطلب جہاں نقطے ہوں انکی جگہ اصل مکمل ترسیمے ایڈ کر لیں۔ آپ کاکام ہو جائے گا :)
مزید تفاصیل کیلئے ذاتی پیغام کا راستہ اپنائیں۔۔۔۔ :)
 

رانا

محفلین
پہلی بات تو یہ ہے کہ یہ جمیل نستعلیق کی نہیں بلکہ انپیج کے نوری نستعلیق فانٹس کی فائلز ہیں۔ یہ وہی ”آفت زدہ“ فائلز ہیں جنہیں ہمنے علوی نستعلیق اور پھر جمیل نوری نستعلیق میں رو رو کر سنہ 2008 میں پہنچایا تھا۔ اور انکی وجہ سے آج بھی ان دونوں فانٹس میں ترسیموں کے متعدد مسائل موجود ہیں۔ :)
چلیں نوری ہی سہی۔ ہمیں تو فائلوں سے غرض تھی۔ اور ہمیں تو یہ بھی پتہ نہیں تھا کہ یہ نستعلیق کی فائلز ہیں۔ وہ تو جب پی ڈی ایف لائبیری نے فونٹ فائل کے نام دکھائے جو استعمال ہورہے تھے تو پتہ لگا یہ نستعلیق فانٹ کی فائلیں ہیں۔:)

ہاہاہا! آپکے دماغ میں تو محض ایک گھنٹی ہی بجی تھی۔ ہمارے سامنے تو یہ خالی کشتیاں اور نقطے کسی گھنٹا گھر سے کم نہیں تھے۔ انہی کی وجہ سے علوی نستعلیق میں ترسیموں کی کُل تعداد 16000 سے تجاوز نہیں کر پا رہی تھی۔
بہرحال انپیج کے ایسا کرنے کی اصل وجہ حال ہی میں نعیم سعید کے توسط سے یہ معلوم ہوئی کہ ان ترسیموں کے اصل خالق مرزا احمد جمیل صاحب مرحوم نے انہیں اتنی ہی تعداد میں لکھا تھا۔ یوں انپیج کے پہلے ورژن میں جو غالباً 90 کی دہائی میں آیا صرف یہی ترسیمے موجود تھے۔ بعد ازاں انہوں نے اپنے پروگرام کی بڑھتی ہوئی مقبولیت اور صارفین کی ڈیمانڈ کو دیکھتے ہوئے اسمیں مزید ترسیموں کا اضافہ کر دیا۔ اور پھر انہیں دیسی ’’چوری‘‘’’چکاری‘‘ سے بچانے کیلئے نقطوں اور کشتیوں میں تقسیم کر دیا۔ یہی وجہ ہے کہ ہمیں یہ نئے ترسیمے ’’ڈھونڈنے‘‘ میں کئی ماہ کا عرصہ لگ گیا اور یوں جمیل نوری نستعلیق ، علوی نستعلیق کے مقابلہ میں خاصی تاخیر کا شکار بھی ہوا۔ البتہ اس دماغ کی دہی والے عمل سے گزرنے کے بعد ہم بالآخر انپیج 3 کے تمام ترسیموں کو حاصل کرنے میں بفضل تعالیٰ کامیاب ہو گئے۔ :)
یعنی ان پیج نے چوری چکاری سے بچنے کے لئے ایک آسان راستہ چھوڑ کر اپنے لئے خود ہی ایک دقت طلب طریقہ اختیار کیا۔ البتہ اس نے یہ حرکت کرکے ڈیلویلپرز کو ضرور مشکل میں ڈال دیا ہے۔ شائد اسے ڈیویلپرز ہی کی طرف سے چوری کا خطرہ تھا نا کہ اینڈ یوزر سے۔:)


تو پھر آپ اس بھنگ میں مزید رنگ کیوں نہیں ڈالتے؟ جب اتنی ساری محنت پہلے ہی کر لی تھی تو تھوڑی سی اور کر لینے میں کیا حرج تھا جی؟ کم از کم آج ہمارے پاس ایک قابل استعمال پی ڈی ایف ٹو یونیکوڈ کنورٹر تو موجود ہوتا :)
جسے آپ اتنی ساری کہہ رہے ہیں وہ اصل میں تھوڑی سی تھی۔ اور جو آپ کی نظرمیں تھوڑی سی ہے وہ بہت زیادہ ہے۔ میری نظر سے دیکھیں نا یار۔:) ڈیڑھ گھنٹہ روز تین چار ہفتے تک خرچ کرنا آسان ہے نہ کہ کئی گھنٹے روز کئی ماہ تک۔ اور دوسرے یہ اگلا کام پروگرامنگ سے متعلقہ تھا بھی نہیں۔ ایسے کاموں سے ویسے ہی جان جاتی ہے۔ جبکہ پروگرامنگ کا کام زیادہ بھی ہو تو محسوس نہیں ہوتا۔:)

اور ہفتے بعد کیا نیت خراب ہو گئی تھی؟ اسکے اجراء سے بہتوں کو فائدہ ہوجاتا ایک متبادل کنورٹر کی صورت میں :)
تو پھر جلدی سے اسے باہر نکالئیے۔ محفل کی سالگرہ پر اسکا اجراء بہت مفید ثابت ہوگا :)
ہاہاہا۔ بتایا تو ہے کہ ابرار بھائی کے کنورٹر میں اس سے زیادہ بہتر چیز کی موجودگی کی اطلاع مل گئی تھی تو پھر اپنی اس کمتر چیز کو کون سامنے لانے کی ہمت کرتا۔ بہرحال آج افطاری کے بعد یا کل تک اسے شئیر کردوں گا۔:)

اس مسئلہ کا حل تو نہایت ہی آسان ہے۔ ہم آپکو انپیج کے نوری نستعلیق فانٹ کی 89 ہیک شدہ فائلز فراہم کر دیتے ہیں۔ انکی مدد سے آپ اپنی ڈیٹا بیس مکمل کر لیں۔ مطلب جہاں نقطے ہوں انکی جگہ اصل مکمل ترسیمے ایڈ کر لیں۔ آپ کاکام ہو جائے گا :)
مزید تفاصیل کیلئے ذاتی پیغام کا راستہ اپنائیں۔۔۔۔ :)
یہ تو زبردست کام ہوجائے گا۔ آج ہی آپ سے رابطہ کرتے ہیں۔:)
 
آخری تدوین:

رانا

محفلین
اس یونکوڈ کنورٹر کو فراہم تو کرو، شاید اب تک کے کنورٹرس سے بہتر ثابت ہو۔
الف عین
اعجاز صاحب اس لنک سے ڈاون لوڈ کرلیں۔
ان زپ کرکے سیٹ اپ والی فائل رن کردیں۔ انسٹال ہوکر ڈیسکٹاپ پر UCC یعنی "یونی کوڈ کنورٹر" کے نام سے شارٹ کٹ بن جائے گا۔
طریقہ کار یہ ہوگا کہ
1۔ پہلے ان پیج سے متن کاپی کرلیں
2۔ پھر اس کنورٹر سے Inpage to Unicode کا بٹن دبادیں
3۔ پھر ورڈ میں پیسٹ کردیں۔

اس کے لئے ڈاٹ نیٹ فریم 3.5SP1 درکار ہوگا۔ جو ونڈوز سیون میں تو پہلے سے ہی موجود ہوتا ہے۔ دوسری کسی ونڈوز کے لئے ڈاون لوڈ کرنا پڑے گا۔
دوسری بات یہ کہ میرے پاس کیونکہ ونڈوز سیون 32 بٹ ہے اس لئے اس پر تو ٹیسٹڈ ہے۔ لیکن اگر آپ کے ونڈوز 64 بٹ ہوئی تو دوسرے اسٹیپ میں بٹن دبانے پر ایرر آسکتا ہے۔ ایسی صورت میں آپ مجھے بس ایرر کا ٹیکسٹ یہاں شئیر کردیجئے گا۔ انشاءاللہ میں متبادل حل بتا دوں گا۔

تدوین: یہ ایک اور سیٹ اپ کا لنک ہے۔ یہ انشاء اللہ 32 بٹ اور 64 بٹ ونڈوز دونوں پر چلے گا۔
 
آخری تدوین:

رانا

محفلین
میرے خیال میں درج بالا لنک پبلک لنک نہیں ہے۔
پبلک ہی ہے۔ آپ شائد اس ونڈو کی وجہ سے کہہ رہے ہیں جو ڈاون لوڈ پر کلک کرنے سے سامنے آتی ہے اور سائن ان کرنے کو کہتی ہے۔ اس پر ایک کراس کا بٹن بھی ہوتا ہے اس کو دبا کر اسے ختم کر دیں اور دوبارہ ڈاون لوڈ کے بٹن پر کلک کردیں۔ اگر مسئلہ حل نہ ہو تو پھر بتائیے گا کہیں اور اپ لوڈ کی کوشش کروں گا۔
 

رانا

محفلین
ہو سکتا ہے ایسا ہی ہو، میں نے اسے اپنے dropbox محفوظ کیا تھا۔ یہاں سے ڈاؤنلوڈ کریں۔
واقعی آپ کے لنک پر کلک کرنے سے براہ راست ڈاون لوڈنگ شروع ہوگئی۔ اسطرح پبلک کرنے کا کیا طریقہ ہے؟ میں نے تو کل پہلی بار اسی کام کے لئے ڈراپ باکس پر اکاونٹ بنایا تھا۔ فائل اپ لوڈ کرکے اسکے سامنے شئیر کے بٹن پر کلک کیا اور جو لنک سامنے آیا وہ یہاں شئیر کردیا۔
 

arifkarim

معطل
واقعی آپ کے لنک پر کلک کرنے سے براہ راست ڈاون لوڈنگ شروع ہوگئی۔ اسطرح پبلک کرنے کا کیا طریقہ ہے؟ میں نے تو کل پہلی بار اسی کام کے لئے ڈراپ باکس پر اکاونٹ بنایا تھا۔ فائل اپ لوڈ کرکے اسکے سامنے شئیر کے بٹن پر کلک کیا اور جو لنک سامنے آیا وہ یہاں شئیر کردیا۔
ڈراپ باکس کے نئے یوزرز کو ہاٹ لنکنگ کی سہولت میسر نہیں۔ البتہ ہم جیسے قدیم یوزرز کو ہے :)
 

رانا

محفلین
arifkarim کی مہیا کردہ فائلز کی مدد ے کافی حد تک ڈیٹابیس مکمل کرنے کے بعد کچھ ٹیسٹ کئے تو متن میں کافی بہتری تو آئی لیکن ساتھ ہی کچھ نئے گھمبیر قسم کے مسائل بھی سامنے آئے۔ایک مسئلہ تو یہ آیا ان پیج میں نوری کیریکٹرز جو تین فائلز ہیں ان سے جو الفاظ بنتے ہیں وہ متن سے غائب ہوجاتے ہیں کیونکہ انکے ترسیمے ڈیٹا بیس میں موجود نہیں۔ دوسرا صرف نستعلیق کا متن اخذ ہوتا ہے۔ اور یہ ایک مسئلہ ہے کہ نستعلیق کے علاوہ دوسرے فونٹ کے الفاظ کی جگہ خالی آتی ہے مثلا ہیڈنگز وغیرہ۔ تیسرے ابھی انگلش الفاظ کو بھی اگنور کیا ہے۔ پھر یہ مسئلہ بھی ہے کہ بعض جگہوں سے الفاظ اپنی جگہ چھوڑ کر اگلے جملے کے بیچوں بیچ نمودار ہوکر اپنے جملے کا بھی اور اگلے جملے کا بھی ستیاناس کردیتے ہیں۔ یہ مسئلہ مجھے لگتا ہے کہ لائن فیڈ کیریکٹر کی وجہ سے آتا ہے۔ پھر ایک اہم مسئلہ جس پر پہلے میں نے بات کی تھی کہ پی ڈی ایف لائبیری بعض جگہ سے کریکٹرز مِس کررہی تھی۔ اس پر کیونکہ شک تھا کہ لائبیری کا بگ نہ ہو اس لئے لائبیری کا نیا ورژن ڈاون لوڈ کیا تو واقعی فرق پڑا اور تمام کیریکٹرز ڈسپلے ہونے لگے۔ لیکن ساتھ ہی دوسرا مسئلہ بھی سامنے آیا کہ کئی کیریکٹرز کی انکوڈنگ غلط ظاہر ہورہی تھی۔ اب ڈیٹا بیس کیونکہ انکوڈنگ ہی کی بنیاد پر ترسیمے اٹھاتا ہے اس لئے ایسی جگہوں پر غلط ترسیمہ اٹھ کر آجاتا ہے۔ اس مسئلے کو تو تھوڑی سی ڈیٹا ٹریننگ کرواکر کچھ حد تک حل کردیا ہے۔ لیکن ابھی بھی یہ مسئلہ بہت واضح ہے اور اس کا حل ڈیٹا ٹریننگ ہی ہے تاوقتیکہ لائبریری کے نئے ورژن میں یہ مسئلہ حل ہوجائے کہ بظاہر تو یہ لابئریری کا مسئلہ لگتا ہے واللہ اعلم۔

ابھی تک کے جو رزلٹس ہیں وہ میں یہاں شئیر کردیتا ہوں کیونکہ مجھے لگتا ہے کہ ان میں سے کئی مسائل شائد حل نہ ہوسکیں۔ تجربہ کے طور پر تین صفحات لئے تھے۔ جن میں سے دو تو مولانا ابوالکلام آزاد کی "ام الکتاب" سے لئے تھے۔ تینوں صفحات کی پی ڈی ایف اور ان سے اخذ کردہ متن اپنے تمام تر مسائل کے ساتھ ورڈ فائلز میں ڈال کر ایک زپ فائل بنادی ہے۔ جسے یہاں سے ڈاون لوڈ کرکے اصل پی ڈی ایف اور اخذ کردہ متن کا موازنہ کیا جاسکتا ہے۔

میں سوچ رہا تھا کہ ابھی جس حالت میں بھی ہے اسے ریلیز کردوں لیکن پھر سوچا کہ ناقص اور ادھوری چیز تو ریلیز نہیں کی جاتی اور دوسری طرف ان مسائل کا بھی فوری طور پر تو کوئی حل سمجھ میں نہیں آتا۔ اس لئے یہاں رزلٹس شئیر کردئیے ہیں کہ اگر ان رزلٹس کی بنیاد پر کوئی سمجھے کہ اس طرح کا متن کسی حد تک اسے ٹائپنگ سے بچا سکتا ہے تو پھر سیٹ اپ بناکر ریلیز کردیا جائے۔
 

arifkarim

معطل
ایک مسئلہ تو یہ آیا ان پیج میں نوری کیریکٹرز جو تین فائلز ہیں ان سے جو الفاظ بنتے ہیں وہ متن سے غائب ہوجاتے ہیں کیونکہ انکے ترسیمے ڈیٹا بیس میں موجود نہیں۔
ان تین فائلوں میں خالی کشتیاں ہیں نہ کہ انکے نقطے۔ آپ چاہیں توپروگرام میں یہ رول ڈال دیں کہ یہ خالی کشتی کو اگنور کر دے اور اسکے ساتھ جو نقطے والی کشتی ہے، اسکو پڑھ کر اسکے مطابق ترسیمہ جنریٹ کر دے۔
لیکن ابھی بھی یہ مسئلہ بہت واضح ہے اور اس کا حل ڈیٹا ٹریننگ ہی ہے تاوقتیکہ لائبریری کے نئے ورژن میں یہ مسئلہ حل ہوجائے کہ بظاہر تو یہ لابئریری کا مسئلہ لگتا ہے واللہ اعلم۔
اچھے نتائج ہیں۔ بہترین نتائج کیلئے ابرارحسین سے رابطہ کر لیں۔ انکے پاس کافی اعلیٰ قسم کی خریدی ہوئی پی ڈی ایف لائبریری موجود ہے :)
 

رانا

محفلین
ان تین فائلوں میں خالی کشتیاں ہیں نہ کہ انکے نقطے۔ آپ چاہیں توپروگرام میں یہ رول ڈال دیں کہ یہ خالی کشتی کو اگنور کر دے اور اسکے ساتھ جو نقطے والی کشتی ہے، اسکو پڑھ کر اسکے مطابق ترسیمہ جنریٹ کر دے۔
یہ رول تو مجھے ویسے بھی کئی جگہ مینولی ڈالنا پڑا کیونکہ خالی کشتی اور نقطوں کا پئیر جہاں بھی آیا وہاں یہ مسئلہ بھی آیا۔اور اسے اسی طرح حل کیا کہ اگر تو نقطوں کی جگہ ڈیٹابیس میں خالی تھی تو مسئلہ خود بخود حل ہوگیا لیکن جہاں دونوں جگہ کوئی نہ کوئی ترسیمہ تھا مثلا ایک جگہ "کڑ" اور دوسری جگہ "کر" تو وہاں کنڈیشنز اپلائی کرنی پڑیں کہ بعد والے کو اگنور کردے۔
میں جن تین فائلوں کی بات کررہا ہوں ان میں ترسیموں کے جوڑ ہیں جن کی وجہ سے مسئلہ آرہا ہے۔ مثلا ایک لفظ جو لکھنا ہے اس کا ترسیمہ ان پیج میں موجودنہیں تو پھر ان پیج اسے ان فائلز میں موجود جوڑوں کی مدد سے وہ لفظ بنائے گا۔ اور اس طرح ایک لفظ بنانے میں کئی جوڑ استعمال ہوتے ہیں۔ اس مسئلے کا یہی حل تھا کہ اسے اگنور کردیا جائے کہ یوز کر تھوڑی بہت پروف ریڈنگ خود بھی کرنی چاہئے متن اخذ کرکے۔:)

اچھے نتائج ہیں۔ بہترین نتائج کیلئے ابرارحسین سے رابطہ کر لیں۔ انکے پاس کافی اعلیٰ قسم کی خریدی ہوئی پی ڈی ایف لائبریری موجود ہے :)
کیا واقعی آپ کو کنفرم ہے کہ ان کے پاس خریدی ہوئی پی ڈی ایف لائبریری ہے؟ اگر ایسا ہے تو ابرارحسین بھائ اس کی کچھ تفصیل بتائیں۔:) ویسے ابرار بھائی نے اوپن سورس لائبریری چھوڑ کر خریدنے کا تکلف کیوں کیا ہوگا۔:)
 

arifkarim

معطل
میں جن تین فائلوں کی بات کررہا ہوں ان میں ترسیموں کے جوڑ ہیں جن کی وجہ سے مسئلہ آرہا ہے۔ مثلا ایک لفظ جو لکھنا ہے اس کا ترسیمہ ان پیج میں موجودنہیں تو پھر ان پیج اسے ان فائلز میں موجود جوڑوں کی مدد سے وہ لفظ بنائے گا۔ اور اس طرح ایک لفظ بنانے میں کئی جوڑ استعمال ہوتے ہیں۔ اس مسئلے کا یہی حل تھا کہ اسے اگنور کردیا جائے کہ یوز کر تھوڑی بہت پروف ریڈنگ خود بھی کرنی چاہئے متن اخذ کرکے۔:)
اوہ اچھا۔ یعنی آپنے انپیج کے نوری کیریکٹر فانٹ کو اگنور کر دیا ہے۔ مطلب وہ الفاظ جنکے ترسیمے موجود نہیں انکو یہ اخذ نہیں کر پائے گا۔ اسکا حل تو موجود ہونا چاہئے پر اسکے لئے ہمیں پورا کا پورا فانٹ ڈیکوڈ کرنا پڑے گا :)

کیا واقعی آپ کو کنفرم ہے کہ ان کے پاس خریدی ہوئی پی ڈی ایف لائبریری ہے؟ اگر ایسا ہے تو ابرارحسین بھائ اس کی کچھ تفصیل بتائیں۔:) ویسے ابرار بھائی نے اوپن سورس لائبریری چھوڑ کر خریدنے کا تکلف کیوں کیا ہوگا۔:)
جی بالکل۔ انہیں زپ کر کے معلومات حاصل کر لیں :)
 

رانا

محفلین
ابھی مجھے خیال آیا کہ اس دھاگے میں سافٹوئیر کی ریلیز کی خبر دے دینی چاہئے کہیں کوئی بھولا بھٹکا مہمان گوگل سے اس دھاگے میں پہنچے تو یہ نہ سمجھے کہ شائد ابھی تک سافٹوئیر مکمل نہیں ہوا۔
اللہ کے فضل سے سافٹوئیر ریلیز ہوچکا ہے درج زیل لنک پر تفصیل موجود ہے:
Naseem Inpage PDF Text Extraction Software
 

arifkarim

معطل
ڈراپ باکس کے نئے یوزرز کو ہاٹ لنکنگ کی سہولت میسر نہیں۔ البتہ ہم جیسے قدیم یوزرز کو ہے :)
عباس اعوان آپکی اطلاعات غلط ہیں۔ ڈراپ باکس 2012 سے نئے یوزر اکاؤنٹس کو ہاٹ لنکنگ کی اجازت نہیں دیتا:
http://www.slashgear.com/dropbox-confirms-public-folder-phase-out-15234163/
منفی ریٹنگ ہٹائیے۔
 

عباس اعوان

محفلین
عباس اعوان آپکی اطلاعات غلط ہیں۔ ڈراپ باکس 2012 سے نئے یوزر اکاؤنٹس کو ہاٹ لنکنگ کی اجازت نہیں دیتا:
http://www.slashgear.com/dropbox-confirms-public-folder-phase-out-15234163/
منفی ریٹنگ ہٹائیے۔
ہاٹ لنکنگ سے کیا مراد ہے ؟
کسی بھی فائل کا ڈائریکٹ لنک تو میرے خیال میں حاصل کیا جا سکتا ہے، اس سال کے شروع تک تو یہ طریقہ کام کر رہا تھا
:)
 

arifkarim

معطل
ہاٹ لنکنگ سے کیا مراد ہے ؟
کسی بھی فائل کا ڈائریکٹ لنک تو میرے خیال میں حاصل کیا جا سکتا ہے، اس سال کے شروع تک تو یہ طریقہ کام کر رہا تھا
:)
آپ نے اگر ڈراپ باکس کا اکاؤنٹ 2012 سے پہلے بنایا تھا تو یہ کام کرے گا۔ البتہ اسکے بعد رجسٹر ہونے والوں کیلئے نہیں :)
 

عباس اعوان

محفلین
آپ نے اگر ڈراپ باکس کا اکاؤنٹ 2012 سے پہلے بنایا تھا تو یہ کام کرے گا۔ البتہ اسکے بعد رجسٹر ہونے والوں کیلئے نہیں :)
غیر متفق
:)
عام یوزر کے لیے شاید یہ ممکن نا ہو۔
ایک نیا ڈراپ باکس اکاؤنٹ بنا کر دیں مجھے، ابھی ٹیسٹ کر لیتے ہیں
؛)
 
Top