ڈیجیٹل اردو لائبریری پراجیکٹ۔ شعبہ سکین

کیفیت
مزید جوابات کے لیے دستیاب نہیں

فرحت کیانی

لائبریرین
کتب برقیانے میں پہلا بنیادی مرحلہ اصل تحریری مواد کو سکین متن میں تبدیل کرنا ہے۔ شعبہ سکین کا مقصد لائبریری پراجیکٹ کے لئے سکین متن کی فراہمی ہے۔ جو دو طرح سے ممکن ہے۔
  • سکینر کی مدد سے
اصل تحریری کتابی متن کو سکینر کی مدد سے برقیانے کے لئے فراہم کرنا
  • ویب سے
آن لائن موجود کتب کے ذخیرے سے برقیانے کے لیے مواد کا انتخاب و حصول۔ جیسے جریدہ دیدہ ور کی آن لائن لائبریری سے۔

سکین ٹیم ، لائبریری ٹیم کی ایک ذیلی شاخ ہے جو اس شعبے میں خدمات سرانجام دیتی ہے۔اس ٹیم میں درج ذیل اراکین شامل ہیں۔

لائبریری : اسکیننگ ٹیم

ٹیم اراکین


نبیل

سخنور

اسد

شگفتہ

سلیمان جاذب

دوست

شاہ110

سکیننگ کے چیدہ اصول، جو دیگر اراکین کو دورانِ سکین درپیش مسائل کے حل مدد دے سکیں، تحریر کرنے کے لئے نبیل، سخنور اور اسد کو دعوت دی جاتی ہے۔
 

نبیل

تکنیکی معاون
شکریہ فرحت۔ اگر کسی اور جگہ بھی میری رائے درکار ہے تو اس کی بھی نشاندہی کر دیں۔

میں اور اسد رزاقی کچھ عرصہ قبل ویب سے اردو مسودوں کے حصول کے بارے میں تحقیق کرتے رہے ہیں۔ جریدہ دیدہ ور کی لائبریری کے بارے میں پہلے بھی عرض کر چکا ہوں کہ وہاں سے متن حاصل کرنے کا واحد طریقہ ان کتب کو پی ڈی ایف پرنٹر ڈرائیور کے ذریعے فائل میں پرنٹ کرنا ہے۔ اس کے لیے صفحے کا سائز احتیاط سے منتخب کیا جانا چاہیے تاکہ متن صفحے کی اطراف سے کٹ نہ جائے۔ میرے پاس چونکہ ایڈوبی ایکروبیٹ پروفیشنل انسٹال ہوا ہوا ہے، اس لیے میرے سسٹم میں ایڈوبی کا پرنٹر ڈرائیور بھی دستیاب ہے۔ دوسرے دوست پی ڈی ایف فیکٹری یا پی ڈی ایف کریٹر کا بھی استعمال کرتے آئے ہیں جن میں بھی پی ڈی ایف پرنٹر ڈرائیور شامل ہے۔

کتابوں کو فائل میں بطور پی ڈی ایف پرنٹ کرنا قدرے دقت طلب کام ہے۔ اسد نے کچھ سائٹس کے روابط ڈھونڈ نکالے تھے جن میں جریدہ دیدہ ور والی تمام کتابیں پہلے سے موجود ہیں۔ یہ انڈیا کی سائٹس ہیں۔ اس کے علاوہ فرخ منظور نے بھی archive.org کا ذکر کیا تھا جہاں پر بہت سے نایاب نسخے دستیاب ہیں۔ انڈیا کی سائٹس پر کتابوں کے صفحات tiff فارمیٹ میں دستیاب ہیں جو کہ خاصی بھاری بھرکم ہوتی ہیں۔ علاوہ ازیں ہر فائل کو الگ سے ڈاؤنلوڈ کرنے میں کافی وقت لگ جاتا ہے جس کی وجہ سے سینکڑوں صفحات پر مبنی کتب کو ڈاؤنلوڈ‌ کرنا مشکل ہو جاتا ہے۔ اس کا میں نے یہ حل نکالا ہے کہ میں نے ایک پروگرام لکھا ہے جس کے ذریعے کسی بھی کتاب کے تمام صفحات کی tiff فائلوں کے روابط ایک فائل میں جنریٹ ہو جاتے ہیں۔ اس فائل کو winwget پروگرام میں استعمال کیا جا سکتا ہے۔ winwget اس فائل میں سے ایک ایک ربط لے کر تمام فائلیں ڈاؤنلوڈ‌ کر لیتا ہے۔ میں نے اس طریقے سے طلسم ہوشربا کی 1373 صفحات پر مبنی جلد ایک ڈاؤنلوڈ کی ہے۔ اس کے ڈاؤنلوڈ ہونے میں تقریباً ایک پورا دن لگ گیا تھا۔ اس لیے میرے خیال میں اس طرح متن کے حصول کا کام انہی کو کرنا چاہیے جن کے پاس غیر محدود ڈاؤنلوڈ والا انٹرنیٹ کنکشن موجود ہو۔

انڈیا کی ان سائٹس کے نام اور کتابوں کے روابط جنریٹ کرنے والے ٹول کے بارے میں میں الگ سے پوسٹ کر دوں گا۔

جیسا کہ میں عرض کر چکا ہوں، tiff فائلیں قدرے بھاری بھرکم ہوتی ہیں۔ اسد رزاقی اس بارے میں ایک ٹیوٹوریل پوسٹ کر چکے ہیں کہ کس طرح ان tiff فائلوں کو کمپریس کیا جا سکتا ہے اور ان کی پی ڈی ایف فائل بنائی جا سکتی ہے۔

ویب سے سکین شدہ متن کے حصول کے بعد اسے scan.urdulibrary.org پر اپلوڈ کیا جا سکتا ہے یا کسی اور جگہ اپلوڈ کرکے بھی اس کا ربط فراہم کیا جا سکتا ہے۔ جہاں تک طلسم ہوشربا کا تعلق ہے تو کچھ دن پہلے باذوق نے ای سنپس کا ایک ربط فراہم کیا تھا جہاں پر طلسم ہوشربا کے علاوہ الف لیلہ اور قصہ باغ و بہار کے متون بھی دستیاب ہیں۔ اس سے کام کچھ آسان ہو گیا ہے۔ قصہ باغ و بہار پر تو غالبا پہلے ہی یہاں کام ہو چکا ہے۔

نوٹ: لائبریری پراجیکٹ کا لائحہ عمل طے کرنے کے سلسلے میں اس طرح کی اہم مشاورت والے دھاگے کچھ عرصے میں دوسرے دھاگوں کے نیچے دب جاتے ہیں، اس لیے میری تجویز ہے کہ بعد میں ان اہم نکات کو علیحدہ سے لائبریری بلاگ پر پوسٹ کر دیا جائے تاکہ انہیں تلاش کرنے میں آسانی رہے۔ لائبریری بلاگ کو بھی مؤثر طریقے سے استعمال کیا جانا چاہیے۔
 

شاہ حسین

محفلین
شکریہ فرحت۔ اگر کسی اور جگہ بھی میری رائے درکار ہے تو اس کی بھی نشاندہی کر دیں۔
شکریہ محترمحہ فرحت کیانی صاحبہ و جناب نبیل صاحب ۔

میں اور اسد رزاقی کچھ عرصہ قبل ویب سے اردو مسودوں کے حصول کے بارے میں تحقیق کرتے رہے ہیں۔ جریدہ دیدہ ور کی لائبریری کے بارے میں پہلے بھی عرض کر چکا ہوں کہ وہاں سے متن حاصل کرنے کا واحد طریقہ ان کتب کو پی ڈی ایف پرنٹر ڈرائیور کے ذریعے فائل میں پرنٹ کرنا ہے۔ اس کے لیے صفحے کا سائز احتیاط سے منتخب کیا جانا چاہیے تاکہ متن صفحے کی اطراف سے کٹ نہ جائے۔ میرے پاس چونکہ ایڈوبی ایکروبیٹ پروفیشنل انسٹال ہوا ہوا ہے، اس لیے میرے سسٹم میں ایڈوبی کا پرنٹر ڈرائیور بھی دستیاب ہے۔ دوسرے دوست پی ڈی ایف فیکٹری یا پی ڈی ایف کریٹر کا بھی استعمال کرتے آئے ہیں جن میں بھی پی ڈی ایف پرنٹر ڈرائیور شامل ہے۔

کتابوں کو فائل میں بطور پی ڈی ایف پرنٹ کرنا قدرے دقت طلب کام ہے۔
انشاء اللہ اب نہیں رہے گا :)
اسد نے کچھ سائٹس کے روابط ڈھونڈ نکالے تھے جن میں جریدہ دیدہ ور والی تمام کتابیں پہلے سے موجود ہیں۔ یہ انڈیا کی سائٹس ہیں۔

دیدہ ور پر جو کتب موجود ہیں اور اس کے ڈسپلے کے لئے انہوں نے جو اپنا ذاتی سوفٹویر استعمال کیا ہے اس کی بدولت ان کا حصول بشکل جے ۔ پی ۔ ای ۔جی فارمیٹ آسان بناتا ہے ۔

اس کے علاوہ فرخ منظور نے بھی archive.org کا ذکر کیا تھا جہاں پر بہت سے نایاب نسخے دستیاب ہیں۔ انڈیا کی سائٹس پر کتابوں کے صفحات tiff فارمیٹ میں دستیاب ہیں جو کہ خاصی بھاری بھرکم ہوتی ہیں۔ علاوہ ازیں ہر فائل کو الگ سے ڈاؤنلوڈ کرنے میں کافی وقت لگ جاتا ہے جس کی وجہ سے سینکڑوں صفحات پر مبنی کتب کو ڈاؤنلوڈ‌ کرنا مشکل ہو جاتا ہے۔ اس کا میں نے یہ حل نکالا ہے کہ میں نے ایک پروگرام لکھا ہے جس کے ذریعے کسی بھی کتاب کے تمام صفحات کی tiff فائلوں کے روابط ایک فائل میں جنریٹ ہو جاتے ہیں۔ اس فائل کو winwget پروگرام میں استعمال کیا جا سکتا ہے۔ winwget اس فائل میں سے ایک ایک ربط لے کر تمام فائلیں ڈاؤنلوڈ‌ کر لیتا ہے۔ میں نے اس طریقے سے طلسم ہوشربا کی 1373 صفحات پر مبنی جلد ایک ڈاؤنلوڈ کی ہے۔ اس کے ڈاؤنلوڈ ہونے میں تقریباً ایک پورا دن لگ گیا تھا۔ اس لیے میرے خیال میں اس طرح متن کے حصول کا کام انہی کو کرنا چاہیے جن کے پاس غیر محدود ڈاؤنلوڈ والا انٹرنیٹ کنکشن موجود ہو۔

ٹف فارمیٹ میں جو کتاب موجود ہوں بہت عمدہ ریزولیشن اور سائز حسب منشاء حاصل کیا جا سکتا ہے ۔ جو اسکین شدہ مواد کا بدل ثابت ہو سکتا ہے ۔ جس کے بعد پرنٹنگ کی ضرورت ختم ہو جاتی ہے ۔
طلسم ہوشرباء جیسی کتاب میرے پاس تقریبا ایک گھنٹے میں مکمل اسکین صفحات مع نمبر شمار ممکن ہے ۔



انڈیا کی ان سائٹس کے نام اور کتابوں کے روابط جنریٹ کرنے والے ٹول کے بارے میں میں الگ سے پوسٹ کر دوں گا۔
اس کے لئے خاص ممنون رہوں گا ۔

جیسا کہ میں عرض کر چکا ہوں، tiff فائلیں قدرے بھاری بھرکم ہوتی ہیں۔ اسد رزاقی اس بارے میں ایک ٹیوٹوریل پوسٹ کر چکے ہیں کہ کس طرح ان tiff فائلوں کو کمپریس کیا جا سکتا ہے اور ان کی پی ڈی ایف فائل بنائی جا سکتی ہے۔
میں اس کام کے لئے فوٹو شاپ کو خاص اہمیت دیتا ہوں جس کے سبب ٹف فائل کو جیپیک فورمیٹ میں با آسانی تبدیل کیا جاسکتا ہے جس میں سائز و ریزولیشن پر مکمل اختیار رہتا ہے ۔

ویب سے سکین شدہ متن کے حصول کے بعد اسے scan.urdulibrary.org پر اپلوڈ کیا جا سکتا ہے یا کسی اور جگہ اپلوڈ کرکے بھی اس کا ربط فراہم کیا جا سکتا ہے۔ جہاں تک طلسم ہوشربا کا تعلق ہے تو کچھ دن پہلے باذوق نے ای سنپس کا ایک ربط فراہم کیا تھا جہاں پر طلسم ہوشربا کے علاوہ الف لیلہ اور قصہ باغ و بہار کے متون بھی دستیاب ہیں۔ اس سے کام کچھ آسان ہو گیا ہے۔ قصہ باغ و بہار پر تو غالبا پہلے ہی یہاں کام ہو چکا ہے۔

نوٹ: لائبریری پراجیکٹ کا لائحہ عمل طے کرنے کے سلسلے میں اس طرح کی اہم مشاورت والے دھاگے کچھ عرصے میں دوسرے دھاگوں کے نیچے دب جاتے ہیں، اس لیے میری تجویز ہے کہ بعد میں ان اہم نکات کو علیحدہ سے لائبریری بلاگ پر پوسٹ کر دیا جائے تاکہ انہیں تلاش کرنے میں آسانی رہے۔ لائبریری بلاگ کو بھی مؤثر طریقے سے استعمال کیا جانا چاہیے۔

باقی اساتذہ کرام کی رہنمائی کا طالب رہوں گا ۔
شکریہ ۔


ً
 
کیفیت
مزید جوابات کے لیے دستیاب نہیں
Top