آپ کیا پڑھ رہے ہیں؟

محمداحمد

لائبریرین
میں آج کل پائتھن اور ویب اسکریپنگ کے متعلق پی ڈی ایف بکس پڑھ رہا ہوں ۔۔۔ کچھ نہ کچھ ویڈیوز بھی دیکھ لیا کرتا ہوں ۔۔۔ شاید کچھ سمجھ میں آجائے !

اُمید ہے کہ کچھ عملی کام بھی ضرور کر رہے ہوں گے۔ ویسے ویب اسکریپنگ کافی دلچسپ چیز ہے۔
 

شاہد شاہنواز

لائبریرین
اُمید ہے کہ کچھ عملی کام بھی ضرور کر رہے ہوں گے۔ ویسے ویب اسکریپنگ کافی دلچسپ چیز ہے۔
کچھ ویب سائٹس اسکریپ کرنے میں کامیابی حاصل ہوئی ہے ۔۔۔ پائتھن کے کچھ کوڈز اور ایک کروم ایکسٹنشن کی مدد سے جس ویب سائٹ سے جتنے ڈیٹا کی ضرورت ہو، حاصل کرسکتا ہوں ۔۔۔ ایک ہی وقت میں درجنوں پیجز اسکریپ ہوسکتے ہیں چاہے ہماری من چاہی معلومات 1، 2، 3، 4 کی طرح متعدد پیجز پر بکھری ہو یا پھر ویب پیج اسے ہر بار اسکرول کرنے پر تھوڑا تھوڑا کر کے لوڈ کرے، ابھی تک ان 2 طریقوں سے کام کرنے والی ویب سائٹس پر کافی حد تک غلبہ پالیا ہے۔۔۔ پھر بھی بہت کچھ سیکھنا باقی ہے۔۔۔
 

محمداحمد

لائبریرین
کچھ ویب سائٹس اسکریپ کرنے میں کامیابی حاصل ہوئی ہے ۔۔۔ پائتھن کے کچھ کوڈز اور ایک کروم ایکسٹنشن کی مدد سے جس ویب سائٹ سے جتنے ڈیٹا کی ضرورت ہو، حاصل کرسکتا ہوں ۔۔۔ ایک ہی وقت میں درجنوں پیجز اسکریپ ہوسکتے ہیں چاہے ہماری من چاہی معلومات 1، 2، 3، 4 کی طرح متعدد پیجز پر بکھری ہو یا پھر ویب پیج اسے ہر بار اسکرول کرنے پر تھوڑا تھوڑا کر کے لوڈ کرے، ابھی تک ان 2 طریقوں سے کام کرنے والی ویب سائٹس پر کافی حد تک غلبہ پالیا ہے۔۔۔ پھر بھی بہت کچھ سیکھنا باقی ہے۔۔۔
اچھی بات ہے۔

یہ ضرور دیکھ لیا کیجے کہ مذکورہ سائٹ ویب اسکریپنگ کی اجازت دیتی ہے یا نہیں۔ عموماً یہ معلومات روبوٹس ڈاٹ ٹی ایکس ٹی نامی فائل میں مل جاتی ہے۔ اس کا یو آر ایل کچھ اس قسم کا ہوتا ہے۔

websites.com/robots.txt

لیکن ضروری نہیں ہے کہ ہر ویب سائٹ یہ معلومات فراہم کرے۔

اگر آپ Scrapy استعمال کریں تو اسکریپی پرمیشن وغیرہ کی ذمہ داری خود سنبھال لیتا ہے۔ لیکن اسکریپی کا استعمال کافی پیچیدہ ہے۔
 

شاہد شاہنواز

لائبریرین
اچھی بات ہے۔

یہ ضرور دیکھ لیا کیجے کہ مذکورہ سائٹ ویب اسکریپنگ کی اجازت دیتی ہے یا نہیں۔ عموماً یہ معلومات روبوٹس ڈاٹ ٹی ایکس ٹی نامی فائل میں مل جاتی ہے۔ اس کا یو آر ایل کچھ اس قسم کا ہوتا ہے۔

websites.com/robots.txt

لیکن ضروری نہیں ہے کہ ہر ویب سائٹ یہ معلومات فراہم کرے۔

اگر آپ Scrapy استعمال کریں تو اسکریپی پرمیشن وغیرہ کی ذمہ داری خود سنبھال لیتا ہے۔ لیکن اسکریپی کا استعمال کافی پیچیدہ ہے۔
اسکریپی کے متعلق بھی ویڈیوز ڈاؤن لوڈ کر رکھی ہیں، لیکن تاحال دیکھنے کا موقع نہیں ملا۔ روبوٹس ڈاٹ ٹی ایکس ٹی پڑھنا کافی مشکل کام لگتا ہے، اس لیے صرف اتنا ہی سمجھ لیا ہے کہ
1۔ ویب سائٹ کا وہی ڈیٹا اسکریپ کروں جو ویب سائٹ پر عوام الناس کیلئے دستیاب ہے اور اسے فی الحال کہیں استعمال نہ کروں۔
2۔ ویب سائٹ کا ڈیٹا منوں ٹنوں کی بجائے صرف کلو کی حد تک اٹھاؤں، تاکہ ویب سائٹ کے صارفین کوکوئی پریشانی نہ ہو۔
۔۔۔۔ اسکریپنگ کبھی کبھی ذاتی ضرورت پڑنے پر کرتا ہوں۔۔۔ ابھی تک ڈیٹا حاصل کرکے تھوک سے بیچنے کا خیال نہیں آیا ۔۔۔ اگر آگے چل کر یہ کام کرنا ہوا تو روبوٹس ٹی ایکس ٹی پڑھنا ناگزیر ہوجائے گا۔
 

محمداحمد

لائبریرین
اسکریپی کے متعلق بھی ویڈیوز ڈاؤن لوڈ کر رکھی ہیں، لیکن تاحال دیکھنے کا موقع نہیں ملا۔ روبوٹس ڈاٹ ٹی ایکس ٹی پڑھنا کافی مشکل کام لگتا ہے، اس لیے صرف اتنا ہی سمجھ لیا ہے کہ
1۔ ویب سائٹ کا وہی ڈیٹا اسکریپ کروں جو ویب سائٹ پر عوام الناس کیلئے دستیاب ہے اور اسے فی الحال کہیں استعمال نہ کروں۔
2۔ ویب سائٹ کا ڈیٹا منوں ٹنوں کی بجائے صرف کلو کی حد تک اٹھاؤں، تاکہ ویب سائٹ کے صارفین کوکوئی پریشانی نہ ہو۔
۔۔۔۔ اسکریپنگ کبھی کبھی ذاتی ضرورت پڑنے پر کرتا ہوں۔۔۔ ابھی تک ڈیٹا حاصل کرکے تھوک سے بیچنے کا خیال نہیں آیا ۔۔۔ اگر آگے چل کر یہ کام کرنا ہوا تو روبوٹس ٹی ایکس ٹی پڑھنا ناگزیر ہوجائے گا۔

اچھی بات ہے۔ :)
 

جاسمن

لائبریرین
بلونت سنگھ کے ناول "چک پیراں کا جسّا" کی بہت تعریف پڑھی تو کل سے زیرِ مطالعہ ہے۔
IMG-20231103-184655.jpg
 
آخری تدوین:

شکیب

محفلین
کچھ ویب سائٹس اسکریپ کرنے میں کامیابی حاصل ہوئی ہے ۔۔۔ پائتھن کے کچھ کوڈز اور ایک کروم ایکسٹنشن کی مدد سے جس ویب سائٹ سے جتنے ڈیٹا کی ضرورت ہو، حاصل کرسکتا ہوں ۔۔۔ ایک ہی وقت میں درجنوں پیجز اسکریپ ہوسکتے ہیں چاہے ہماری من چاہی معلومات 1، 2، 3، 4 کی طرح متعدد پیجز پر بکھری ہو یا پھر ویب پیج اسے ہر بار اسکرول کرنے پر تھوڑا تھوڑا کر کے لوڈ کرے، ابھی تک ان 2 طریقوں سے کام کرنے والی ویب سائٹس پر کافی حد تک غلبہ پالیا ہے۔۔۔ پھر بھی بہت کچھ سیکھنا باقی ہے۔۔۔
ماشاء اللہ۔
اگر کچھ مزید کارآمد چاہتے ہیں تو ہماری مدد کی نیت سے ذرا قرآن کے روٹ ورڈز کو یہاں سے اسکریپ کر دیجیے۔

یہ ڈیٹا کہیں اور اس طرز پر موجود ہے یا نہیں تلاش نہیں کیا لیکن ہے دلچسپ
 
آخری تدوین:
Top