تقطیع کار سوفٹوئیر کی پلاننگ

سید ذیشان

محفلین
ایک بنیادی انجن تو موجود ہے، استاد آسی کے نام سے۔
ہماری ( بے حد) ناقص رائے یہ ہے کہ اعراب وغیرہ شامل کیے جائیں تو کام کافی طویل ہو جائے گا، جو طریقہ ہماری سمجھ میں آتا ہے وہ یہ ہے کہ الفاظ اور ان کے وزن کا ایک ڈیٹا بیس بنا لیا جائے۔پھر جب اس میں کوئ شعر داخل کیا جائے تو پروگرام اشباع، اخفا اور الف کے وصال وغیرہ کو مدنظر رکھتے ہوئے حساب لگائے کہ یہ کسی جانی پہچانی بحر میں ہے یا نہیں۔۔البتہ یہ ضرور ہے کہ ایسی فائل بنانے میں کافی محنت ہو گی۔
یہ بھی کیا جا سکتا ہے کہ پروگرام کو پہلے وزن نکالنا سکھایا جائے، اس طرح کہ ایک غزل دے دی جائے اور اس کا وزن بتا دیا جائے، پھر وہ پوری غزل کا وزن 'یاد' کر لے گا۔ یہ کام نسبتا آسان دکھائ دیتا ہے۔
جی بالکل درست فرمایا۔
میرا پلین یہ ہے کہ دیوان غالب سے شروع کیا جائے۔ دیوان غالب کے بحور بھی موجود ہیں۔ ان بحور کے مطابق الفاظ کے وزن متعین کئے جائیں۔ اس طرح کافی الفاظ کی لسٹ بن جائے گی۔
اس کے بعد دیگر اشعار کی تقطیع کی جا سکے گی۔

ایک اور آئڈیا مشین لرنگ کا ہے۔ کہ غالب کے دیون سے اس کو ٹرین کیا جائے۔ اور پھر باقی اشعار کی تقظیع اسی کے مطابق کی جائے۔

ایک بات ہے کہ غالب نے چند بحور کا استعمال کیا ہے۔ exhaustive اور robust الگورتھم کے لئے باقی بحور کے بھی کافی سارے نمونے چاہئیے ہونگے۔
 

نمرہ

محفلین
ہمارے ذہن میں پہلے ' صریرِ خامۂ وارث' کا خیال آیا تھا، کیونکہ اس پر کافی سارا کلام مع بحر کی تفصیلات موجود ہے۔ پھر 'فاعلات' کے آخر میں بانگ درا کی نظموں کا بحر کے حساب سے ذکر ہے، شاید سترہ یا چودہ بحور استعمال کی گئ ہیں اس میں۔۔ ٹرین کرنے کا خیال اچھا بھی ہے اور مقابلتا سہل بھی۔۔
 

سید ذیشان

محفلین
ہمارے ذہن میں پہلے ' صریرِ خامۂ وارث' کا خیال آیا تھا، کیونکہ اس پر کافی سارا کلام مع بحر کی تفصیلات موجود ہے۔ پھر 'فاعلات' کے آخر میں بانگ درا کی نظموں کا بحر کے حساب سے ذکر ہے، شاید سترہ یا چودہ بحور استعمال کی گئ ہیں اس میں۔۔ ٹرین کرنے کا خیال اچھا بھی ہے اور مقابلتا سہل بھی۔۔

جہاں complexity بہت زیادہ بڑھ جائے تو مشین لرننگ کا خیال ہی آتا ہے۔ :)
 
کامیاب مشین لرننگ کے لئے جس قدر ٹریننگ ڈاٹا درکار ہے اتنا جمع کرنا ذرا مشکل ہے ورنہ یہ تو سامنے کی چیز ہے۔ ہم نے اس کام سے ہاتھ اس لئے کھینچ لیا کہ اس ٹول کی کوئی افادیت نظر نہیں آئی۔ ہم نے فاتح بھائی کے ساتھ مل کر کئی روز اس کو تیار کرنے کی منصوبہ بندی اور ممکنہ ایلگورتھم پر صرف کیئے جس میں ڈکشنری اسسٹیڈ، ایلگورتھم بیسڈ اور ٹریننگ بیسڈ طریقوں کے امکانات پر غور کیا۔ پھر چند گھنٹے اس کی افادیت پر غور کرنے کے بعد اس نتیجے پر پہونچے کہ اتنا وقت، محنت اور دیگر وسائل کسی اور پروجیکٹ پر صرف کیے جائیں تو زیادہ مفید چیزیں وجود میں آ سکتی ہیں۔ :)
 

نمرہ

محفلین
افادیت کے بارے میں تو ہم بھی غور کر رہے تھے کہ آخر اس کا استعمال ہے کیا۔ دراصل یہ ہی ایک آسان کام لگ رہا تھا اس لیے مشغلے کے طور پر اس کے بارے میں سوچنا شروع کیا، ورنہ سپیچ ریکگنیشن وغیرہ بے حد کارآمد ہیں مگر کام ذرا مشکل اور طویل ہے۔
 

سید ذیشان

محفلین
کامیاب مشین لرننگ کے لئے جس قدر ٹریننگ ڈاٹا درکار ہے اتنا جمع کرنا ذرا مشکل ہے ورنہ یہ تو سامنے کی چیز ہے۔ ہم نے اس کام سے ہاتھ اس لئے کھینچ لیا کہ اس ٹول کی کوئی افادیت نظر نہیں آئی۔ ہم نے فاتح بھائی کے ساتھ مل کر کئی روز اس کو تیار کرنے کی منصوبہ بندی اور ممکنہ ایلگورتھم پر صرف کیئے جس میں ڈکشنری اسسٹیڈ، ایلگورتھم بیسڈ اور ٹریننگ بیسڈ طریقوں کے امکانات پر غور کیا۔ پھر چند گھنٹے اس کی افادیت پر غور کرنے کے بعد اس نتیجے پر پہونچے کہ اتنا وقت، محنت اور دیگر وسائل کسی اور پروجیکٹ پر صرف کیے جائیں تو زیادہ مفید چیزیں وجود میں آ سکتی ہیں۔ :)

افادیت تو ان لوگوں کے لئے ہے جو نئی نئی شاعری سیکھ رہے ہیں اور تقطیع کے جھنجھٹ میں نہیں پڑنا چاہتے۔ اس طرح سے موزوں کلام کہنے کی طرف اچھے شاعروں کو راغب کیا جا سکتا ہے۔ لیکن آپ کی بات سے متفق ہوں کہ وقت بہت درکار ہے۔ لگتا ہے مجھے پی ایچ ڈی پر ہی فوکس کرنا چاہئے۔ ;)
 

سید ذیشان

محفلین
افادیت کے بارے میں تو ہم بھی غور کر رہے تھے کہ آخر اس کا استعمال ہے کیا۔ دراصل یہ ہی ایک آسان کام لگ رہا تھا اس لیے مشغلے کے طور پر اس کے بارے میں سوچنا شروع کیا، ورنہ سپیچ ریکگنیشن وغیرہ بے حد کارآمد ہیں مگر کام ذرا مشکل اور طویل ہے۔
آسان تو یہ کسی لحاظ سے بھی نہیں ہے۔ کافی محنت طلب کام ہے اور ڈنکی ورک کافی زیادہ درکار ہے۔
یہ بھی پیٹرن ریکگنیشن کے زمرے میں آتا ہے۔ لیکن اس کا ڈیٹا سیٹ اکٹھا کرنا بہت مشکل کام ہے۔
 
افادیت تو ان لوگوں کے لئے ہے جو نئی نئی شاعری سیکھ رہے ہیں اور تقطیع کے جھنجھٹ میں نہیں پڑنا چاہتے۔ اس طرح سے موزوں کلام کہنے کی طرف اچھے شاعروں کو راغب کیا جا سکتا ہے۔ لیکن آپ کی بات سے متفق ہوں کہ وقت بہت درکار ہے۔ لگتا ہے مجھے پی ایچ ڈی پر ہی فوکس کرنا چاہئے۔ ;)
نئے لوگوں کے لئے افادیت تب ہوگی جب ایسا سافٹوئیر صد فیصد درست کام کرے۔ اور مشین لرننگ کبھی بھی صد فیصد درست کام نہیں کرتے، ہاں وقت کے ساتھ ساتھ ان میں بہتری آتی ہے وہ بھی تب جب فیڈ بیک لرننگ کا نظام شامل کیا جائے۔ نو آموز شاعروں کو غلط معلومات دینا ان کو معلومات نہ دینے سے بھیا زیادہ خطرناک ہو سکتا ہے اور کنفیوژن کا باعث بھی۔ :)
 

سید ذیشان

محفلین
نئے لوگوں کے لئے افادیت تب ہوگی جب ایسا سافٹوئیر صد فیصد درست کام کرے۔ اور مشین لرننگ کبھی بھی صد فیصد درست کام نہیں کرتے، ہاں وقت کے ساتھ ساتھ ان میں بہتری آتی ہے وہ بھی تب جب فیڈ بیک لرننگ کا نظام شامل کیا جائے۔ نو آموز شاعروں کو غلط معلومات دینا ان کو معلومات نہ دینے سے بھیا زیادہ خطرناک ہو سکتا ہے اور کنفیوژن کا باعث بھی۔ :)
اسی لئے یہ لاسٹ ریزورٹ اپشن تھا۔ :)
ویسی کچھ کیسز میں تو کافی اچھا کام کرتے ہیں۔ فنگر پرنٹ ریکگنیشن کو ہی دیکھ لیں۔ لیکن مناسب فیچر ویکٹر استعمال کرنے سے ہی ایسا ہو سکتا ہے۔
 
اسی لئے یہ لاسٹ ریزورٹ اپشن تھا۔ :)
ویسی کچھ کیسز میں تو کافی اچھا کام کرتے ہیں۔ فنگر پرنٹ ریکگنیشن کو ہی دیکھ لیں۔ لیکن مناسب فیچر ویکٹر استعمال کرنے سے ہی ایسا ہو سکتا ہے۔
جب کسی سیمپل کو ذخیرہ کیے گئے ڈاٹا سے میچ کرنا ہو تو نتائج مختلف ہوتے ہیں جب کہ جہاں پریڈکشن کرنی ہو وہاں کامپلیکسٹی بڑھ جاتی ہے ایکیوریسی کم ہو جاتی ہے۔ مشین لرننگ "کافی اچھا" کام کر سکتی ہے لیکن "صد فیصد درست" کام کرے وہ بھی تھوڑے سے ٹریننگ ڈاٹا سے ایسا محال ہے۔ فنگر پرنٹ ریگنیشن میں بھی جہاں ایکیوریسی بہت زیادہ اہم ہو وہاں ایسے نظام کی مدد سے ایک چھوٹا ڈیٹا سیٹ حاصل کیا جاتا ہے اور پھر انسانی آنکھیں معائنہ کر کے حتمی فیصلہ صادر فرماتی ہیں۔ :)
 

محمدصابر

محفلین
جیسے سری کو نوکیا لومیا سب سے اچھا فون لگتا ہے۔
image81.png
 

نمرہ

محفلین
ویسے اگر اس کام کے لیے ایک ڈکشنری استعمال کی جائے، جس میں بہت سے الفاظ اور ان کا وزن موجود ہو، تو پھر تو اس کی ایکوریسی کافی زیادہ ہو گی نیز پیٹرن ریکگنیشن اور فیڈ بیک سے سیکھنے وغیرہ کی ضرورت بھی نہیں پڑے گی۔
 

نمرہ

محفلین
آسان تو یہ کسی لحاظ سے بھی نہیں ہے۔ کافی محنت طلب کام ہے اور ڈنکی ورک کافی زیادہ درکار ہے۔
یہ بھی پیٹرن ریکگنیشن کے زمرے میں آتا ہے۔ لیکن اس کا ڈیٹا سیٹ اکٹھا کرنا بہت مشکل کام ہے۔

بالکل، دراصل آسان سے نسبتاََ آسان مراد تھا
 
ویسے اگر اس کام کے لیے ایک ڈکشنری استعمال کی جائے، جس میں بہت سے الفاظ اور ان کا وزن موجود ہو، تو پھر تو اس کی ایکوریسی کافی زیادہ ہو گی نیز پیٹرن ریکگنیشن اور فیڈ بیک سے سیکھنے وغیرہ کی ضرورت بھی نہیں پڑے گی۔
ہم نے اوپر تین ممکنہ طریقوں کا ذکر کیا تھا۔ لیکن سبھی الفاظ ہر جگہ ایک ہی وزن میں نہیں آتے۔ ممکن ہے کہ آپ بائی گرام یا ٹرائی گرام (دو اور تین الفاظ کی ترتیب) کی ضرورت محسوس کریں وہ بھی کئی ممکنہ اوزان کے ساتھ۔ اب سوال اٹھتا ہے کہ کیا اتنی محنت کرنے کے بعد کوئی مفید شئے سامنے آئے گی؟ :)
کامیاب مشین لرننگ کے لئے جس قدر ٹریننگ ڈاٹا درکار ہے اتنا جمع کرنا ذرا مشکل ہے ورنہ یہ تو سامنے کی چیز ہے۔ ہم نے اس کام سے ہاتھ اس لئے کھینچ لیا کہ اس ٹول کی کوئی افادیت نظر نہیں آئی۔ ہم نے فاتح بھائی کے ساتھ مل کر کئی روز اس کو تیار کرنے کی منصوبہ بندی اور ممکنہ ایلگورتھم پر صرف کیئے جس میں ڈکشنری اسسٹیڈ، ایلگورتھم بیسڈ اور ٹریننگ بیسڈ طریقوں کے امکانات پر غور کیا۔ پھر چند گھنٹے اس کی افادیت پر غور کرنے کے بعد اس نتیجے پر پہونچے کہ اتنا وقت، محنت اور دیگر وسائل کسی اور پروجیکٹ پر صرف کیے جائیں تو زیادہ مفید چیزیں وجود میں آ سکتی ہیں۔ :)
 

نمرہ

محفلین
ہم نے اوپر تین ممکنہ طریقوں کا ذکر کیا تھا۔
جی ہاں، ہم اس طریق کار کی پیچیدگی کی سطح کے بارے میں غور کر رہے تھے۔ ویسے الفاظ کا وزن صرف ان دو صورتوں میں تبدیل ہوتا ہے اگر ان کے آخر میں 'ہ' ، 'ا' ، 'ی' یا 'ے' آئیں، یا پھر ان کا مفہوم تبدیل ہو؟ اور آپ کا سوال تو قائم ہے اپنی جگہ۔۔۔ ویسے ہم اس پروجیکٹ میں اپنی دلچسپی کی وجہ سے آپ سب کو تنگ کر رہے ہیں، پروا نہ کیجیے گا۔
 

فاتح

لائبریرین
جی ہاں، ہم اس طریق کار کی پیچیدگی کی سطح کے بارے میں غور کر رہے تھے۔ ویسے الفاظ کا وزن صرف ان دو صورتوں میں تبدیل ہوتا ہے اگر ان کے آخر میں 'ہ' ، 'ا' ، 'ی' یا 'ے' آئیں، یا پھر ان کا مفہوم تبدیل ہو؟ اور آپ کا سوال تو قائم ہے اپنی جگہ۔۔۔ ویسے ہم اس پروجیکٹ میں اپنی دلچسپی کی وجہ سے آپ سب کو تنگ کر رہے ہیں، پروا نہ کیجیے گا۔
سعود بھائی کے ساتھ مل کر ہم نے بھی انھی خطوط پر ایسا سافٹ ویئر بنانے کے متعلق غور کیا تھا اور کافی بنیادی مسائل پر گفتگو کے بعد ان کے حل بھی سامنے آ گئے تھے لیکن بعد ازاں سعود بھائی کی مصروفیات آڑے آ گئیں۔
 

سید ذیشان

محفلین
جی ہاں، ہم اس طریق کار کی پیچیدگی کی سطح کے بارے میں غور کر رہے تھے۔ ویسے الفاظ کا وزن صرف ان دو صورتوں میں تبدیل ہوتا ہے اگر ان کے آخر میں 'ہ' ، 'ا' ، 'ی' یا 'ے' آئیں، یا پھر ان کا مفہوم تبدیل ہو؟ اور آپ کا سوال تو قائم ہے اپنی جگہ۔۔۔ ویسے ہم اس پروجیکٹ میں اپنی دلچسپی کی وجہ سے آپ سب کو تنگ کر رہے ہیں، پروا نہ کیجیے گا۔
اس کا تو حل Francess W Pritchett نے آسان سا بتایا ہے کہ ایسے الفاظ کو x سکین کیا جائے۔ یعنی غیر متعین کہ short or long syllable میں سے کوئی متعین نہیں۔ اس کے نیچے کے باقی مصرعے اس x کو یا تو short syllable یا پھر long syllable متعین کریں گے۔ ایک دفع متعین ہو گیا تو ہر جگہ ایسا ہی سکین کیا جائے گا۔ میرے خیال میں کئی اوزان کے الفاظ سے مراد وہ الفاظ ہیں جو عام طور پر سہ حرفی ہوتے ہیں۔ کبھی فعل کے وزن پر آتے ہیں اور کبھی فَعل کے وزن پر۔ اس کے علاوہ تشدید سے بھی وزن تبدیل ہو جاتا ہے۔
 

خرم شہزاد خرم

لائبریرین
السلام علیکم
مجھے یاد پڑتا ہے کہ میں نے ایسا سافٹ وئیر دیکھاہے اور ایک شعر کی تقطیع بھی کی ہے۔ اب کہاں کی ہے یاد نہیں میں تلاش کرتا ہوں
 
Top