کوشش کرنے میں کوئی حرج نہیں۔ البتہ اگر کوئی تھوڑی بہت مدد درکار ہو تو ہم حاظر ہیں۔بہرحال، ابھی تو ہم ڈکشنری کی بنیاد پر تقطیع کرنے والے ایک سیدھے سادے پروگرام کے ممکنہ ڈیزائن اور طریقہ کار پر کچھ غور کرتے ہیں ، کوشش کرنے میں آخر حرج ہی کیا ہے ۔۔
اگر آپ روبی آن ریلز سیکھ رہے ہیں تو سیکھنے کے لئے ایک چھوٹا سا ایپلیکشن بنا لیں جس میں الفاظ کا ذخیرہ کیا جا سکے اور ساتھ ہی ان کے اوزان وغیرہ کے کالم ہوں بھی ہوں۔ پھر ہیورسٹک الگورتھمز کی مدد سے ان الفاظ کے اوزان کے کالم کو پر کر دیں۔ جسے بعد میں ایک ایک کر کے دیکھتے جائیں اور جہاں درست وزن نہ ہوا ہو اس کو مینولی درست کر دیں۔ ہر لفظ کے ساتھ ایک بولین کالم اس مقصد کے لئے رکھیں کہ اس کی مدد سے لفظ کے ریویو کو نشان زد کیا جا سکے۔ اس طرح ریلز پر کام کرنے کا اچھا تجربہ ہو جائے گا۔روبی ان ریلز سیکھنے پر کام شروع کر دیا ہے۔ دیکھتے ہیں کیا نکلتا ہے اس سے۔ آپ اگر ڈکشنری شیئر کر دیں گے جس پر آپ نے کام کیا ہے تو مہربانی ہو گی۔ اور جو الفاظ شامل نہیں ہیں ان کے لئے کیا پلین ہے؟
یہ الفاظ تو ہزاروں میں ہوں گے۔ ان کو مینولی دیکھنا تو بہت وقت طلب کام ہے۔ اس کا کوئی آسان حل نہیں ہو سکتا؟اگر آپ روبی آن ریلز سیکھ رہے ہیں تو سیکھنے کے لئے ایک چھوٹا سا ایپلیکشن بنا لیں جس میں الفاظ کا ذخیرہ کیا جا سکے اور ساتھ ہی ان کے اوزان وغیرہ کے کالم ہوں بھی ہوں۔ پھر ہیورسٹک الگورتھمز کی مدد سے ان الفاظ کے اوزان کے کالم کو پر کر دیں۔ جسے بعد میں ایک ایک کر کے دیکھتے جائیں اور جہاں درست وزن نہ ہوا ہو اس کو مینولی درست کر دیں۔ ہر لفظ کے ساتھ ایک بولین کالم اس مقصد کے لئے رکھیں کہ اس کی مدد سے لفظ کے ریویو کو نشان زد کیا جا سکے۔ اس طرح ریلز پر کام کرنے کا اچھا تجربہ ہو جائے گا۔
ہمارے پاس ڈکشنری ابھی بہت ہی خام حالت میں موجود ہے۔ کسی روز اس کو ڈھونڈھ کر اس کی کلینگ کر کے آپ کو مواد فراہم کرتے ہیں۔
جس حد تک خود کار طریق پر کرنا ممکن تھا وہ کر چکے ہیں لیکن اس کے باوجود ہزاروں کی تعداد میں ایسے الفاظ بچتے ہیں جن پر مینوئل کام کرنا تھایہ الفاظ تو ہزاروں میں ہوں گے۔ ان کو مینولی دیکھنا تو بہت وقت طلب کام ہے۔ اس کا کوئی آسان حل نہیں ہو سکتا؟
جوب اوپر موجود ہے۔ رہا سوال ریویو کا، تو اس کو مینولی ہی کرنا ہوگا جو کہ بہت بڑا کام نہیں ہونا چاہئے۔ اگر ریویو بھی آٹو میٹ ہو سکتا تو سافٹوئیر کو ڈکشنری بیسڈ بنانے کی ضرورت کیوں کر پیش آتی؟ سب کچھ لاجک کی مدد سے نہ ہو جاتا؟ ویسے ریویو کے دور سے گزرتے ہوئے کچھ انکشافات بھی ہونے کی توقع ہے جن کے بارے میں پہلے سے سوچا بھی نہیں ہوگا۔ بعد میں وہ قواعد بنیں گے کہ کس قسم کے الفاظ کا وزن کس طرح حاصل کیا جا سکتا ہے۔یہ الفاظ تو ہزاروں میں ہوں گے۔ ان کو مینولی دیکھنا تو بہت وقت طلب کام ہے۔ اس کا کوئی آسان حل نہیں ہو سکتا؟
پھر ہیورسٹک الگورتھمز کی مدد سے ان الفاظ کے اوزان کے کالم کو پر کر دیں۔
کافی مشکل کام ہے چلیں ابتدا تو کرتے ہیں باقی آہستہ آہستہ کام ہوتا جائے گا۔جوب اوپر موجود ہے۔ رہا سوال ریویو کا، تو اس کو مینولی ہی کرنا ہوگا جو کہ بہت بڑا کام نہیں ہونا چاہئے۔ اگر ریویو بھی آٹو میٹ ہو سکتا تو سافٹوئیر کو ڈکشنری بیسڈ بنانے کی ضرورت کیوں کر پیش آتی؟ سب کچھ لاجک کی مدد سے نہ ہو جاتا؟ ویسے ریویو کے دور سے گزرتے ہوئے کچھ انکشافات بھی ہونے کی توقع ہے جن کے بارے میں پہلے سے سوچا بھی نہیں ہوگا۔ بعد میں وہ قواعد بنیں گے کہ کس قسم کے الفاظ کا وزن کس طرح حاصل کیا جا سکتا ہے۔
آخر کوئی تو وجہ تھی جس کے باعث ہم نے اس پروجیکٹ کو ملتوی کیا تھا۔کافی مشکل کام ہے چلیں ابتدا تو کرتے ہیں باقی آہستہ آہستہ کام ہوتا جائے گا۔
بالکل ایک سے زائد وزن والے الفاظ بھی ہوتے ہیں لیکن تشدید والے الفاظ کا معاملہ یہ نہیں۔ ایک سے زائد وزن اسے کہا جاتا ہے جب ایک لفظ اساتذہ نے ایک سے زائد وزن پر باندھا ہو۔ویسے ایک بات اور بھی ہے کہ کچھ الفاظ کے کئی اوزان بھی ہوتے ہیں۔ تشدید والے الفاظ اور چند سہ حرفی الفاظ۔ اس کے علاوہ بھی شائد ہوں۔ ان کارنر کیسز کو بھی ڈیل کرنا پڑے گا۔ کیا اس کے علاوہ بھی کچھ کارنر کیسز ہیں؟
تشدید سے مراد یہی تھی کہ کبھی لفظ مشدد باندھا جائے اور کبھی نہ باندھا جائے۔بالکل ایک سے زائد وزن والے الفاظ بھی ہوتے ہیں لیکن تشدید والے الفاظ کا معاملہ یہ نہیں۔ ایک سے زائد وزن اسے کہا جاتا ہے جب ایک لفظ اساتذہ نے ایک سے زائد وزن پر باندھا ہو۔
ضروری نہیں کہ آپ صد فیصد درست تقطیع کار ایپلیکیشن پہلے ہی ہلے میں بنا لیں۔۔۔ویسے ایک بات اور بھی ہے کہ کچھ الفاظ کے کئی اوزان بھی ہوتے ہیں۔ تشدید والے الفاظ اور چند سہ حرفی الفاظ۔ اس کے علاوہ بھی شائد ہوں۔ ان کارنر کیسز کو بھی ڈیل کرنا پڑے گا۔ کیا اس کے علاوہ بھی کچھ کارنر کیسز ہیں؟
http://www.crulp.org/software/ling_resources/wordlist.htmآپ ڈکشنری یا الفاظ کی لسٹ کون سی استعمال کر رہے ہیں؟ ٹیکسٹ فارمیٹ میں مل جائے گی کہیں سے؟
شکریہ۔ یہ لسٹ تو کافی comprehensive لگ رہی ہے۔ ڈیڑھ لاکھ سے زائد الفاظ ہیں اس میں۔