لغت کے اگلے مرحلے کا آغاز اور کچھ سوالات

آصف

محفلین
اگلے مرحلہ کیلئے ہمیں اردو الفاظ کو مختلف زمرہ جات میں تقسیم کرنا ہے اور کچھ مزید کام بھی کرنا ہے۔ اس بارے میرے ذہن میں کچھ سوالات ہیں جن کو میں یہاں رکھنا چاہوں گا۔

سب سے پہلے تو کچھ ڈیٹا بیس کی تفصیل

اردو الفاظ کا بنیادی جدول یہ ہے:

eudict_urduvocab.jpg


اس میں stemword خالی رہے گا سوائے اس وقت کے جب اصل کلمہ زیر بحث نہ ہو۔ مثلا کتاب کیلئے stemword خالی ہوگا لیکن کتابوں کیلئے stemword کتاب ہوگا۔ اسی طرح کتاب کیلئے singular خالی ہوگا لیکن کتب یا کتابیں کیلئے singular کی جگہ کتاب آ جائے گا۔ اس میں اقسام کلمہ (parts of speech) ایک دوسرے جدول سے آتے ہیں جو یہ ہے:

eudict_partsofspeech_table.jpg

اس جدول کے مندرجات کی حالیہ شکل میں‌ نے کچھ یوں ترتیب دی ہے:

eudict_partsofspeech.jpg


فی الحال میں انگریزی جدول اور اردو اور انگریزی جداول کے درمیان رابطے والے جدول کی تفصیل میں نہیں جاؤں گا۔ میرے سامنے دو بڑے سوالات ہیں۔

1۔ سب سے پہلا سوال اعراب کا ہے۔ میری را‍ئے یہ ہے کہ لغت میں تو ہم الفاظ کو اعراب (اگر اعراب دستیاب ہوں) کے ساتھ ہی داخل کریں لیکن اگر صارف کوئی لفظ تلاش کرے تو ہم اس میں سے اعراب ختم کر کے تلاش کریں اور جتنی بھی مطابقتیں ظاہر ہوں ان سب کو اعراب (اگر لغت میں اعراب موجود ہوں) کے ساتھ پیش کر دیں۔
اس میں دوسری اہم بات یہ ہے کہ ایک ہی ہجے والے، لیکن مختلف اعراب والے الفاظ کو لازما دو دفعہ مختلف اعراب سے لکھا جائے۔

2۔ دوسرا بہت اہم مسئلہ ہجوں میں اختلاف کا ہے۔ مثال کے طور پر ایک ہی لفظ کو لکھنے کے دو طریقے:
(ا) ہوئے (ب) ہوئے
اس بارے میں آپ کیا کہیں گے؟ میرے حساب سے تو دوسرا والا درست ہے لیکن کمپیوٹر پر اردو لکھتے "ہو‌‌ئے" لوگ بالکل خیال نہیں کرتے۔ خود مجھ سے کئی دفعہ "غلطی" ہو جاتی ہے۔ اسی طرح کا مسئلہ "ہء" اور ۂ کے ساتھ بھی ہے۔ کچھ لوگ ترانہءآزادی لکھتے ہیں اور کچھ ترانۂآزادی۔ اس میں بھی میرے خیال میں تو دوسرا ہی درست ہے۔

آپ لوگوں کی اس بارے میں کیا رائے ہے تاکہ قدم آگے بڑھایا جا سکے۔
دوسری اہم بات یہ کہ ہمیں اس مرحلے کی تکمیل میں ایسے احباب کا تعاون چاہئيے جو کلمہ کی اقسام کا علم رکھتے ہوں۔ یہ بہت بڑا مسئلہ نہیں ہے اگر آپ نے سکول میں اردو یا انگریزی گرامر توجہ سے پڑھی تھی :)

اس کے علاوہ آپ کے ذہن میں مزید کوئی سوال ہو یا کوئی رائے دینا چاہتے ہوں تو اس سے بھی ہمیں آگاہ کر سکتے ہیں۔
 

الف نظامی

لائبریرین
آصف نے کہا:
1۔ سب سے پہلا سوال اعراب کا ہے۔ میری را‍ئے یہ ہے کہ لغت میں تو ہم الفاظ کو اعراب (اگر اعراب دستیاب ہوں) کے ساتھ ہی داخل کریں لیکن اگر صارف کوئی لفظ تلاش کرے تو ہم اس میں سے اعراب ختم کر کے تلاش کریں اور جتنی بھی مطابقتیں ظاہر ہوں ان سب کو اعراب (اگر لغت میں اعراب موجود ہوں) کے ساتھ پیش کر دیں۔
اس میں دوسری اہم بات یہ ہے کہ ایک ہی ہجے والے، لیکن مختلف اعراب والے الفاظ کو لازما دو دفعہ مختلف اعراب سے لکھا جائے۔

2۔ دوسرا بہت اہم مسئلہ ہجوں میں اختلاف کا ہے۔ مثال کے طور پر ایک ہی لفظ کو لکھنے کے دو طریقے:
(ا) ہوئے (ب) ہوئے
اس بارے میں آپ کیا کہیں گے؟ میرے حساب سے تو دوسرا والا درست ہے لیکن کمپیوٹر پر اردو لکھتے "ہو‌‌ئے" لوگ بالکل خیال نہیں کرتے۔ خود مجھ سے کئی دفعہ "غلطی" ہو جاتی ہے۔ اسی طرح کا مسئلہ "ہء" اور ۂ کے ساتھ بھی ہے۔ کچھ لوگ ترانہءآزادی لکھتے ہیں اور کچھ ترانۂآزادی۔ اس میں بھی میرے خیال میں تو دوسرا ہی درست ہے۔
1 ۔بالکل صحیح ہے ، اعراب کے بغیر ہی سرچ کرنا ہے۔
2۔اردو دان زیادہ بہتر جانتے ہیں۔
 
میرے خیال سے اس کام کو اب شروع کردیا جائے اور الفاظ کے معنی اور جس قدر معلومات میسر آسکے انہیں ڈیٹا بیس کا حصہ بنا دیا جائے، وقت کے ساتھ ساتھ اس کی شکل نکھرتی جائے گی۔ خاص طور پر جب ہم الفاظ اور معنی کی ایک فہرست کسی کو دکھا سکیں گے تو بہتر رائے اور تنقید سامنے آسکے گی۔

کام کو تقسیم کرنے کا کام شروع کردینا چاہیے۔ :)
 

آصف

محفلین
کام تو عرصہ ہوا شروع ہو چکا ہے محب۔ اگر آپ میرے سوالات کے بارے میں کچھ تبصرہ فرمائیں تو لغت کی ترتیب میں فائدہ مند ہو گا۔
 
١۔ اعراب کے بغیر تلاش ہونی چاہیے کیونکہ شاید ہی کوئی تلاش کرتے وقت اعراب کی زحمت کرے ویسے بھی تلاش میں آپ زیادہ سے زیادہ الفاظ دیکھنا چاہتے ہیں۔

٢۔ اس سلسلے میں ہمیں مختلف ہجوں کے ساتھ الفاظ کی فہرست شامل کرنا پڑے گی تاکہ ڈھونڈنے والے کو آسانی رہے۔

میرا سوال یہ ہے کہ ایک مرحلہ تو مکمل ہوچکا ہے اب اگلا مرحلہ کب شروع ہونا ہے اور اس کے لیے لائحہ عمل کیا ہوگا۔ اس کے علاوہ کیا اب الفاظ کے معنی اور ڈیٹا بیس میں اندراج کے لیے کوئی آن لائن انٹرفیس مہیا کیا جائے گا یا پچھلی بار کی ہی طرح علیحدہ علیحدہ فائلز پر کام ہوگا۔
 

آصف

محفلین
->محب: دوسرا مرحلہ شروع ہوا ہی چاہتا ہے اور بنیادی طور پر اس کا انحصار میرے پاس وقت کی دستیابی پر ہے۔

رہی دوسری بات تو میرے لئے تو فائلوں والا رستہ ہی دستیاب ہے۔ اگر آپ کے لئے ممکن ہو کہ ہمیں کوئی سافٹوئیر لکھ دیں تو وہ استعمال کر لیں گے۔
 

الف نظامی

لائبریرین
آصف نے کہا:
->محب: دوسرا مرحلہ شروع ہوا ہی چاہتا ہے اور بنیادی طور پر اس کا انحصار میرے پاس وقت کی دستیابی پر ہے۔

رہی دوسری بات تو میرے لئے تو فائلوں والا رستہ ہی دستیاب ہے۔ اگر آپ کے لئے ممکن ہو کہ ہمیں کوئی سافٹوئیر لکھ دیں تو وہ استعمال کر لیں گے۔
ڈیٹا بیس کی فائل کس فارمیٹ میں ہے
 

آصف

محفلین
راجہ ڈیٹا ٹیکسٹ فائلوں کی شکل میں "ہوگا"۔ کیونکہ اس مرحلے میں ہم لغت کیلئے قابل استعمال "صرف اردو ڈیٹا" پیدا کریں گے۔ اور ہم فائلوں میں کلمات کے مفاہیم نہیں لکھیں گے بلکہ فائلوں میں صرف یہ کریں گے، مثلا:

کا - - - حرف عطف
کھانا - - - فعل
کھانا - - - اسم
کھانے - - - (واحد) کھانا
وغیرہ وغیرہ

مفاہیم کا متعین کرنا اس مرحلے کے بعد میں زیرغور آئے گا۔ اگر آپ لوگ اس موضوع پر میرے تمام پرانے مراسلہ جات غور سے پڑھیں تو آپ پر سارا لائحۂعمل واضح ہو جائے گا۔
 

الف عین

لائبریرین
جب آئ ڈی نمبر بھی دے دیا گیا ہے ڈیٹا بیس جدول میں تو اردو مخفّفات کی کیا ضرورت ہے۔ ٹیکسٹ فائلیں یہ یہاں اپ لوڈ کر دی جائیں اور اپنے اپنے حصّے کی فائیلیں ارکان مکمل کر لیں اور اپ لوڈ کر دیں۔
یہ تو درست ہے کہ اعراب کے بغیر ہی سرچ کرتے ہیں سبھی،۔ ہر ممکنہ املا میں لیکن اغلاط زیادہ نہیں شمار کی جانی چاہئے ورنہ لوگوں کو یہ احساس ہوگا کہ یہ بھی درست ہے اسی وجہ سے ہم اس معیاری انجن میں شامل کر رہے ہیں۔ کہیں اس طرح اغلاط کی درستگی کے ثبوت کے طور پر اردو ویب نہ پیش کی جانے لگے!!
 

نبیل

تکنیکی معاون
آصف، میں نے اس ڈیٹابیس سٹرکچر کو دیکھا ہے۔ مجھے اس میں مترادفات کی گنجائش نہیں نظر آ رہی۔ یہ ایک تھیسارس کے لیے ضروری ہوگا۔ کیا میں ٹھیک کہہ رہا ہوں؟
 
لغت سے متعلق جو خاکہ تھا

آصف کا بتایا ہوا اسٹرکچر کسی حرف کو صحیح صحیح ڈیفائن کرنے کے لیے بہترین ہےلیکن اس میں لغت اور تھیسارس کی بحث نہیں کی گئی ہے۔

لغت کے لیے غالباً اولین جدول دونوں زبانوں کے لیے موجود ہوں گے اور ان کے درمیان تعلق (relationship) بنایا جائے گا۔ مترادفات کے لیے غالباً ایک جدول کے الفاظ میں باہم تعلق ہوگا۔

میرے ذہن میں لغت سے متعلق جو خاکہ تھا، وہ ایک طرفی لغت کا تھا۔ اس میں آپریٹر کو صرف

Expression
Parts Of speech
Meaning

کی اینٹری کرنا تھی جس سے لغت تیار کی جاتی۔ یہ اِس صورت میں بھی ممکن ہے جب کہ ہم

Category
singular
stemword

وغیرہ کے خانے کو خالی چھوڑتے ہوئے آگے بڑھیں۔ اس سلسلے میں میرا یہ کہنا ہے کہ فی الحال ہم idealistic ہونے کی بجائے realistic ہوکر آگے بڑھیں۔
 

نبیل

تکنیکی معاون
شارق، فی الحال تو خود لفظ اور مزید ایک دو فیلڈز کے علاوہ کسی اور فیلڈ کو لازمی نہیں رکھتے لیکن انہیں ڈیٹابیس سٹرکچر میں باقی رکھتے ہیں۔ یہ مستقبل میں ڈیٹا کو زیادہ معنی بخشنے اور اپلیکیشن کو بہتر بنانے میں کام آئیں گی۔
 
اگر ہم انگریزی سے اردو اور اردو سے انگریزی الفاظ کی گنجائش رکھ رہے ہیں تو پھر ڈیٹا بیس میں ہمیں ہر لفظ‌کے لیے کم از کم ایک اردو معنی اور ایک انگریزی معنی لازمی رکھنا ہوگا اور اگر دو مزید اردو معنی اور انگریزی معنی کے کالم بنا کر آپشنل رکھ دیں تو یہ تھیسارس کے بھی کام آسکتے ہیں۔
 

آصف

محفلین
ڈیٹا بیس کا مکمل ڈھانچہ یہ رہا:

tables.jpg


لغت اور تھیسارس کے سب سے اہم جدول کی تفصیل یہ ہے:

eudict_dictlink.jpg


دوسرے جداول کی تفصیل یہ ہے:

eudict_categories.jpg


eudict_englishantonyms.jpg


eudict_englishsynonyms.jpg


eudict_englishvocab.jpg


eudict_partsofspeech1.jpg


eudict_urduantonyms.jpg


eudict_urdusynonyms.jpg


eudict_urduvocab1.jpg


اس سے آپ کو اندازہ ہو گیا ہو گا کہ اس ڈھانچے میں مترادفات اور متضادات کا مکمل خیال رکھا گیا ہے۔ جو صاحب ڈیٹابیسز کا تھوڑا تجربہ رکھتے ہوں ان کیلئے مختلف جداول کی پرائمری کیز کو آپس میں جوڑنا مشکل نہ ہو گا۔ البتہ اگر آپ کہیں تو میں یہاں اس کی ‏MySQL ڈیٹابیس رکھ دوں گا۔ اس ڈھانچے کی تفاصیل پر میرا کافی وقت لگا ہے اس کے باوجود اگر آپ کوئی تبدیلی کرنا چاہتے ہوں تو ضرور کیجئے۔ لیکن میری رائے ہے کہ ہمیں آسانی کی طرف نہیں دیکھنا چاہئیے بلکہ ایک مکمل سہولت مہیا کرنے کو ہدف بنانا چاہئیے۔ ہلکی پھلکی اردو لغات پہلے ہی انٹرنیٹ پر دستیاب ہیں۔ ان میں ایک اور کا اضافہ کسی مضبوط بنیاد کی بناء پر ہونا چاہئیے۔ اوپر تجویز کردہ دو طرفی لغت بمعہ تھیسارس یہ بنیاد مہیا کرتی ہے۔
 

نبیل

تکنیکی معاون
آصف، میری ایک اور تجویز ہے اس ڈیٹا سٹرکچر میں اضافے کی۔ میری تجویز ہے کہ ایک ٹیبل StartingAlphabet کے نام سے بنا لی جائے، جس میں تمام اردو حروف تہجی شامل ہوں اور سب کو ایک آئی ڈی دی جائے۔ اس کے بعد اردو الفاظ کی ٹیبل میں بھی StartingAlphabet کے کالم کا اضافہ کیا جائے۔

میرے خیال میں اس سے یہ فائدہ ہوگا کہ کسی ایک حرف سے شروع ہونے والے الفاظ کی فہرست آسانی سے حاصل کی جا سکے گی۔
 

زیک

مسافر
نبیل: یہ تو ویسے بھی sql سے ممکن ہے۔ اب یہ معلوم نہیں کہ آپ کی تجویز کی رفتار بہتر ہو گی یا دوسرے صورت کی۔

البتہ sort کے لئے کچھ کرنا پڑے گا کہ اردو سورٹ کا فی الحال کوئی طریقہ نہیں ہے۔
 
Top