انگریزی اردو لغت کو برقیانا

راج

محفلین
میری دلچسپی پہلے سے یہی رہی ہے کہ میں اردو ڈکشنری تیار کروں اور میں نے اس پر کام بھی شروع کیا تھا لیکن وی بی کی معلومات ناکافی ہونے کی وجہ سے جاری نہ رکھ سکا- :cry:
ویسے تو اردو ڈکشنری نیٹ پر ہے مگر میں فری میں مکمل ڈکشنری عام لوگوں کو فراہم کرنا چاہتا تھا- :?
 

الف عین

لائبریرین
تو آ جائیں راج میدان میں اور اس پروجیکٹ میں فعّال حصّہ لیں۔
لیکن اس سے پہلے تعارف کی فورم میں اپنا تعارف ضرور کرائیں۔
 

محسن حجازی

محفلین
لغت کے سلسلے میں الفاظ کی بنیادی فہرست تیار کرنا اصل کام ہے کیا یہ ہو چکا ہے؟ اگر نہیں تو مجھے دیجیے میں مکینیکلی کر دیتا ہوں۔
 

محسن حجازی

محفلین
لغت کے کام کے لیے اصل میں کسی بنی ہوئی لغت کو ٹائپ کرنا مناسب نہ ہوگا۔ اصل میں لغت کچھ اس انداز کی ہونی چاہیے کہ مشینی ترجمہ کاری میں کام آ سکے۔ اس کے لیے کرنا یہ ہوگا کہ پہلے صرف اردو زبان
کے الفاظ پر مشتمل لغت بنانا ہوگی جس میں کہ صرف اور صرف عمومی بول چال کے الفاظ شامل ہوں۔ یہ تعداد میں کوئی 2500 سے 3000 ہزارکے قریب ہوں گے۔ اس کے بعد ان کے آگے ان کی صرف
و نحو کی بہت سادہ معلومات درج کی جائیں گی جیسے کہ یہ لفظ اسم ہے، فعل، حرف یا ۔۔۔ اس طرح کی ڈکشنری عوام الناس کے کام کی تو نہیں ہوگی لیکن صرف اور صرف شروع میں۔ اس قسم کی ڈکشنری کی
بنیاد پر اردو کے گرائمر چیکر بنائے جا سکیں گے۔ آج کل میں اسی مرحلے پر کام بھی کر رہا ہوں اور آپ دوستوں کے شاید علم میں ہو کہ خاکسار پاک نستعلیق کے منصوبے سے فارغ ہو کر صرف نگرانی کر رہا ہے اور اب
انگریزی تا اردو مشینی ترجمہ کاری پر مصروف عمل ہے۔ الفاظ کی فہرست ٹائپ کر کے نہیں بلکہ اردو فورم کے تمام یونی کوڈ ڈیٹا میں سے اخذ کرنے کے بعد اس کی درجہ بندی ہم مل کر کریں گے۔ ہر شخص صرف
300 الفاظ کی درجہ بندی بھی کرے تو صرف 10 لوگ اس کام کو 3 دن میں کر لیں گے۔ (یہ ہے اوپن سورس کی طاقت۔۔۔)
اس ضمن میں میری گہری دلچسپی ہے مجھے بتائیے کہ کیا کیا جائے ۔ اور کیا آپ اس طریقہ کار سے اتفاق رکھتے ہیں۔
 

نبیل

تکنیکی معاون
محسن، جو کام تم کہہ رہے ہو وہ آصف، راجہ نعیم اور باقی دوست پہلے ہی کر چکے ہیں۔ اردو الفاظ کی ایک تیار کی جا چکی ہے اور اسے اسی فورم کے یونیکوڈ ڈیٹا سے اخذ کیا گیا ہے۔ تفصیل ذیل کے ربط پر دکھو:

http://www.urduweb.org/mehfil/viewtopic.php?t=2851

ذرا اسی لغت پراجیکٹ والے زمرے کا جائزہ لو، تمہیں اس سے آگے کی پیشرفت بھی نظر آ جائے گی۔ آصف نے اردو لغت کا ایک ڈیٹاماڈل بھی تیار کیا ہے جس کی تفصیل ذیل کے ربط میں موجود ہے:

http://www.urduweb.org/mehfil/viewtopic.php?t=3115

اگلا مرحلہ ایک ڈیٹا اینٹری اپلیکیشن تیار کرنے کا ہے جس کے ذریعے اس لغت کا ڈیٹا محفوظ کیا جا سکے۔ یہ ایک بیک اینڈ اپلیکیشن ہوگی اور اس کی رسائی صرف ڈیٹا اینٹری کرنے والوں تک محدود ہوگی۔ ایک مرتبہ یہ کام مکمل ہوجائے تو اس کے بعد ایک فرنٹ اینڈ انٹرفیس بنا کر اسے عام پبلک کے لیے اوپن کیا جا سکے گا۔

اب تک اس پراجیکٹ پر کام آگے نہیں بڑھا ہے۔ اب راجہ نعیم اور باقی دوست مل کر کچھ کام کر تو رہے ہیں لیکن میں ایک اور سمت میں تحقیق کر رہا ہوں۔ اس کے بارے میں میں ایک اور جگہ بھی پوسٹ کر چکا ہوں۔ دراصل لغت پراجیکٹ کے علاوہ دوسرے پراجیکٹ بھی ہیں جن میں ایسی ڈیٹااینٹری اپلیکیشن کی ضرورت پیش آ رہی ہے۔ اس نوعیت کے اطلاقیات تیار کرنا کافی وقت اور محنت طلب کام ہے۔ میں کچھ دنوں سے کچھ اپلیکیشن فریم ورکس پر تحقیق کر رہا ہوں جن کے ذریعے اس طرح کی بیک اینڈ اپلیکیشنز بنانے کا کام قدرے آسان ہو سکتا ہے۔ یہ اپلیکیشن فریم ورک روبی آن ریلز (روبی پروگرامنگ لینگویج پر مبنی) اور جینگو Django (پائیتھون لینگویج فریمورک) ہیں۔ میں جلد ہی اپنی تحقیق کے نتائج کے بارے میں پوسٹ کروں گا۔
 
محسن حجازی نے کہا:
لغت کے کام کے لیے اصل میں کسی بنی ہوئی لغت کو ٹائپ کرنا مناسب نہ ہوگا۔ اصل میں لغت کچھ اس انداز کی ہونی چاہیے کہ مشینی ترجمہ کاری میں کام آ سکے۔ اس کے لیے کرنا یہ ہوگا کہ پہلے صرف اردو زبان
کے الفاظ پر مشتمل لغت بنانا ہوگی جس میں کہ صرف اور صرف عمومی بول چال کے الفاظ شامل ہوں۔ یہ تعداد میں کوئی 2500 سے 3000 ہزارکے قریب ہوں گے۔ اس کے بعد ان کے آگے ان کی صرف
و نحو کی بہت سادہ معلومات درج کی جائیں گی جیسے کہ یہ لفظ اسم ہے، فعل، حرف یا ۔۔۔ اس طرح کی ڈکشنری عوام الناس کے کام کی تو نہیں ہوگی لیکن صرف اور صرف شروع میں۔ اس قسم کی ڈکشنری کی
بنیاد پر اردو کے گرائمر چیکر بنائے جا سکیں گے۔ آج کل میں اسی مرحلے پر کام بھی کر رہا ہوں اور آپ دوستوں کے شاید علم میں ہو کہ خاکسار پاک نستعلیق کے منصوبے سے فارغ ہو کر صرف نگرانی کر رہا ہے اور اب
انگریزی تا اردو مشینی ترجمہ کاری پر مصروف عمل ہے۔ الفاظ کی فہرست ٹائپ کر کے نہیں بلکہ اردو فورم کے تمام یونی کوڈ ڈیٹا میں سے اخذ کرنے کے بعد اس کی درجہ بندی ہم مل کر کریں گے۔ ہر شخص صرف
300 الفاظ کی درجہ بندی بھی کرے تو صرف 10 لوگ اس کام کو 3 دن میں کر لیں گے۔ (یہ ہے اوپن سورس کی طاقت۔۔۔)
اس ضمن میں میری گہری دلچسپی ہے مجھے بتائیے کہ کیا کیا جائے ۔ اور کیا آپ اس طریقہ کار سے اتفاق رکھتے ہیں۔

محسن ، نبیل کی پوسٹ سے آپ کو یہ تو معلوم ہو گیا ہوگا کہ یہ کام ہم لوگ پہلے کرچکے ہیں اور کم از کم 3-4 ہزار الفاظ کی فائل بن گئی تھی جو شاید اوپن آفس اسپیل چیکر میں استعمال بھی ہوئی ہے۔ اس کے بعد لغت کا کام کچھ نہیں بلکہ تقریبا رک ہی گیا اور اب دوبارہ کچھ پیش رفت ہورہی ہے اس پر اور فی الحال چند ممبران اس پر کام کر رہے ہیں جس میں حروف کے لحاظ سے الفاظ بانٹ کر کام ہو رہا ہے۔ اس پر مختلف تجاویز پر بحث ہوئی ہے وہ آپ دیکھ لیں اور رائے سے بھی نوازیں۔

میں سمجھتا ہوں کہ ایپلیکشن بننے تک مواد کی تیاری جاری رہنی چاہیے ورنہ خالی ایپلیکشن کس کام کی اور اس کے لیے یا تو پہلے سے بنی ہوئی لغت کی فائل ملے ورنہ ہمیں یہ کام خود ہی کرنا ہوگا۔ اردو یا انگریزی الفاظ کی فہرست تو ہم حاصل کر سکتے ہیں مگر ان الفاظ کے معنی انگریزی میں لکھنے ہی پڑیں گے۔ میرا خیال ہے کہ کوئی بھی ڈکشنری اگر وہ فائلز پر انحصار نہ کرے تو زیادہ مفید ثابت نہ ہوگی کیونکہ ایک تو ڈیٹا سے عام صارف کی واقفیت نہیں ہوتی اور دوسرا اگر فائلوں سے کوئی ایپلیکشن ڈیٹا اٹھا رہی ہو تو اسے اپڈیٹ کرنا اور درست رکھنا ڈیٹا بیس سے کافی آسان ہوگا۔

کچھ لوگوں کے خیال میں یہ کام کی دہرائی ہے کہ پہلے فائلوں میں لکھا جائے اور پھر ڈیٹا بیس میں ڈالا جائے ، ڈیٹا بیس میں ڈالنے کے لیے فائل سے زیادہ اور کیا صورت موثر ہوگی ؟ ایپلیکشن کے ذریعے ڈیٹا بیس میں ڈالنے یا فائل سے ڈالنے میں یقینا فائل سے ڈالنا بہت تیز رفتار ہوگا کیونکہ ایک ٹیبل میں فائل سے ڈیٹا ڈالنے میں چند منٹ سے زیادہ نہیں لگتے اور اس کے بعد sql کی مدد سے آپ اس ڈیٹا کو مختلف طریقوں سے رکھ سکتے ہیں جو یقینا مشکل نہیں ہے۔ فرنٹ اینڈ پر اسے کسی بھی طریقے سے ڈسپلے کرنا بھی مشکل نہیں مگر سب سے اہم ڈیٹا کی وافر مقدار اور درست فراہمی ہے۔

میرا خیال ہے کہ اس ضمن میں کچھ لوگ ضرور مجھ سے متفق ہوں گے ۔
 
بدتمیز نے کہا:
محب علوی نے کہا:
جو میں نے لکھا ہے اسے اسی طرح سلیکٹ کرکے ایکسل میں پیسٹ کریں تو دو کالمز میں آجائے گا جسے پڑھنا آسان ہوگا۔

یہ صرف پیش رفت جاری رکھنے کے لیے تھا ورنہ ہم ایکسل فائلیں اپلوڈ کرکے بھی اپڈیٹ کرسکتے ہیں۔

میرے پاس آفس 2003 ہے آپکا ٹیکسٹ کاپی کر کے پیسٹ کرنے پر یہ ایک ہی کالم میں پیسٹ ہوا ہے۔
میں نے شروع میں عرض کی تھی کہ اس کو ڈیٹا بیس کی صورت میں محفوظ کریں۔ اتنی محنت کے بعد اس کو دوبارہ الگ دوسری جگہ شفٹ کرنا وقت اور توانائی کا ضیاع ہو گا دوسرے حوصلہ شکنی بھی ہو گی۔

دوست تم نے ابھی تک یہ کام نہیں شروع کیا۔ تم ذہین ہو تم سے یہی گزارش ہے تھوڑا وقت دے کر ڈیٹا بیس سیکھ لو تمہارے بہت کام آئے گی اور اس میں اس سب کو لکھنا بجائے یہ کہ ایکسل یا سی وی ایس فائل میں وقت برباد کرو۔

ایک غلطی ہوگئی لکھتے وقت اور تم نے سارے کام کو ہی برباد کر دیا۔ اصل میں میں نے اپنے پاس ہی فائل سیو کرکے پھر یہاں پیسٹ کیا تھا اس لیے مجھے محسوس نہ ہوا۔ آسان حل یہ ہے کہ comma delimited فائل استعمال کرتے ہیں جو کہ ایکسل میں بنانا بھی کافی آسان ہے اور امپورٹ‌کرنا بھی اور پھر اسے ڈیٹا بیس میں ڈالنا بھی ۔

اب ان کو کاپی کرکے پیسٹ کرو اور بتاؤ کہ کیا نتیجہ نکلتا ہے

cab , گاڑی
cabal , سازش ۔ ساز باز کرنا
cabaret , شراب خانہ

ایک ہی کالم میں پیسٹ کرے گا، اس کالم کو سیلیکٹ کرکے
Data کو مینو کو کلک کرنا ہے اور اس کے بعد Text to Columns کو ۔ دو آپشن آئیں گی

Delimited
Fixed width

Delimited کو سیلیکٹ رہنے دیں اور پھر comma کی آپشن کو چیک کردیں، الفاظ دو کالمز میں چلے جائیں گے ۔

امید ہے اس سے کچھ تسلی ہوئی ہوگی اور راجہ نعیم بھی بتا چکا ہے اور میں بھی یقین دہانی کرواتا چلوں کہ جب زیادہ ڈیٹا ہو تو فائل کی مدد سے ڈیٹا بیس میں اینٹری کرنا سب سے آسان حل ہوتا ہے اگر کسی کو شک ہے تو وہ اس کے متبادل پر روشنی ڈالے ورنہ باقی سب کو مایوس نہ کرے۔
 

بدتمیز

محفلین
سلام
باقی سب میں ہے ہی کون؟ ہم لوگ جمود کا شکار رہتے ہیں۔ ایک چیز پر تکیہ کر بیٹھتے ہیں۔ آسان ترین راستے ڈھونڈتے ہیں۔
اگر اسی کام کے دوران کچھ لوگ ڈیٹا بیس سیکھ بھی لیں تو کیا حرج ہے؟ کیا یہی سیکھنا اردو ویب یا پھر ان کی ذاتی زندگی میں کہیں کام نہیں آ سکے گا؟ میرے خیال سے تو اسقدر کام آئے گا کہ مجھے دعائیں دیں گے :wink:
میں بھی یہی سوچ رہا تھا کہ کومہ سیپریٹڈ فائل کا ذکر ہو رہا تھا محب نے کومے کہاں غائب کر دئیے۔ :twisted:
خیر مجھے کیا۔ ابھی میں کنارے پر کھڑا کہہ رہا ہوں کہ ایسے نہیں ایسے کرو شاید اس لیے اتنا برا لگ رہا ہے۔ میں چند ذاتی مصروفیت میں گھرا ہوا ہوں۔ لہذا وقت کی کمی کے باعث اس میں ہاتھ نہیں بٹا سکوں گا۔ ورنہ اردو ڈکشنری کا خواب میں 2001 سے دیکھ رہا ہوں۔
 

بدتمیز

محفلین
سلام
شاکر کا کہنا تھا کہ یہ ایک چھوٹا سا پراجیکٹ ہے۔
باقی دوست اس کو بڑا کرتے گئے۔
کچھ لوگ ٹیکنالوجی کی ٹرمز کو بھی اس میں شامل کرنا چاہتے ہیں۔
پھر ایک اس بات پر بھی زور تھا کہ ڈکشنری ایک ہو۔

http://encarta.msn.com/encnet/features/dictionary/dictionaryhome.aspx

میں ایک عرصے سے اس کو استعمال کر رہا ہوں۔ webster بھی پہلے کی تھی لیکن کتابی شکل میں۔ انٹرنیٹ پر اس کو ڈھونڈنے کی کوشش نہیں کی۔ یہ مائیکروسافٹ کی ہے۔ اب نہ جانے اس سے ہم الفاظ لے کر ڈکشنری بنا سکتے ہیں یا نہیں؟ اس سے آدھا کام تو ختم ہو جائے گا۔ صرف کاپی پیسٹ کرنا ہو گا اور لکھنے والا کام صرف اردو رہ جائے گا۔
 

دوست

محفلین
یار یہ انگریزی الفاظ لے کر ان کی اردو ٹائپ کرنا ہے تو کئی آزاد مصدر الفاظ فہرستیں موجود ہیں۔ لیکن کس کے پاس اتنا وقت ہے کہ وہ ایک ایک انگریزی لفظ کی اردو لغات کھول کر تلاشتا رہے۔
کم از کم میں تو ایسا کرنا ہرگز پسند نہیں کروں گا۔
 

نبیل

تکنیکی معاون
السلام علیکم،

میں اس پراجیکٹ کی جانب کچھ توجہ نہیں دے پا رہا۔
کہاں تک پہچا ہے یہ کام؟
میں ابھی کچھ اور کاموں میں مصروف ہوں، ان سے فارغ ہوتے ہی ایک ڈیٹا انٹری اپلیکیشن تیار کرنے پر توجہ دوں گا تاکہ کم از کم ڈیٹا کی کوئی شکل تو بنے۔ آپ لوگ پلیز کچھ روز صبر کریں۔ اگر آپ سے اس کام پر پیشرفت نہیں ہو رہی تو دلبرداشتہ ہونے کی ضرورت نہیں ہے۔
 

دوست

محفلین
فی الحال تو میں ویلا بیٹھا ہوں دو تین دن سے رات کو دیر سے سوتا ہوں اور صبح کچھ کرنے کو دل ہی نہیں کرتا۔ تین سے رات دس تک ٹیوشن اور موج ۔۔
کام کیا خاک ہوگا۔ :roll:
 
بدتمیز نے کہا:
سلام
باقی سب میں ہے ہی کون؟ ہم لوگ جمود کا شکار رہتے ہیں۔ ایک چیز پر تکیہ کر بیٹھتے ہیں۔ آسان ترین راستے ڈھونڈتے ہیں۔
اگر اسی کام کے دوران کچھ لوگ ڈیٹا بیس سیکھ بھی لیں تو کیا حرج ہے؟ کیا یہی سیکھنا اردو ویب یا پھر ان کی ذاتی زندگی میں کہیں کام نہیں
آ سکے گا؟ میرے خیال سے تو اسقدر کام آئے گا کہ مجھے دعائیں دیں گے :wink:
میں بھی یہی سوچ رہا تھا کہ کومہ سیپریٹڈ فائل کا ذکر ہو رہا تھا محب نے کومے کہاں غائب کر دئیے۔ :twisted:
خیر مجھے کیا۔ ابھی میں کنارے پر کھڑا کہہ رہا ہوں کہ ایسے نہیں ایسے کرو شاید اس لیے اتنا برا لگ رہا ہے۔ میں چند ذاتی مصروفیت میں گھرا ہوا ہوں۔ لہذا وقت کی کمی کے باعث اس میں ہاتھ نہیں بٹا سکوں گا۔ ورنہ اردو ڈکشنری کا خواب میں 2001 سے دیکھ رہا ہوں۔


بی ٹی باقی سب میں کچھ لوگ ہیں اور میں کوشش کرکے کچھ لوگوں کو قائل کرنے کی کوشش بھی کر رہا ہوں اور دو تین لوگوں کو قائل کر بھی چکا ہوں۔

آسان ترین راستے والی بات مجھے سمجھ نہیں آئی۔ فائل میں الفاظ کے معنی لکھنا اور ایک اپلیکشن میں الفاظ کے معنی لکھنے میں کتنی مشکل اور کتنی آسانی ہے۔
ڈیٹا بیس سیکھ لینا بہت مفید ہوسکتا ہے مگر یہ دیکھنا ضروری ہے کہ کوئی اس طرف کتنی محنت کر سکتا ہے اور کسی کے پاس کتنا وقت ہے اور کیا وہ کمپیوٹر سے اتنی واقفیت رکھتا ہے کہ وہ ڈیٹا بیس کو سمجھ کر استعمال بھی کر سکے۔

میں اور راجہ نعیم ڈیٹا بیس کا استعمال بہت اچھی طرح جانتے ہیں اور میں اس سلسلے میں عرض بھی کرچکا ہوں کہ فائل کو ڈیٹا بیس میں امپورٹ‌ کرنا بہت آسان عمل ہے اور اس بارے میں کم از کم میرے اور نعیم کے ذہن میں کوئی اشکال نہیں تو پھر وجہ تنازع کہاں ہے۔

کومہ والی غلطی مجھ سے ہوئی تھی اور اس کی تصحیح میں نے کر دی۔ اب اسے آگے لے جانے کے عمل پر بات کرتے ہیں اور میرا خیال ہے بی ٹی کہ تم اس پر کسی صورت میں ساتھ رہو گے ضرور۔
 
الفاظ کی فہرست حاصل کر لینا آسان ہے مگر اصل عمل ان الفاظ کے معنی لکھنے کا ہے اور اگر کوئی آن لائن ایسا ذریعہ ہے جس میں آپ الفاظ کے معنی دیکھ سکتے ہیں اردو میں تو وہ بہت آسان ہے اور میرا خیال ہے اسے ہی استعمال کرنا چاہیے اس سے کام کی رفتار خاطر خواہ تیز رہے گی۔ باقی اگر کوئی سست روی سے بھی کام کرتا ہے تو نہ کرنے سے بہتر ہے۔

میں فی الحال کلین ٹچ والوں کی ڈکشنری استعمال کرکے الفاظ اور معنی کی فہرست بنا رہا ہوں جس میں مجھے لغت میں الفاظ‌ ڈھونڈنے کی ضرورت نہیں پڑتی اور میں ایک تریتب سے الفاظ‌ اور معنی لکھ رہا ہوں۔ باقی جو جس طرح‌ آسانی محسوس کرے وہ کر لے۔

شاکر تمہاری طرف سے اس پر پیش رفت نہ ہونا پریشان کن بات ہے کہ تمہارے بلانے پر میں نے اور کئی لوگوں نے لبیک کہا ہے اور اب تم ہی اس میں سستی دکھا رہے ہو جس سے حوصلہ شکنی ہوگی۔

اب میرا خیال ہے کہ ہمیں لائحہ عمل اور اس سے بھی زیادہ عملی طور پر کون کتنا کام کر رہا ہے یہ دیکھنا پڑے گا اور اس کے لیے چاہے کوئی تھوڑا بھی کام کرنا چاہے تو آگے آئے اور ضرور کرے۔

قطرہ قطرہ کرکے ہی دریا بنتا ہے اور مجھے پورا یقین ہے کہ ہماری محنت ضائع نہیں ہوگی اور کسی پراجیکٹ‌میں ہماری امیدوں سے بڑھ کر کام آئے گی جیسے لغت کے لیے الفاظ‌ کی فہرست کی کانٹ‌ چھانٹ‌ اسپیل چیکر میں کام آئی۔

میں اپنی رپورٹ‌ دیتا چلوں میں نے تقریبا 100 الفاظ کی فائل بنا لی ہے :lol: باقی لوگ اس سے کچھ تقویت پکڑیں۔
3-4 بندوں پر میں کام کر رہا ہوں اور ذرا یہ کام چل پڑے تو میں یقین دلاتا ہوں کہ میں ذاتی کوشش سے اس پراجیکٹ‌ میں کم از کم 10 لوگوں کو ضرور شامل کر لوں گا اور یہ قافلہ آگے بڑھتا ہی جائے گا رکے گا نہیں۔ بس ضرورت ہے ثابت قدمی کی۔

نبیل ، تمہارا بہت شکریہ اور یار حوصلہ دیتے رہو اور کچھ میری پوسٹس پر تجزیہ بھی کردو تاکہ باقی لوگوں کو بھی یقین آئے کہ میں اتنا غلط نہیں کہہ رہا :wink:
 
Top