اردو لغت اور تھیسارس۔ اب تک کی ترقی کا حال

آصف

محفلین
مختصراً اردو انگریزی لغت کی اب تک کی ترقی کا حال لکھتا ہوں:

یہ لغت بیک وقت اردو-انگریزی اور انگریزی-اردو لغت کا کام کرے گی جو لغات کے اعتبار سے ایک نسبتاً منفرد طریقہ ہے۔ اس کا خیال مجھے پچھلے سال اس وقت آیا تھا جب میں نے نئی نئی LEO استعمال کرنا شروع کی۔ ہماری لغت کا اسلوب انشاءاللہ کچھ اسطرح سے ہوگا:

مثلاً کسی نے "رفتار" تلاش کیا:

اردو - - - - - - - - - - - - - - - انگریزی

رفتار (اسم) - - - - - - - - - - - - - - - Speed
رفتار(اسم) - - - - - - - - - - - - - - -Velocity
رفتار (اسم) - - - - - - - - - - - - - - -Rapidness
تیز رفتار (صفت) - - - - - - - - - - - - - - Rapid
تیز رفتار (صفت) - - - - - - - - - - - - - - Speedy
رفتار پکڑنا (فعل لازم) - - - - - - - - - - - - - -To speed up
اور مثالیں وغیرہ۔ ان میں سے ہر لفظ ایک ربط ہو گا تاکہ صارف کسی بھی لفظ کا ترجمہ دیکھ سکے۔

اس کیلئے میں نے تقریبا 8 جدولوں پر مشتمل ڈیٹا بیس بنائی ہے جو مختلف تعلقات کے ذریعے ایکدوسرے سے جڑے ہوئے ہیں۔ لغت کے اصل جدول میں صرف تین کالم ہیں۔ آئی ڈی کے علاوہ اس میں اردو اور انگریزی کی آئي ڈی ہیں۔ باقی ساری معلومات مثلاً parts of speech, conjugation وغیرہ دوسرے جداول میں ہیں۔

اردو کیلئے ہم محفل کے ٹیکسٹ کو استعمال کرتے ہوئے تقریبا 55 ہزار الفاظ کی فہرست مرتب کر چکے ہیں جو اس وقت تصحیح کے مراحل میں ہے۔

انگریزی کے لئے میں نے بہت سی کھلے مصدر کی لغات دیکھیں۔ WordNet والوں کی ڈیٹابیس اچھی ہے لیکن اس میں حروف (particles) شامل نہیں ہیں اگرچہ ایک دو دن لگا کر میں نے اسے اپنے سانچے میں تقریبا ڈھال ہی لیا تھا۔ پھر میں نے Moby کے الفاظ کی فہرست لی اور کچھ pre-processing کے بعد ان کے parts of speech علیحدہ کر لئے۔ اب میں نے تقریبا دو لاکھ انگریزی الفاظ اپنی لغت میں شامل کر لئے ہیں۔ جن میں سے ہر لفظ کی نحوی حالت (parts of speech) بھی محفوظ کر لئے ہیں۔ لغت کا بنیادی ڈھانچہ تیار ہے۔ البتہ تدوین کی سہولت دینے کیلئے پروگرامنگ باقی ہے جس پر میں کام کر رہا ہوں۔
مجھے اس موقع پر پورے اردو ویب کی امداد درکار ہے۔ ہمارے سامنے مندرجہ ذیل کام ہیں۔
1۔ اردو الفاظ کی بقیہ فہرستوں کی جلد از جلد تصحیح۔ براہِ مہربانی اس کام میں میرا ساتھ دیں۔ آپ کے چند گھنٹے اردو زبان کی لغت کے وجود میں آنے کا سبب بنیں گے جس کی اہمیت روزِ روشن کی طرح عیاں ہے۔
2۔ ان فہرستوں کی کم از کم مندرجہ ذیل پانچ نحوی حالتوں میں تقسیم:
(ا) اسم
(ب) فعل (فی الحال ہم لازم اور متعدی کی تفصیل میں نہیں جاتے)
(ج)اسم صفت (انگریزی میں Adjective کی اہمیت کو دیکھتے ہوئے اس کا اسم سے علیحدہ کرنا ضروری معلوم ہوتا ہے)
(د)حرف (بقیہ سب کچھ منجملہ ضمائر، حروفِ علت، ربط، فجائیہ وغیرہ)
(س) امثلہ (مثالیں یعنی محاورات، ضرب الامثال وغیرہ)
یہ کام آپ تصحیح کے وقت ہی کرسکتے ہیں۔ یا تصحیح شدہ فائلوں پر بھی۔
کرنا صرف یہ ہے کہ ہر لفظ یا مرکب کے بعد "_" ڈال کر (ا)سم ، (ف)عل،(ص)فت، (ح)رف، یا م(ث)ال میں سے قوسین کے اندر والا ایک حرف لکھنا ہے۔ اس سے تقسیم نحوی بھی (فی الحال) مکمل ہو جائے گی۔
3۔ اس سارے ڈیٹا کا لغت میں ڈالنا اور ایسا انٹرفیس تشکیل دینا کہ محفل کے صارفین یا چند منتخب لوگ اردو اور انگریزی الفاظ کو آپس میں لِنک کر سکیں۔ میرے ذہن میں کچھ آئیڈیاز آچکے ہیں اور میں نے ان پر کام شروع کر دیا ہے۔

اس وقت جبکہ میں اپنے پروگرامنگ والے کام میں مصروف ہوں، مجھے آپ سے قدم نمبر ایک اور دو کیلئے امداد درکار ہے۔ دوست، اعجاز صاحب، اور محب کا شکریہ لیکن مجھے مزید کمک کی ضرورت ہے۔

تصحیح کیلئے فائلوں کی تفصیل یہاں دستیاب ہے۔

اردو لغت کا اب تک کا پیش منظر:
 

Attachments

  • urdudictionary_129.jpg
    urdudictionary_129.jpg
    204.7 KB · مناظر: 431
آصف اس اہم اور بہترین کام کی جتنی تعریف کی جائے وہ کم ہے۔ میں اب اور تندہی سے اس کام کے لیے آپ کے ساتھ شامل ہو جاؤں گا۔ میں نے ایک رضاکار کو آمادہ کیا ہے جن کا نام توصیف ہے اس کے ساتھ دو تین اور رضاکار بھی لے کر آتا ہوں تاکہ اس کام پر تیز رفتاری سے کام کیا جاسکے۔

میری تجویز ہے کہ اگر آپ ساتھ ساتھ لغت کی تصویری شکل (انٹرفیس ) بھی دکھاتے جائیں تو ایک تو شوق بھی بڑھے گا دوسرا تجاویز بھی آسکیں گی۔ ویسے ماشاءللہ جتنی عمدہ تجاویز اور خیالات پیش کیے ہیں اگر یہ ہم جلد از جلد شامل کرسکیں لغت میں تو اتنی بڑی خدمت ہوجائے گی جس کا صرف اندازہ ہی کیا جاسکتا ہے حقیقی طور پر نہیں بتایا جاسکتا۔

میں مہوش ، شگفتہ ، رضوان ، افتخار ، شمشاد ، فریب ، ماورا ، نعمان ، راجہ نعیم، اظہر الحق ، فرید سے دست بستہ گزارش کرتا ہوں کہ وہ آگے آئیں ، اس کارخیر میں حصہ ڈالیں اور ثوابِ‌ دارین حاصل کریں۔

فرذوق سے میں گزارش نہیں کررہا بلکہ بتا رہا ہوں کہ بھائی تم تو کام شروع کرنے والے بنو :lol:
 

مہوش علی

لائبریرین
آصف،
آپ کا یہ پروجیکٹ دیکھ کر انتہا کی خوشی ہوئی ہے۔ ویب کے لیے LEO ڈکشنری ابتک مجھے سب سے بہتر دکھائی دی ہے۔

آصف، کیا یہ ممکن ہے کہ مستقبل کی اس ارو لغت کو ایسے سوفٹ ویئر کا رنگ دیا جا سکے کہ بغیر آنلائن ہوئے بھی اسے استعمال کا جا سکے؟

نیز، اعجاز صاحب شاید مستقبل میں اس میں ہندی کو بھی شامل کرنا چاہیں ( یا پھر مستقبل میں علاقائی زبانوں کو ترویج دینے کے لیے شاید ہمیں ہی انگلش کے ساتھ ساتھ پنجابی، سندھی، پشتو۔۔۔ وغیرہ شامل کرنا پڑیں)۔ اسی طرح جرمن، فرنچ، عربی اور فارسی بھی اس کا حصہ ہو سکتے ہیں۔

تو کیا آپ کے اس سوفٹ ویئر میں یہ ممکن ہو گا کہ نئی لغات اس کا حصہ بن سکیں؟

آپ نے بنیاد رکھ دی ہے۔ اب میں کوشش کرتی ہوں کہ خود بھی اس کے لیے وقت نکالوں اور رضاکار حضرات کو بھی پکڑوں۔ میری دانست میں یہ شاید اس وقت سب سے اہم پروجیکٹ ہے۔

مزید براں، آپ ایسا کریں کہ آپ نے اوپر جو بیان کیا ہے کہ فائلز کی پانچ کیٹیگریز میں تقسیم۔۔۔۔ تو آپ اس کی ایک Sample File بھی یہاں اپلوڈ کر دیں (اگر ممکن ہو سکے)۔
 

دوست

محفلین
ماشاءاللہ آصف بھائی نے آتے ہی بہت اچھا کام شروع کیا ہے ان کی جتنی بھی تعریف کی جائے کم ہے۔
میں نے حسب ہمت ہاتھ بٹانے کی کوشش کی ہے ۔ اب کام کچھ رکا ہوا ہے۔ورنہ آج میرا ارادہ ایک اور فائل چڑھانے کا تھا۔ تاہم مصروفیت کی وجہ سے ایسا نہ ہوسکا۔
تاہم دوست اس کی طرف آئیں۔
یہ بہت اہم پراجیکٹ ہے۔ اس کی ڈیٹا بیس کل کو اردو اوپن آفس کی بنیاد بھی بن سکتی ہے۔کسی بھی اردو ایڈیٹر میں اس کو بطور لغت استعمال کیا جاسکتا ہے۔
اس لیے اس کام میں ہاتھ بٹائیے۔ میں تو خوش خوش بیٹھا تھا تھوڑا سا کام ہے کام کا تو اب پتہ چلا ہے اور لگ پتا جائے گا کرتے ہوئے۔
مگر ہمت ہو تو سب آسان ہوجاتا ہے۔ اسلیے قدم بڑھائیے اللہ نے چاہا تو جلد ہی یہ پراجیکٹ بھی چلنے کیا دوڑنے لگے گا۔
 

اعجاز

محفلین
پاکستانی گورنمنٹ نے اردو لغت بنانے کا کام کرلپ کے ساتھ شروع کیا ہوا ہے اورhttp://crulp.org/oud/default.aspx یہ کام اب تکمیل کی طرف گامزن ہے۔
لیکن یہ ایک کافی اچھا آغاز ہو سکتا ہے کیونکہ اوپن سورس ایک ضرورت ہے۔
 

الف عین

لائبریرین
آصف۔ یہ فائل میں کل شام کو ہی کر چکا تھا اور سوچا کہ گھر سے پوسٹ کر دوں گا لیکن گھر میں رات دیر تک انٹر نیٹ آتا جاتا رہا اور میں پوسٹ نہیں کر سکا اور صبح پہلے بھول گیا، اب پوسٹ کر رہا ہوں۔
 

مہوش علی

لائبریرین
کیا آپ لوگوں کی نظر سے یہ ڈکشنری گذری ہے

ویبسٹر لغت

یہ لوگ بھی اچھا کام کر رہے ہیں، مگر افسوس کہ یہ اوپن سورس نہیں ہے۔
مگر یہاں سے کچھ نہ کچھ مدد ضرور سے حاصل کی جا سکتی ہے۔ مثال کے طور پر کئی الفاظ پر مشتمل اصلاحات وغیرہ کے متعلق آئیڈیا وغیرہ۔
 

آصف

محفلین
اعجاز صاحب فائل کا شکریہ۔
جہاں تک کرلپ کا تعلق ہے تو وہ بنیادی طور پر اردو-اردو لغت ہے۔
البتہ ویبسٹر والا ربط امید ہے کافی کام آئے گا۔
 
Top