اردو حروف کا تعدد

الف نظامی

لائبریرین
کیا کسی نے اردو متن سے اردو حروف کا تعدد frequency معلوم کیا ہے؟
اسی طرح دو حرفی ترسیمہ جات کا تعدد۔
 

نبیل

تکنیکی معاون
ایک مرتبہ امانت علی گوہر نے حروف کا تعدد معلوم کرنے کے لیے ایک سکرپٹ‌ لکھی تھی۔ میرے خیال میں اس طرح کا پروگرام لکھنا زیادہ مشکل نہیں ہونا چاہیے۔ وکی پیڈیا پر مجھے حروف کے تعداد پر مضمون میں ذیل کے ربط پر ایک پروگرام نظر آیا ہے:

Java-Application for building letter frequencies out of a text file

یہ پروگرام جاوا میں لکھا گیا ہے اور کسی ٹیکسٹ‌ فائل میں موجود حروف کے اعداوشماد کا حساب لگاتا ہے۔ اس پروگرام کی executable اور اس کا سورس ایک ہی jar فائل میں موجود ہیں؟
 

الف نظامی

لائبریرین
جی نبیل پروگرام اتنا مشکل نہیں، لیکن متن زیادہ ہونا چاہیے تاکہ تعدد بہتر طور معلوم ہوسکے۔ شاید محسن حجازی نے اس تعدد کی بنیاد پر کوئی کلیدی تختہ تشکیل دیا تھا، ان کی رائے کا انتظار ہے۔
حرفی تعدد کے استعمالات:
تعدد پر مبنی کلیدی تختہ کی تیاری
کرپٹ انلاسسز cryptanalysis
ترسیمہ جات کے تعدد پر مبنی فانٹ کی تیاری؟

اگر اس کے علاوہ حرفی تعدد کا کوئی ممکنہ استعمال آپ کے ذہن میں ہے تو براہ کرم بتایئے۔
 

نبیل

تکنیکی معاون
مجھے جہاں تک یاد پڑتا ہے، محسن نے اردو کے الفاظ میں ترسیمہ جات کی لمبائی سے متعلق اعدادوشمار اکٹھے کرنے کے لیے ایک پروگرام لکھا تھا۔ ان کے تجزیہ کے مطابق سب سے لمبا ترسیمہ لفظ 'نستعلیقیات' میں پایا جاتا ہے۔ یہ لفظ ان کا اپنا اختراع کردہ ہے۔ باقی تفصیل وہ خود بتائیں گے۔
 

محسن حجازی

محفلین
جی ہاں میں نے ایک سادہ سا پروگرام سی پلس پلس میں لکھا تھا وہ پڑا بھی ہوا ہے میں ارسال کر دیتا ہوں اس کی مدد سے میں نے دو سو ایم بی متن میں ترسیمہ جات کے تعدد کی پڑتال کی تھی۔
 

نبیل

تکنیکی معاون
محسن، اگر ہو سکے تو اس پروگرام سے حاصل ہونے والے اعداد و شمار بھی فراہم کر دو۔ اور یہ دو سو ایم بی متن تمہیں کہاں سے مل گیا تھا؟
 
Top