پیغام کا نچوڑ Message Digest

محسن حجازی

محفلین
یہ غالبا کرپٹوگرافی میں استعمال ہوتا ہے۔ کسی بھی متن کا اگر میسیج ڈائجسٹ نکالا جائے تو وہ ایک یونیک نمبر ہوگا۔ اگر متن میں ایک حرف بھی تبدیل ہوا تو اس کا Message Digrest پہلے سے بالکل مختلف ہو جائے گا۔ اس طرح متن میں ہونے والی تبدیلی کا فوری پتہ لگایا جا سکتا ہے۔
یہاں Message Digest کے الگورتھم نمبر پانچ کو بیان کیا گيا ہے۔
http://en.wikipedia.org/wiki/MD5
 
پیغام کا نچوڑ:

میسیج ڈائجسٹ کا ایک مفہوم اور ہے جو کہ محسن حجازی بھائی کے بیان کے علاوہ ہے۔

آپ کو یاد ہوگا کہ ہم نے ٹیکسٹ مائننگ پر بحث کے دوران ڈاٹا کلیننگ، ٹرم فریکوئینسی جیسے موضوعات پر بات کی تھی۔ انھی خطوط پر کچھ ایڈوانسڈ ٹولز ڈیویلوپ کئے گئے ہیں جو ان پٹ متن کی پوسٹ ٹیگننگ کرتے ہیں (جس سے الفاظ کے جملے میں نحوی حیثیت کا پتہ چل جاتا ہے)، اس سے سٹاپ ورڈس کو ہٹاتے ہیں، ٹرمس کی فریکوئنسی کاؤنت کرتے ہیں اور اسکی بنیاد پر ڈاکیومینٹ کس زمرے سے متعلق ہے یہ اندازہ کرتے ہیں۔ اس کے بعد انہیں الفاظ سے گرامر کی بنیاد پر سمپل سینٹینسز (عام جملے) بنائے جاتے ہیں۔ اور اس طرح پورے متن کی سمری (خلاصہ) دستیاب ہو جاتا ہے۔

ایسے کچھ تولز دستیاب بھی ہیں۔ ٹیکسٹ سمرائزر لکھ کر گوگل کریں۔
ایک ویب سائٹ تھی سار ڈاٹ کام نام سے پر وہ اب کھلتی نہیں ہے۔ اس میں سرچ ٹرمس کا گوگل سرچ رزلٹ آتا تھا۔ اور ہر لنک کے بیان (ڈیسکرپشن) پر ماؤس لانے پر اس سائٹ پر موجود ڈاکیومینٹ کی سمری مل جاتی تھی۔ :)

--
سعود ابن سعید
 
یہ غالبا کرپٹوگرافی میں استعمال ہوتا ہے۔ کسی بھی متن کا اگر میسیج ڈائجسٹ نکالا جائے تو وہ ایک یونیک نمبر ہوگا۔ اگر متن میں ایک حرف بھی تبدیل ہوا تو اس کا Message Digrest پہلے سے بالکل مختلف ہو جائے گا۔ اس طرح متن میں ہونے والی تبدیلی کا فوری پتہ لگایا جا سکتا ہے۔
یہاں Message Digest کے الگورتھم نمبر پانچ کو بیان کیا گيا ہے۔
http://en.wikipedia.org/wiki/md5

ایک تصحیح فرما لیں کہ ڈائجسٹ اسٹرنگ یونیک (بے مثل) نہیں ہوتی۔ کئی پیغامات کے ڈائجسٹ یکساں ہو سکتے ہیں۔ ہاں اس کے خواص میں یہ بات شامل ہے کہ اس کی طوالت ہمیشہ فکسڈ ہوتی ہے خواہ ان پٹ اسٹرنگ کتنی بھی قصیر یا طویل رہی ہو۔

پر ایسے اتفاق انتہائی شاز ہوتے ہیں کہ دو ٹیسٹ ان پٹ کا ڈائجسٹ یکساں مل جائے۔

ڈائجسٹ کو ریورس نہیں کیا جا سکتا (یعنی ڈائجسٹ سے دوبارہ پیغام حاصل نہیں کیا جا سکتا)۔ بلکہ کسی پیغام کا اسی میکانزم سے ڈائجسٹ نکال کر دونوں ڈائجسٹس کا موازنہ کیا جا سکتا ہے۔ اس لئے یہ عموماً ویب سائٹوں پر پاسورڈ اسٹور کرنے اور آتھینٹیکیٹ کرنے کے کام آتا ہے۔ اس کے علاوہ انٹیگرٹی چیک کے لئے بھی استعمال ہوتا ہے (جو کہ حجازی بھائی نے بیان کیا)۔

اسے کریک کرنے کے لئے اب تک دستیاب ترکیبوں میں بروٹ فورس میتھڈ کے علاوہ کوئی بھی کامیاب نہیں ہے۔ پر بروٹ فورس بہت وقت طلب ہے۔ جو کہ ایک ایک کرکے مختلف ان پٹ دیتا رہتا ہے اور اس کے ڈائجسٹ کا موازنہ درکار ڈائجسٹ سے کراتا رہتا ہے۔ یہ سلسلہ تب تک جاری رہتا ہے جب تک یکساں ڈائجسٹ نہ مل جائے۔ اور اس طرح اس وقت کا ان پٹ اسٹرنگ ایک ممکنہ میسج تصور کر لیا جاتا ہے۔۔ واضح رہے کہ اگر اس پروگرام کو دیر تک چلایا جائے تو مزید ایسے میسیج دستیاب ہو جائیں گے جن کا ڈائجسٹ وہی ہو۔

ایم ڈی 5 میں غالباً یہ 128 بائٹ کا جب ایس ایچ اے ون سَم میں 160 بائٹ۔ (تعداد میں میری یاد داشت غلط ہو سکتی ہے۔ اسے کنفرم کر لیں۔)
 

الف نظامی

لائبریرین
بنیادی طور پر یہ hashing algorith ہے جس میں Collision ممکن ہے۔ ایم ڈی 5 میں پیغام کا نچوڑ 128 بٹ کا ہوتا ہے۔
کسی مسل کی integrity چیک کرنے کے لیے بھی اس کو استعمال کیا جاتا ہے۔
انٹی وائرس تجزیہ کرنے والوں کے پاس کلین سسٹم مسلوں کے md5 ھیش کا ڈیٹابیس ہوتا ہے جس کی مدد سے وہ تبدیل شدہ سسٹم مسلوں کا پتہ لگا سکتے ہیں۔
 
Top