مصنوعی ذہانت کا ایک اور سنگ میل، گوگل کے الفا گو پروگرام کی گو چیمپین کوشکست

شطرنج میں اے آئے ایلگردھمز پر مبنی اینجن لیلا چیس متواتر اصولوں پر لکھے گئے اسٹاکفش سے شکست در شکست کھائی جا رہا ہے. مصنوعی ذہانت ایک مارکٹنگ کی اصطلاح ہے، نیورل نیٹورکس میں ذہانت نام کی کوئی شے نہیں ہے، ان کے لیے 'بہت بڑے تکے' کی اصطلاح زیادہ مناسب ہے.
 
آخری تدوین:

الف نظامی

لائبریرین
کیا ری انفورسمنٹ لرننگ کو ذہین کہہ سکتے ہیں جب کہ اس میں ایجنٹ اور انوائرنمنٹ کا تصور ہے جو کہ نیورل نیٹ ورکس میں نہیں ہے ؟
ویسے گو گیم ، شطرنج تو نہیں ہے۔
 
آخری تدوین:
مایوس کن کیسے جب سٹاکفش ابھی بھی جیت رہا ہے؟
اچھی بھلی کلیسیکل اویلیوایشن نکال کر انھوں نے نیورل نیٹورک ڈال دیا ہے، مجھے تو یہ چیز مایوس کن ہی لگ رہی ہے. نیورل نیٹورکس کا مسئلہ یہ ہے کہ ان کے بارے میں یہ نہیں کہا جا سکتا کہ وہ کس اصول کے تحت کام کرتے ہیں.
 

الف نظامی

لائبریرین
نیورل نیٹورکس کا مسئلہ یہ ہے کہ ان کے بارے میں یہ نہیں کہا جا سکتا کہ وہ کس اصول کے تحت کام کرتے ہیں.
نیورل نیٹ ورک کسی میتھیمیٹیکل فنکشن کو اپراکسیمیٹ کرتا ہے جب اس کو ڈیٹا یعنی ڈمین اور رینج کے ڈیٹا پوائنٹس فراہم کیے جاتے ہیں۔

اب آپ چیس یا گو گیم کھیلنے کو ایک فنکشن ایف تصور کریں جس میں ڈومین پر چال اور رینج پر جوابی بہترین چال موجود ہو۔
چال اور جوابی چال کو نمبر کی شکل میں تبدیل کرنا ضروری ہے چوں کہ فنکشن کی ڈومین اور رینج کا تعلق نمبروں سے ہے۔

تو چال اور جوابی بہترین چال کا ڈیٹااکٹھا کر کے نیورل نیٹ ورک کو ٹرین کرنے کا مطلب یہ ہے کہ نیورل نیٹ ورک اس فنکشن ایف کو اپراکسیمیٹ کر دے گا۔
اوراس ٹرین شدہ نیورل نیٹ ورک کو جب ایک چال فراہم کی جائے گی تو وہ جوابی بہترین چال بتا دے گا۔

متعلقہ: کمپیوٹیشنل گراف
 
آخری تدوین:
نیورل نیٹ ورک کسی میتھیمیٹیکل فنکشن کو اپراکسیمیٹ کرتا ہے جب اس کو ڈیٹا یعنی ڈمین اور رینج کے ڈیٹا پوائنٹس فراہم کیے جاتے ہیں۔

اب آپ چیس یا گو گیم کھیلنے کو ایک فنکشن ایف تصور کریں جس میں ڈومین پر چال اور رینج پر جوابی بہترین چال موجود ہو۔
چال اور جوابی چال کو نمبر کی شکل میں تبدیل کرنا ضروری ہے چوں کہ فنکشن کی ڈومین اور رینج کا تعلق نمبروں سے ہے۔

تو چال اور جوابی بہترین چال کا ڈیٹااکٹھا کر کے نیورل نیٹ ورک کو ٹرین کرنے کا مطلب یہ ہے کہ نیورل نیٹ ورک اس فنکشن ایف کو اپراکسیمیٹ کر دے گا۔
اوراس ٹرین شدہ نیورل نیٹ ورک کو جب ایک چال فراہم کی جائے گی تو وہ جوابی بہترین چال بتا دے گا۔

متعلقہ: کمپیوٹیشنل گراف
میری بات کا یہ مطلب ہرگز نہیں تھا کہ مجھے نیورل نیٹورکس کی تھیوری معلوم نہیں.
نیورل نیٹورکس میں ہر نیورون ہی ایک خاصا پیچیدہ ملٹی دمنشنل فنکشن ہوتا ہے اور ہر نوڈ پر کچھ کامپیوٹیشن ہوتی رہتی ہے. لیکن یہ کہنا کہ یہ نیٹورک ہمیشہ جوابی بہترین چال دے گا ناممکن ہے، ہاں جن چالوں پر یہ ٹرین کیا گیا ہوگا اس پر یہ یقینی طور پر کام کرے گا لیکن اس کا درست جواب دینا بھی اس کے درست ہونے کی دلیل نہیں ہو سکتا.
 

الف نظامی

لائبریرین
میری بات کا یہ مطلب ہرگز نہیں تھا کہ مجھے نیورل نیٹورکس کی تھیوری معلوم نہیں.
نیورل نیٹورکس میں ہر نیورون ہی ایک خاصا پیچیدہ ملٹی دمنشنل فنکشن ہوتا ہے اور ہر نوڈ پر کچھ کامپیوٹیشن ہوتی رہتی ہے. لیکن یہ کہنا کہ یہ نیٹورک ہمیشہ جوابی بہترین چال دے گا ناممکن ہے، ہاں جن چالوں پر یہ ٹرین کیا گیا ہوگا اس پر یہ یقینی طور پر کام کرے گا لیکن اس کا درست جواب دینا بھی اس کے درست ہونے کی دلیل نہیں ہو سکتا.
جی بالکل یہ اپراکسیمیٹ جواب ہوگا۔
اگر ہم گو گیم کی ممکنہ بورڈ کنفیگریشنز دیکھیں تو وہ بہت زیادہ ہیں بحوالہ ویڈیو 8:22 تا 8:45 لہذا بہترین چال کو سرچ کرنا کمپیوٹیشنلی انٹینسیو ہے جب کہ نیورل نیٹ ورک اپراکسیمیٹ جواب کے لیے اس قدر وقت نہیں لیتا اس لیے نیورل نیٹ ورک کا استعمال کیا گیا۔ جس میں 30 ملین چالوں کے ڈیٹا سے نیورل نیٹ ورک کو ٹرین کیا گیا اس کے بعد ری انفورمنٹ لرننگ کے ذریعے اس ٹرینڈ سسٹم کا آپس میں مقابلہ کروا کر مزید طاقتور بنایا گیا۔
متعلقہ:
الفا گو الگورتھم
AlphaGo: How it works technically?

 
آخری تدوین:
Top