ہونٹوں کی حرکت سے کمپیوٹر آپ کی بولی جانے والی زبان کو شناخت کر سکتا ہے

محمدصابر · اپریل 25، 2009

University of East Anglia کے سائنسدانوں نے ہونٹوں کی حرکت سے زبان شناخت کرنے میں کامیابی حاصل کر لی۔ دو اور تین زبانیں بولنے والے تیس لوگوں پر مشتمل ٹیم پر تجربات کرتے ہوئے کمپیوٹر نے انتہائی درستگی کے ساتھ زبان کی شناخت کی۔ زبانوں میں English, French, German, Arabic, Mandarin, Cantonese, Italian, Polish and Russian. شامل ہیں۔
تفصیل

نبیل · اپریل 25، 2009

واہ کیا بات ہے، ابھی سپیچ ریکگنیشن پر تحقیق کی صحیح پیشرفت نہیں ہو پائی ہے دوسری جانب ہونٹوں کی جنبش سے ہی الفاظ اور زبان کی شناخت ہونے لگی ہے۔

arifkarim · اپریل 25، 2009

نبیل نے کہا:
واہ کیا بات ہے، ابھی سپیچ ریکگنیشن پر تحقیق کی صحیح پیشرفت نہیں ہو پائی ہے دوسری جانب ہونٹوں کی جنبش سے ہی الفاظ اور زبان کی شناخت ہونے لگی ہے۔

میرے خیال میں شاید کمپیوٹر انجنز کیلئے لپ سنکنگ کرنا زیادہ آسان ہوگا بنسبت آواز کے۔ کیونکہ ہر شخص کی آواز اور بولنے کے انداز میں قدرے فرق ہوتا ہے ۔ یو ں نتائج کی بہتری پری ریکارڈڈ سیمپلز پر منحصر ہے۔
اسکے برعکس لپ سنکنگ میں صرف ہونٹوں کی جنبش سے ہی بغیر آواز کو خاطر لائے درست زبان شناخت ہو جاتی ہے!

زیک · اپریل 26، 2009

ان کا پیپر Automatic Visual-only Language Identification: A Preliminary Study سگنل پراسیسنگ کی مشہورترین کانفرنس ICASSP میں ابھی بدھ کو پیش کیا گیا ہے۔ اس پیپر کا متن تو آن‌لائن نہیں ملا مگر یہ دو لنک بھی مفید ثابت ہوں‌گے۔ ابھی میں‌نے پڑھا نہیں، پڑھنے کے بعد ہی کچھ تکنیکی تبصرہ کر سکتا ہوں۔

محمدصابر · اپریل 26، 2009

شکریہ زیک۔ کل میں نے اس سائٹ کو وزٹ کیا تھا لیکن مجھے بھی پیپر نہیں ملا۔ میرا خیال ہے کہ یہ موشن سینسنگ اور فنگر پرنٹ ریکگنیشن یا فیس ریکگنیشن جیسی ٹیکنالوجی کو ملا کر کچھ بنایا گیا ہے۔ میرا خیال ہے کہ اس پر کام بہت مشکل ہو گا کیونکہ ہر بندہ اپنے سگنیچر کے ساتھ بولتا ہے۔

نبیل · اپریل 26، 2009

کچھ پُتلوں کا تماشہ دکھانے والے منہ بند کرکے بولنے کے ماہر ہوتے ہیں۔ اب اس فن کے ماہروں کی قدر بڑھ جائے گی۔

فرخ منظور · اپریل 26، 2009

نبیل نے کہا:
کچھ پُتلوں کا تماشہ دکھانے والے منہ بند کرکے بولنے کے ماہر ہوتے ہیں۔ اب اس فن کے ماہروں کی قدر بڑھ جائے گی۔

یہ کام تو میں بھی کر لیتا ہوں۔ لیکن میری قدر تو وہیں کی وہیں ہے۔

محمدصابر · اپریل 26، 2009

سخنور بھائی ۔ کیا کر لیتے ہیں؟ پتلی تماشا یا بند منہ سے آواز نکالنا؟

دوست · اپریل 27، 2009

خاصا مشکل کام لگتا ہے ہونٹوں کی حرکت سے آواز کو شناخت کرنا۔

zerocool · اپریل 27، 2009

لگتا ھے انہوں نے پشتو نہیں چیک کی ھو گی۔

زیک · اپریل 27، 2009

Audio-visual speech recognition پر کافی کام ہو چکا ہے۔ اگرچہ زیادہ‌تر ویڈیو کو noisy environments میں آڈیو سپیچ سمجھنے میں بہتری کے لئے استعمال کیا جاتا ہے نہ کہ اکیلے ویڈیو کو۔ کچھ تھیسس میں نے پڑھے ہیں جن میں صرف ہونٹوں کی حرکت سے سپیچ سمجھنے کی کوشش کی گئ ہے مگر اس کی کارکردگی audio speech recognition کے مقابلے کی نہیں۔

یہاں یہ ریسرچرز امیج ماڈلز کو استعمال کرتے ہوئے سپیچ کی بجائے زبان دریافت کرنا چاہتے ہیں۔ اس کے لئے وہ bigrams کا استعمال کر رہے ہیں۔ bigrams اور trigrams زبان کی identification (ٹیکسٹ کی صورت میں) میں کافی عام ہے۔

یہ ایک preliminary سٹڈی ہے۔ ریسرچرز کا کہنا ہے کہ ہونٹوں کے فیچر speaker-dependent ہیں۔ لہذا یہ language identification بھی speaker-dependent ہے۔

مگر کافی مزے کی ریسرچ ہے۔

ہونٹوں کی حرکت سے کمپیوٹر آپ کی بولی جانے والی زبان کو شناخت کر سکتا ہے

محمدصابر

محفلین

نبیل

تکنیکی معاون

arifkarim

معطل

زیک

مسافر

محمدصابر

محفلین

نبیل

تکنیکی معاون

فرخ منظور

لائبریرین

محمدصابر

محفلین

دوست

محفلین

zerocool

محفلین

زیک

مسافر