اردو صوتیات

الف نظامی

لائبریرین
یہ موضوع اس پر غور کرنے کے لیے کھولا گیا ہے تاکہ معلوم کیا جاسکے کہ اردو بول چال میں استعمال ہونے والی ممکنہ مفرد آوازیں کون سی ہیں جن سے مل کر تمام اردو الفاظ کی آوازیں بن سکیں۔
یہ ایسے ہی ہے جیسے اردو کے حروف تہجی کا سیٹ ، جن سے مل کر تمام الفاظ بنتے ہیں۔
ہوسکتا ہے مستقبل میں اس بحث کا کوئی مفید اطلاق سامنے آسکے۔
 

نبیل

تکنیکی معاون
تم شاید اسی لیے اردو الفاظ میں حروف کا تعدد معلوم کرنا چاہ رہے ہو۔ اس سلسلے میں پہلے سے کی گئی تحقیق پر نگاہ ڈالنا مفید ثابت ہو سکتا ہے۔ کرلپ والوں نے ایک مرتبہ Speech Recongnition پر کام کیا تھا لیکن اردو Text-to-Speech Synthesis پر ابھی تک کوئی کام نہیں ہوا ہے۔ مجھے گوگل پر اس سلسلے میں کچھ روابط ملے ہیں جنہیں میں یہاں پیش کر رہا ہوں:

Phonemic Inventory of Sindhi and Acoustic Analysis of Voiced Implosives
Bi-Lingual Text to Speech Synthesis System for Urdu and Sindhi
Phonological Processing for Urdu Text to Speech System
An Urdu Newspaper Reader. Key to an Urdu Newspaper Reader
 

دوست

محفلین
انگریزی میں‌ 44 فونِیمز ہیں۔ Phoneme ایک آواز کو کہتے ہیں جیسے آ، ای، اے وغیرہ۔
اردو کی آوازیں کتنی ہیں یہ کرلپ والے ہی بتا سکتے ہیں جنھوں نے اس پر تحقیق کررکھی ہے۔ آوازوں میں vowels اور consonants دونوں مل کر کل تعداد تشکیل دیں گے۔ اردو کے واؤلز دو طرح کے ہیں سادہ جیسے آ اور ناک میں بولے جانے والے جیسے آں۔ بیس کے قریب ہیں شاید کبھی سنا تھا اور باقی کانزونینٹ ب کی آواز، پ کی آواز وغیرہ۔ مجھے اردو کی آوازوں کے سلسلے میں کوئی ربط نہیں مل سکا گوگل سے۔ مزے کی بات یہ ہے کہ انگریزی کی اچھی لغات جیسے آکفسورڈ ایڈوانسٹد لرنر ڈکشنری کے شروع میں انگریزی کی آوازوں کا چارٹ موجود ہوتا ہے۔ ہمارے ہاں ابھی تک کسی کو پتا ہی نہیں کہ یہ ہوتا کیا ہے۔ اگر ہے تو اس کی اشاعت کا اہتمام نہیں کیا گیا۔
 

الف نظامی

لائبریرین
نبیل روابط پوسٹ کرنے کا شکریہ۔
میرے خیال میں اردو حروف تہجی کا ہر حرف تمام ممکنہ حرکات (زیر ، زبر پیش) کے ساتھ تین مفرد آوازیں پیدا کرتا ہے۔ اب اگر ہم ان مفرد آوازوں کا ایک ڈیٹابیس بنا لیتے ہیں اور کسی لفظ کو اس کی مفرد آوازوں(جن سے مل کر اس لفظ کی آواز بنتی ہے) میں توڑنے کے قابل ہوجائیں تو اردو متن سے آواز پیدا کرنے کا کام نہایت آسان ہوجائے گا۔
 

دوست

محفلین
کانزونینٹ‌ تو واضح ہیں۔ ب، پ، ت، ٹ، ج، چ، خ وغیرہ وغیرہ۔ اس سلسلے میں اگر اختلاف پیدا ہوسکتا ہے تو وہ ز اور ذ کی آوازوں‌ پر ہے۔ عربی میں ذ کو دانت پر زبان لگا کر پڑھا جاتا ہے جبکہ ز سیٹی کی طرح اوپر والے دانتوں کی جڑوں سے نکالی جاتی ہے۔ لیکن اردو والے شاید دونوں کی سیٹی کی طرح ہی نکالتے ہیں۔ ایسی ہی ایک کنفیوژن ث‌ اور س کی آواز میں بھی ہوسکتی ہے۔ ث کو بالائی دانتوں پر زبان رکھ کر پڑھنا سکھایا جاتا ہے جب ہم نورانی قاعدے میں‌ عربی حروف پڑھتے ہیں جبکہ س سیٹی کی طرح بالائی دانتوں کی جڑوں سے نکلتا ہے۔ ایک تیسری کنفیوژن ژ کی آواز ہے جسے ہم ز کی طرح ہی بول جاتے ہیں‌۔ جبکہ میرے علم کے مطابق اسے انگریزی لفظ ورژن میں بولا جاتا ہے۔ امید ہے آپ سمجھ گئے ہونگے میں کس آواز کی بات کررہا ہوں۔ اس سب کو واضح کیا جائے کیا اردو کے اہل زبان یہ آوازیں ایسے ہی بولتے ہیں یا کیسے بولتے ہیں خصوصًا ز اور ذ اور ث و س کی تفریق۔ ژ تو پکی بات ہے کہ ز نہیں اس سے الگ آواز رکھتی ہے لیکن ہم ژالہ کو زالہ ہی بول جاتے ہیں۔
دوسری بات ہے حروف علت یا واؤلز کی۔ یہ دو قسم کے ہوتے ہیں چونکہ میرا علم انگریزی کے حوالے سے ہے اس لیے میں اسی حوالے سے بات کروں گا۔ (بطور لینگوئج ٹیچر ہمیں انگریزی کی صوتیات سے متعارف کروایا جاتا ہے یعنی تمام آوازیں اور ان کے بولنے کا انداز۔۔ جبکہ اردو کے لیے ایسی کوئی کوشش کبھی بھی نہیں کی جاتی دوران زمانہ طالب علمی ) انگریزی میں تین طرح کے واؤلز ہیں۔ اکہرے، دوہرے اور تہرے۔ Monothong, Difphthong , Triphthong(English Vowel Chart) اکہرے سادہ اور ایک آواز پر مشتمل ہیں ان کے بولنے کے دوران آواز میں اتار چڑھاؤ کم ہی آتا ہے۔ یہ آٹھ ہیں۔ پھر دوہرے جو مونو تھانگ کا مرکب ہی سمجھ لیں۔ یہ کچھ لمبے ہیں اور آواز میں کچھ اتار چڑھاؤ آتا ہے۔ اس کے بعد تہرے جو تین مونوتھانگ سے مل کر بنتے ہیں۔ انگریزی کے 44 فونیم پورے کرنے کے لیے 24 کانزونینٹ اور 20 واؤل شمار کیے جاتے ہیں۔ جن میں اکہرے اور دوہرے واؤل شامل ہوتے ہیں تہرے بہت پیچیدہ ہوتے ہیں اور انھیں ماہرین ہی شناخت کرسکتے ہیں۔
اس ساری تفصیل کے مطابق یہ بتائیں کہ اردو میں کتنے واؤلز ہیں؟ مجھے میرے اساتذہ نے ہی بتایا تھا کہ 20 ہیں۔ لیکن اب یہ بیس کیسے ہیں پتا نہیں۔ میری نظر سے کوئی ریسرچ پیپر، کتاب ابھی تک نہیں گزری جو اردو کی آوازوں کو بیان کرے۔ یہ بات یاد رہے اکہری آوازوں کو بیان کردینا آسان ہے۔ اَ، آ، اِ، ای، یہ سادہ سی مثالیں ہیں۔ لیکن جب ایک سے زیادہ اکہرے واؤلز مل کر دوہرے یا تہرے واؤلز بناتے ہیں وہاں اختلاف رائے پیدا ہوتا ہے۔ چناچہ مجھے یہ بھی بتایا تھا کبھی سر نے کہ اس سلسلے میں اختلافات بھی موجود ہیں چناچہ تعداد میں فرق آجاتا ہے۔
اب کرنا یہ ہے کہ ان آوازوں کو شناخت کیا جائے۔ اگر پہلے سے کام موجود ہے تو اس کو یہاں فراہم کیا جائے۔ ڈاکٹر سرمد سے استفسار بہترین رہے گا اس سلسلے میں۔ دوسرے شاعر حضرات زبان کے ردھم اور صوتیات سے زیادہ قریب ہوتے ہیں وہ بہتر بتاسکتے ہیں۔ اگرچہ ان کا کام بحروں اور اوزان تک محدود ہوتا ہے لیکن وہ ہم سے بہتر علم رکھتے ہیں کہ لفظ کن کن آوازوں میں اور کہاں کہاں سے توڑا جاتا ہے۔
وسلام
 

نبیل

تکنیکی معاون
شاکر، تم ذرا اس سلسلے میں کچھ initiative لو اور ڈاکٹر سرمد سے اس سلسلے میں رابطہ کرکے دیکھو۔ کیا معلوم کہ وہ کچھ رہنمائی کرنے پر آمادہ ہو جائیں۔
 
مزے کی بات یہ ہے کہ انگریزی کی اچھی لغات جیسے آکفسورڈ ایڈوانسٹد لرنر ڈکشنری کے شروع میں انگریزی کی آوازوں کا چارٹ موجود ہوتا ہے۔ ہمارے ہاں ابھی تک کسی کو پتا ہی نہیں کہ یہ ہوتا کیا ہے۔ اگر ہے تو اس کی اشاعت کا اہتمام نہیں کیا گیا۔

شاکر بھائی اس کا جو سبب مجھے سمجھ میں آتا ہے وہ یہ ہے کہ یورپی زبانوں خصوصاً برٹش انگریزی کے ساتھ مسئلہ یہ رہا ہے کہ ان کے لکھنے اور پڑھنے میں بڑا دشوار سا تال میل ہے۔ اور بڑا مشکل کام ہے کہ رائج انگریزی رسم الخط اور اس کے تلفظ کے لئے قاعدہ مرتب کیا جا سکے (مثلاً اگر ہم یوں کہیں کہ شن کے لئے tion لکھنا ہے جیسے station, information, education وغیرہ تو fashion جیسے الفاظ قعدے کا ستیا ناس کر دیتے ہیں) اسی طرح women, but, put جیسے بہت سی مثالیں ہیں جو اپنی ادائیگی میں حروف تہجی کی فطری آواز سے کہیں نہ کہیں بے ربط ہوتی نظر آتی ہیں۔ اب چونکہ ضرورت تھی تو انہیں کچھ لوگوں نے قواعد میں ضبط کرنے کی کوششیں بھی کی ہیں۔ مثلاً اگر C کے فوراً بعد I, E یا Y آئے تو اس کا تلفظ س جیسا کیا جائے ورنہ ک جیسا۔ پر شاذ پھر بھی مل جاتے ہیں۔

لہٰذا انگریزی لغات کے لئے فونیٹک الفابیٹ ضروری تصور کئے گئے۔ تاکہ الفاظ کا ٹرانسکرپشن (تلفظ) لکھا جا سکے۔ الحمد للہ یہ مسئلہ اردو کے ساتھ نہیں ہے۔ ہم صرف اعراب لگا کر صحیح صحیح تلفظ جان سکتے ہیں۔ اور معیاری اردو لغات اس بات کا اہتمام کرتی ہیں۔ باقی اگر ہم لوگ کوشش کریں تو تھوڑی سی کوشش کے بعد سارے اردو کے صوتیے (میرا خود ساختہ لفظ ہے کیونکہ مجھے نہیں معلوم کہ اسے کیا کہتے ہیں) جمع کر سکتے ہیں۔

اس سے پہلے صوتیاتی بنیادوں پر واویل اور کانسونینٹ کی تعریف لکھ دوں تو شاید انہیں جمع کرت ہوئے آسانی ہوگی۔ واضح رہے کہ آج پہلی بار اس موضوع پر کچھ سوچ اور لکھ رہا ہوں لہٰذا چیزیں میری توقع سے کہیں زیادہ مشکل بھی ہو سکتی ہیں۔ اور بہت ممکن ہے کہ میں وہی باتیں دہرا رہا ہوں جو کہیں نہ کہیں کہی ہوئی مل جائیں گی۔
 
Vowel:

صوتیاتی تعریف کے مطابق ایسی آوازیں جن کی ادائیگی میں مخرج اصل (حلق) سے نکلی ہوا کی راہ میں کوئی عضو حائل نہ ہو۔


consonant:

ایسی آوازیں جن کا کوئی معاون مخرج ہو اور حلق سے نکلی ہوا کے راہ میں حائل ہو کر جھٹکے سے راستہ دے۔ اس طرح مختلف آوازوں کی ادائیگی مختلف مقامات پر مختلف اعضاء کے حائل ہونے کا نتیجہ ہوتی ہے۔

مثلاً ب کی ادائیگی میں دونوں ہونٹ مل کر ہوا کی راہ میں حائل ہوتے ہیں۔
ٹ کی ادائگی میں سرا زبان اندر کی جانب مڑ کر تالو سے جا ملتا ہے اور اس طرح ہوا کی راہ میں حائل ہوتا ہے اور جھٹکے سے راستہ دیتا ہے۔

و علیٰ ھٰذا القیاس دوسرے کانسونینٹس کو آزما لیں۔

پھر انشا اللہ ہیاں جمع کرنے کی کوشش کریں گے اور بعد میں ترتیب دے لیں گے۔
 

الف عین

لائبریرین
شاکر۔۔۔ کیا وہاں لسانیات یں اردو پر زور نہیں ہوتا؟ علی گڑھ میں تو اکثر لسانیات اردو میں ہی پڑھائی جاتی ہے یا اسی پر تحقیق زیادہ ہوتی ہے۔ خاص کر جب سے ڈاکٹر مسعود حسین خان نے وہاں آ کر لسانیات کا شعبہ کھولا، انہوں نےا ور ان کے شاگردوں پروفیسر مرزا خلیل احمد بیگ نے بہت کتابیں لکھی ہیں جن میں اردو کے حروف اور آوازوں پر سیر حاصل گفتگو کی ہے۔ مسعود صاحب کا ایک آدھ مضمون تو میں نے سمت میں بھی دیا تھا۔ خلیل صاحب کی ایک کتاب اسلوبی تنقید میں بھی ایک آدھ مضمون میں کچھ ایسی گفتگو ہے اور ’ایک بھاشا جو مسترد کر دی گئی‘ میں اردو ہندی کے تقابل میں بھی۔ یہ دونوں کتابیں یہاں بھی موجود ہیں لائبریری میں۔ اطلاقی لسانیات نامی جرنل کے دو شمارے بھی میرے پاس ہیں۔ ذرا ڈھونڈھ کر مکمل ان پیج فائل تم کو ای میل کرتا ہوں جس میں انگریزی کے مجامین بھی شامل ہیں میں نے محض اردو مضامین کی ای بک بنا رکھی ہے جو ابھی تک اپ لوڈ نہیں ہو سکی میری سائٹس پر۔
 

دوست

محفلین
نبیل بھائی میں ای میل کرتا ہوں‌ ڈاکٹر سرمد حسین کو۔
ابن سعید آپ کی بات بالکل بجا ہے کہ انگریزی الفاظ کے ہجوں اور تلفظ میں زمین آسمان کا فرق ہوتا ہے۔ پھر بھی ہم آوازوں کی شناخت کو مکمل طور پر رد نہیں کرسکتے۔ تلفظ کے جن قواعد کی آپ ہجوں کی بنیاد پر بات کررہے ہیں یہ اصل میں آوازوں کی بنیاد ہوتے ہیں۔ جیسے اردو میں ہم عنبر کو ام بر پڑھتے ہیں۔ نا کہ عن بر۔ ن کے بعد ب نہیں پڑھی جاسکتی اس لیے ہم ن چھوڑ دیتے ہیں۔ یہ مثال شاید اتنی مناسب نہ ہو لیکن ہر زبان میں صوتی طور پر کچھ ایسے قوانین ہوتے ہیں جو ایک آواز کے بعد دوسری آواز کے آنے کا تعین کرتے ہیں۔ اس کا انحصار لفظ بولنے کی آسانی پر ہوتا ہے۔ یعنی صارف کتنی آسانی اور روانی سے لفظ ادا کرسکتا ہے۔ آخری بات فونیٹکس اور فونولوجی لسانیات کی مکمل اور ترقی یافتہ شاخیں ہیں۔ کسی بھی زبان کی صوتیات کا مطالعہ کرنے کے لیے ماہرین نے انٹرنیشنل فونیٹکس الفابیٹ تشکیل دئیے ہیں تاکہ ہر کوئی ساؤنڈ سسٹم کا مطالعہ کرسکے۔ واؤل ہی کو لے لیں چھوٹا ہے یا بڑا، کہاں سے نکلتا ہے اور کس طرح ادا کیا جاتا ہے یہ جتنا واضح آئی پی اے کی علامت سے ہوسکتا ہے کسی بھی زبان کے (خواہ وہ اردو ہی کیوں نہ ہو) اپنے حروف سے نہیں ہوسکتا۔ چونکہ یہ بنائے ہی آوازوں کا مطالعہ کرنے کے لیے گئے ہیں۔
اعجاز اختر صاحب یہاں اردو لسانیات پر اگر کچھ کام ہورہا ہے تو کرلپ ہی کا نام لیا جاتا ہے۔ انگریزی میں البتہ بہاؤالدین زکریا یونیورسٹی ملتان میں بہترین فیکلٹی موجود ہے۔ یہ کتابیں مجھے ضرور بھیجیے گا میں‌ منتظر رہوں گا۔
وسلام
 

الف عین

لائبریرین
انشاء اللی جلد ہی مکمل فائلیں تم کو ای میل کر دوں گا۔ اور کچھ مجامین یہاں محفل میں بھی پوسٹ کر دوں گا۔
 

الف نظامی

لائبریرین
متن سے صوت کا بنیادی اصول یہ ہوگا کہ لفظ کو چند متعین کردہ اصولوں کی بنیاد پر آوازوں کی رمز میں توڑا جائے۔ اور ان آوازوں کو ملا کر صوت پیدا کرلی جائے۔
اس میں قابل غور بات یہ ہے کہ آوازیں آپس میں کن اصولوں کے تحت جڑتی ہیں ۔ شاید یہ بات speech processing کے دائرہ کار میں ہے۔
 

دوست

محفلین
کس آواز کے بعد کونسی آواز آتی ہے۔ اس کے لیے خاصی تحقیق کی ضرورت ہوگی اور یہ کام اردو کا کوئی ماہر صوتیات ہی کرسکتا ہے۔ انگریزی اور دوسری زبانوں کے لیے تو قوانین دریافت کرلیے گئے ہیں کہ اس آواز کے بعد یہ آئے گی اور اس کے بعد یہ۔ چناچہ آوازوں کے ایسے پیٹرنز دریافت کیے جاچکے ہیں اور طلباء کو بتائے بھی جاتے ہیں جن پر مشتمل انگریزی لفظ ممکن ہی نہیں۔ ایسا ہی اردو کے ساتھ بھی ہونا چاہیے۔
 

دوست

محفلین
ڈاکٹر سرمد نے مجھے کرلپ کی سائٹ کا لنک دے کر ریسرچ تلے دیکھنے کو کہا۔ وہاں سے ایک ریسرچ پیپر ملا ہے۔ یہ ٹیکسٹ سے سپیچ کے قوانین پر مشتمل ہے۔ چونکہ اردو خاصی "صوتی" زبان ہے اس لیے انگریزی کی نسبت اس کی املاء سے لفظ بولنے کے قوانین نکالنا آسان ہے۔ آرٹیکل یہ ہے۔
 

الف نظامی

لائبریرین
imgzz3.png

مندرجہ بالا تصویر کو دیکھ کر یہ خیال آیا جسے نیچے لکھ رہا ہوں
کسی شعر کا عروضی متن معلوم کرنے کے لیے اس میں سے ایسے حروف حذف کئے جاتے ہیں جو لکھنے میں تو آتے ہیں لیکن پڑھنے میں نہیں۔ میرے خیال میں یہ عمل متن سے صوت کے لیے معاون ہوسکتا ہے کیونکہ عروضی متن میں صرف وہی الفاظ ہونے ہیں جنہیں بولا جاتا ہے۔ لہذا اس تصویر میں جو کام کیا گیا ہے وہ کسی متن کا عروضی متن معلوم کرنے کے مترادف ہے
اس کے علاوہ شاکر نے انبار کی مثال دی جسے امبار پڑھا جاتا ہے اس میں تجوید کا کوئی قاعدہ یا اصول استمعال ہوا ہے۔
لہذا متن سے صوت کے لیے علم عروض ، علم التجوید کے ماہرین سے استفادہ کرنا ضروری ہوگا۔
 

دوست

محفلین
اس کے لیے زبان کے بہت گہرے علم کی ضرورت ہے۔ ہم زبان بولتے تو ہیں لیکن یہ نہیں جانتے اس بولنے کے پیچھے کون کونسے عوامل کارفرما ہیں۔ عروض والی ترکیب کارآمد ثابت ضرور ہوگی سوائے ان رعایتوں کے جب وزن پورا کرنے کے لیے کوئی آواز جان بوجھ کر گرا دی جاتی ہے۔ اردو میں آوازوں کے "جائز" پیٹرنز پر بھی تحقیق کی ضرورت ہے۔ مجھے توقع نہیں تھی کہ کرلپ سے صرف ایک ریسرچ پیپر ملے گا۔ سنا تھا انھوں نے خاصا کام کیا ہوا ہے اردو کی صوتیات پر۔
 

الف نظامی

لائبریرین
اردو میں آوازوں کے "جائز" پیٹرنز پر بھی تحقیق کی ضرورت ہے۔
متن سے صوت کے دو طریقے میرے ذہن میں ہیں۔
ایک یہ کہ بنیادی آوازوں کی مدد سے متن کو صوت میں تبدیل کیا جائے۔
دوسرا یہ کہ تمام ممکنہ الفاظ کی الفاظوں کا ڈیٹا بیس بنا لیا جائے اور متن میں موجود ہر لفظ کی آواز ڈیٹا بیس سے اٹھا لی جائے اور پھر ان تمام آوازوں کو ملا کر ایک صوتی مسل بنا لی جائے۔
 
متن سے صوت کے دو طریقے میرے ذہن میں ہیں۔
ایک یہ کہ بنیادی آوازوں کی مدد سے متن کو صوت میں تبدیل کیا جائے۔
دوسرا یہ کہ تمام ممکنہ الفاظ کی الفاظوں کا ڈیٹا بیس بنا لیا جائے اور متن میں موجود ہر لفظ کی آواز ڈیٹا بیس سے اٹھا لی جائے اور پھر ان تمام آوازوں کو ملا کر ایک صوتی مسل بنا لی جائے۔

بہت خوب!

آپ انہیں خطوط پر سوچ رہے ہیں جن کے ذریعہ ٹرانسلٹریشن کیا جاتا ہے۔ اس میں بھی یا تو کیریکٹر بائی کیریکٹر تجزیہ کے طریقے سے (لواحق سوابق دیکھتے ہوئے) کنورژن کرتے ہیں یا الفاظ کی لغت کی مدد سے۔ (غور کرنے کی بات یہ ہے کہ اردو کا Ocr بھی انھیں ماڈلس پر ڈیویلوپ کیا جا سکتا ہے)

پہلا طریقہ انتہائی فلیکسیبل ہے ہے اور اجنبی الفاظ کو بھی بطریق احسن ہینڈل کر سکتا ہے (نیز اس کی کامپلیکسٹی کانسٹنٹ ہوتی ہے) پر اس کے مسائل تب خطرناک صورتحال اختیار کر لیتے ہیں جب حروف کے کچھ خواص مختلف اور کچھ یکساں ہوں۔

دوسرا طریقہ کانٹینیوس لرننگ کا ہے۔ جس میں وقت کے ساتھ ساتھ ڈکشنری ڈاٹا بیس بڑی ہوتی جاتی ہے۔ اور اس میں کسی حد تک فیڈ بیک لرننگ بھی چاہئے ہوتا ہے۔ اس کی کامپلیکسٹی ڈاٹا بیس بڑھنے کے ساتھ ساتھ بڑھتی چلی جائے گی۔

لہٰذا قدرے بہتر ماڈل جس کی صلاح میں دونگا وہ یہ ہوگا کی ان دونوں کا ہائبرڈ ماڈل ترتیب دے لیتے ہیں۔ جس میں ایسا کرلیتے ہیں کہ سب سے پہلے اسٹرنگ کو لفظ بلفظ اخذ کرکے ڈاٹا بیس میں کوئیری کرتے ہیں اگر وہاں سے دستیاب ہوتا ہے تو ٹھیک ورنہ اس لفظ کو حرف با حرف تجزیہ کرکے فوری طور پر کنورٹ کردیں نیز اس لفظ کو اس کے کنورژن سمیت موڈریشن کے لئے قطار انداز کردیں۔ جسے بعد میں دیکھ کر موڈیریٹرس اس کو صاد یا مسترد کر دیں۔ نیز موڈیریشن کے اس عمل سے سسٹم کی لرننگ بھی ہو کہ سسٹم کا تجویز کردہ لفظ کس حد تک موزوں تھا۔

اس ماڈل کا فائدہ یہ ہوگا کہ وقت گزرنے کے ساتھ ساتھ سسٹم کی ایفیشینسی بڑھتی چلی جائے گی۔ اور سسٹم ابتدائی مراحل میں بھی ہر اسٹرنگ کو (خواہ غلط ہی کیوں نہیں) تبدیل کر سکے گا۔ اس طرح ہم دونوں ماڈلس کا ملا جلا فائدہ حاصل کر سکیں گے۔
 

دوست

محفلین
پروگرامنگ کی باریکیاں‌ تو ماہرین ہی جانیں لیکن یہ تجویز بہتر لگی ہے مجھے۔ لفظ کا تلفظ محفوظ‌ہو ورنہ اس کے ٹوٹے کرکے تلفظ جوڑ لیا جائے۔
 

arifkarim

معطل
تم شاید اسی لیے اردو الفاظ میں حروف کا تعدد معلوم کرنا چاہ رہے ہو۔ اس سلسلے میں پہلے سے کی گئی تحقیق پر نگاہ ڈالنا مفید ثابت ہو سکتا ہے۔ کرلپ والوں نے ایک مرتبہ Speech Recongnition پر کام کیا تھا لیکن اردو Text-to-Speech Synthesis پر ابھی تک کوئی کام نہیں ہوا ہے۔ مجھے گوگل پر اس سلسلے میں کچھ روابط ملے ہیں جنہیں میں یہاں پیش کر رہا ہوں:

Phonemic Inventory of Sindhi and Acoustic Analysis of Voiced Implosives
Bi-Lingual Text to Speech Synthesis System for Urdu and Sindhi
Phonological Processing for Urdu Text to Speech System
An Urdu Newspaper Reader. Key to an Urdu Newspaper Reader

اردو کی Text-to-Speech Synthesis پر کسی نسیم صاحب نے کام کیا تھا۔ اور ایک پروگرام بھی بہت عرصہ پہلے ریلیز کیا تھا۔ اسکا نام ““متکلم”” تھا۔ اس کو یہاں سے حاصل کر لیں:
www.divshare.com/download/4254511-2ca
newprototype.gif
 
Top