السلام علیکم
[
ٓآپ کی پروگرامنگ صلاحیتوں کو دیکھ کر لگتا ہے کہ اردو کے پہلے قابل استعمال او سی آر کا صلہ آپ کے سر جانا ہے۔ کیونکہ اس پر انفردای لوگوں نے بھی کام کیا ہے اور حکومتی اداروں نے بھی، لیکن کوئی خاطر خواہ یا قابل استعما ل رزلٹ سامنے نہیں آرہے
یہاںواضح کر دوں میں اس قسم کی پروگرامنگ نہیںکرتا کیون کہ میں خود بی سی الیکترانکس کے لاسٹ ایر میں ہون وقت بہت چاہیے ہوتا ہے اس کیلیے ۔ اس کام کیلیے میرے دوست اور اردولنک کے پروگرامرز کی ٹیم ضرور ساتھ دے گی۔
اسوقت محفل پر نئی دہلی سے ابن سعید صاحب اردو او سی آر پر کام کر رہے ہیں اور اسکا کرنٹ اسٹیٹس بھی نا معلوم ہے۔ بہتر ہوگا کہ آپ دونوں پروگرامر حضرات باہم مشاورت سے اس پر کام کریں۔ ۔۔۔
میں ابن سعید سے بات کر کے سٹیٹس معلوم کرتا ہوں ۔امید ہے اس پر اگر محنت کریں تو جلد کام ن جاے گا
مختلف فانٹس کے چکر میں جانے کی بجائے اگر صرف نوری نستعلیق لگیچرز تک او سی آر ڈٹیکشن کو رکھا جائے، تب بھی بہت اچھے نتائج سامنے آسکتے ہیں۔ کیونکہ اردو کا ۹۹ فیصد مواد اسی فانٹ میں شائع ہوتا ہے! یہ میری ذاتی رائے ہے، باقی جیسا آپ بہتر سمجھیں، کیونکہ Text To Speech اور Speech To Text پروگرامز Ocr کے بغیر واقعی بیکار ہیں!
اس نظام کا جو سٹرکچر ڈیزاین میں چاہتا ہوں اس میں یہ سہولت خود ہی بن جاے گی کہ کوی صارف چاھے تو اپنی ہمت سے کسی بھی فونٹ کو اس سافٹ ویر شامل کر سکتا ہو ۔ ویسے نستعلیق ہو جاے وہ کافی ہو جائے گا ۔
اظفر صاحب! مجھے آپ اس کے مراسلے میں جس جملے نے اپنی جانب بے حد متوجہ کیا وہ ہے "آپ بولیں ، وہ ریکارڈ میں سے آواز کی جانچ کر کے اس کے ساتھ منسلک لفظلکھتا جاے گا"
میرے خیال میں اگر ایسا ہو جاتا ہے تو لائبریری کے لیے کتب کی ٹائپنگ کا کام بے حد تیز ہو سکتا ہے کہ ٹائپنگ کے جھنجھٹ سے نجات مل جائے گی اور کتاب سامنے رکھ کر محض پڑھنے پر وہ کتاب یونیکوڈ میں منتقل ہو جائے گی۔
اردو او سی آر کا جوئے شیر لانا بھی اپنے محاذوں میں شامل رکھیں لیکن جیسا آپ نے کہا کہ اول الذکر کام نسبتآ آسان ہے تو کیوں نہ اس سے آغاز کیا جائے۔
یہاںایک بات واضح کر دوں کہ سپیچ ٹو ٹیکسٹ جو میں چاہ رہا ہوں وہ صرف ایک خالی کاپی ہو گی لکھنا اس میں سب نے خود ہے۔ ہم اس میں ایک ایسا سافٹ ویر بنا دیں گے جو آپ کو اردو کے 50 ہزار لفظ باری باری دکھاتا جاے گا اور آپ ان الفاظکو اپنی آواز میں بول بول کر ریکارڈ کرتے جائین ۔ اس کا فایدہ یہ ہو گا کہ کبھی یہ مسیلہ نہیں ہو گا کہ سسٹم آواز کی جانچ میں ناکام ہو گیا ۔ ریکارڈ بھی آپ کی آواز ہو گا ہو گا اسلیے ہمیشہ وہ سافٹ ویر درست کام کرے گا (امید سے )
فاتحَ: آواز کو سن کر تحریر کرنا بیشک قدرے آسان کام ہے، لیکن اصل مسئلہ پھر وہی آواز ڈٹکشین انجن کا ہوتا ہے۔ آپ کو ایک ایک لفظدرست تلفظ کیساتھ ادا کرنا ہوگا، تھوڑی سی پھرتی دکھائیں گے اور آپکو کمپیوٹر اسکرین پر کیڑے مکوڑوں کے سوا کچھ نہیں ملے گا!
اس کا حل اوپر بتا چکا ہوں کہ جو چاھے وہ اپنی آواز والا ریکارڈ مرتب کر لے اور یہ مسئیلہ دور ہو جاے گا ۔
اوسیآر اور ٹیٹیایس میں کافی فرق ہے اور دونوں کی اپنی افادیت ہے۔ ٹیٹیایس یعنی ٹیکسٹ ٹو سپیچ سسٹم بنانا آسان ہے مگر اس کے لئے اردو بولنے کا کافی ڈیٹا چاہیئے۔ کیا کسی کو معلوم ہے کہ ایسا ڈیٹا موجود ہے یا نہیں؟
زیک برادر ان دونوں چیزوں کو ساتھ لکھنے کا مقصد میرا یہ تھا کسی بھی نستعلیق والی پکچر فایل کو براہ راست یونی کوڈ آوٹ پٹ لی جا سکے جو پہلے او سی آر میں جاے پھر ٹی ٹی ایس میں ۔ یعنی دو سافٹ ویرز کو ایک پیکج میں مرج کر کے کام لیں ۔
16 تاریخ سے میرے سمسٹر ایگزام سٹارٹ ہو رہے ہیں ۔ ان کے بعد ان شاء اللہ پہلے سے موجود ریکارڈ اور جو کام کر چکے ہیں ان پر نظر کروںگا اور جلد اس پر کام شروع کر دیں گے ۔ مجھے امید ھے ضرورت کے وقت سب ساتھ دینے کو راضی ہوں گے ۔ (اگر ضرورت ہو)