تعمیر
محفلین
مولانا آزاد قومی اردو یونیورسٹی [MANUU] کی جانب سے 2017 کی سہ روزہ "اردو سائنس کانگریس" مانو یونیورسٹی کیمپس میں فروری 2017 میں منعقد ہوئی تھی۔ جس میں راقم الحروف (مکرم نیاز) نے اپنا مقالہ بعنوان "اردو اور جدید تیکنالوجی ، اردو او۔سی۔آر" پیش کیا تھا۔
یہی مقالہ، قومی کونسل برائے فروغ اردو زبان کے رسالے "اردو دنیا" کے شمارہ فروری-2019 میں شایع ہوا ہے۔
مقالے میں اردو محفل کے خصوصی زمرے "اردو او سی آر پر تحقیق" سے بھی کافی استفادہ کیا گیا۔ جس کے لیے اردو محفل کا ازحد شکریہ۔
مکمل مقالہ راقم کے پورٹل "تعمیر نیوز" پر یہاں پڑھا جا سکتا ہے:
اردو او۔سی۔آر - بصری حرف شناس
کچھ اہم اقتباسات پیش خدمت ہیں ۔۔۔۔۔
موجودہ عصری تیکنالوجی زمانے میں بصری حرف شاسی کا یہ نظام کوئی ایسا پیچیدہ موضوع تو نہیں لیکن نستعلیقی اردو زبان کے حوالے سے ضرور مشکل ترین مانا گیا ہے۔ اس وقت آن لائن بازار میں دنیا کی تقریباً زبانوں کے او۔سی۔آر دستیاب ہیں۔ انگریزی، فرانسیسی، اسپینی، اطالوی، لاطینی، روسی، یونانی وغیرہ اور ایشیائی زبانوں میں جاپانی، چینی، کوریائی کے علاوہ دائیں سے بائیں لکھی جانے والی زبانوں جیسے عربی، فارسی، عبرانی میں تک معقول اور کارآمد او۔سی۔آر ایجاد ہو چکے ہیں۔ حتیٰ کہ 2011 میں جرمن ڈیولوپر/پروگرامر ڈاکٹر اولیور ہیلوگ [Dr. Oliver Hellwig] کے قائم کردہ ہندوستانی ادارہ انڈ۔سنز Ind.Senz کے ذریعے ہندی، مراٹھی، گجراتی، تامل اور سنسکرت کے او۔سی۔آر بھی منظر عام پر آ چکے ہیں۔
۔۔۔ "او سی آر" کا اہم فائدہ یہ بھی ہوگا کہ ہزارہا علمی و معلوماتی کتب کو، جو اب آسانی سے دستیاب نہیں ہوتیں، اسکین کر کے یونیکوڈ تحریر میں تبدیل کیا جا سکتا ہے۔ اور پھر لفظ/فقرہ کی تلاش بھی اسی تحریری فائل میں ممکن العمل ہوگی۔
شاید یہی سبب ہو کہ ماہ اگست 2016 میں لسانیات کے پینل کی ایک میٹنگ میں قومی اردو کونسل کے ڈائرکٹر پروفیسر ارتضیٰ کریم نے کہا تھا : "آج کے بدلتے حالات میں نئی ٹیکنالوجی کی اہمیت و افادیت سے انکار ممکن نہیں ہے اور نہ ہی اس کے بغیر ترقی کا سفر طے کیا جاسکتا ہے۔ اس لیے اردو میں ایک او سی آر کی اہم ضرورت ہے۔ اس وقت ملک کی دوسر ی زبانوں مثلاً بنگلہ، ہندی اور تمل میں یہ سہولیات فراہم ہیں۔ اس ٹیکنالوجی کے ذریعے کسی کتاب کے تصویری مسودے میں ٹائپ کیے ہوئے الفاظ کو تحریری صورت میں شناخت کرنا بھی ممکن ہو جائے گا۔"
***
گزشتہ ڈیڑھ دو عشرے کے دوران مختلف سرکاری و غیرسرکاری اداروں کی جانب سے اردو بصری حرف شناس کی ایجاد کے لیے کافی کوششیں ہوئی ہیں۔
پاکستان کے قومی انفارمیشن ٹیکنالوجی ادارہ آئی۔سی۔ٹی۔آر۔ڈی۔ایف نے لاہور کے الخوارزمی انسٹی ٹیوٹ آف کمپیوٹر سائنس کو اردو نستعلیق بصری حرف شناسی نظام کی تخلیق کے لیے تقریباً 30 ملین پاکستانی روپے کا عطیہ مارچ 2012 میں فراہم کیا اور پراجیکٹ تکمیل کے لیے تیس مہینوں کی مدت دی گئی (آن-لائن حوالہ)۔ متذکرہ سرکاری ادارہ کی ویب سائٹ پر اس منصوبے کی پیش رفت رپورٹ ہر چند کہ دستیاب نہیں ہے، لیکن دیگر ذرائع کی اطلاعات کے بموجب یہ منصوبہ اس قدر کامیاب نہیں رہا جتنا کہ اس کی امید کی گئی تھی۔
ویسے اسی پراجکٹ کے نگران اعلیٰ ڈاکٹر سرمد حسین کے زیرتحت پاکستانی ادارہ "سنٹر فار لینگویج انجینئرنگ" نے "سی۔ایل۔ای نستعلیق او سی آر، ورڑن 1.0.0" کے نام سے پہلا اردو او سی آر 15 ہزار پاکستانی روپیوں میں مارچ 2016 میں جاری کیا ہے۔ جس کے مثبت نتائج یا کامیابی کے فیصد کی کوئی اطلاع ابھی تک تو سائبر دنیا میں دستیاب نہیں ہے۔
حکومت ہند کے ڈپارٹمنٹ آف انفارمیشن ٹیکنالوجی کے ادارہ آئی۔ایل۔ٹی۔پی۔ڈی۔سی کے تحت 2013 میں آن لائن او۔سی۔آر پر مبنی ویب سائٹ قائم کی گئی اور اعلان کیا گیا کہ بنگلہ، دیوناگری، گرمکھی، کنڑ ، ملیالم اور تلگو زبانوں میں بصری حرف شناسی نظام اس وقت آن لائن دستیاب ہے اور عنقریب اردو، تامل، گجراتی اور دیگر ہندوستانی زبانوں میں بھی یہ سہولت دستیاب ہوگی۔اور اس وقت اردو زبان میں بھی یہ سہولت فراہم کی جا چکی ہے۔ اس پر کیے گئے ایک آن لائن تجربہ کے مطابق یہ ویب او۔سی۔آر تقریباً سو (100) الفاظ کی امیج فائل کو تحریر میں بدلنے کے لیے قریب چار منٹ لیتا ہے اور نتیجہ تقریباً ساٹھ تا ستر فیصد درست ہے۔
*****
اردو بصری حرف شناس سے بالخصوص اور جدید تیکنالوجی سے بالعموم چند متعلقہ سوالات یہاں قائم ہوتے ہیں:
1) اردو میں سائنسی مضامین، کتب و رسائل تو کسی نہ کسی حد تک موجود ہیں لیکن انفارمیشن اور موبائل ٹیکنالوجی سے متعلق مضامین، کتب اور رسائل کی اس قدر کمی کا سبب کیا ہے؟
2) جامعاتی تحقیق میں اردو زبان کے حوالے سے او۔سی۔آر یا ٹکسٹ ٹو اسپیچ یا اسپیچ ٹو ٹکسٹ یا مشینی ترجمہ پراجیکٹس پر اگر کسی ہندوستانی یونیورسٹی میں کوئی کام ہوا ہے تو ان کی تفصیلات انٹرنیٹ سرچنگ میں کیوں کر دستیاب نہیں ہیں؟
3) اگر پڑوسی ملک کی حکومت نے جامعاتی سطح پر اردو او۔سی۔آر سے متعلق تعاون کیا یا سرگرمی دکھائی ہے تو ہمارے ملک کی جامعات کے متعلقہ شعبوں میں اس اہم ترین تحقیقی موضوع کو کیوں نظرانداز کیا گیا ہے جبکہ اردو کے نام پر ایک علیحدہ یونیورسٹی میں قائم ہے؟
4) مشہور و مقبول ادارہ "ریختہ" سے ہٹ کر اردو کی دیگر سرکاری و غیرسرکاری تنظیمیں اور ادارے، اردو زبان و ادب کے ذخیرے کو انٹرنیٹ پر تلاش کے قابل متن کی شکل میں مہیا کرنے کے سلسلے میں تیکنالوجی ماہرین سے کیونکر رابطہ نہیں کرتے؟
5) گوگل کے سی۔ای۔او اتفاق سے ہندوستانی نڑاد ہیں ، کیا یہ امید رکھی جا سکتی ہے کہ قومی اردو جامعہ کے سربراہان سرکاری سطح پر ان سے رابطے کے ذریعے اردو کے اہم ذخیرہ کتب کو گوگل او۔سی۔آر کی مدد سے ڈیجیٹائز کرنے کے سلسلے میں باہمی اشتراک کا کوئی لائحہ عمل ترتیب دیں گے؟
(از: مکرم نیاز، حیدرآباد۔ انڈیا)
یہی مقالہ، قومی کونسل برائے فروغ اردو زبان کے رسالے "اردو دنیا" کے شمارہ فروری-2019 میں شایع ہوا ہے۔
مقالے میں اردو محفل کے خصوصی زمرے "اردو او سی آر پر تحقیق" سے بھی کافی استفادہ کیا گیا۔ جس کے لیے اردو محفل کا ازحد شکریہ۔
مکمل مقالہ راقم کے پورٹل "تعمیر نیوز" پر یہاں پڑھا جا سکتا ہے:
اردو او۔سی۔آر - بصری حرف شناس
کچھ اہم اقتباسات پیش خدمت ہیں ۔۔۔۔۔
موجودہ عصری تیکنالوجی زمانے میں بصری حرف شاسی کا یہ نظام کوئی ایسا پیچیدہ موضوع تو نہیں لیکن نستعلیقی اردو زبان کے حوالے سے ضرور مشکل ترین مانا گیا ہے۔ اس وقت آن لائن بازار میں دنیا کی تقریباً زبانوں کے او۔سی۔آر دستیاب ہیں۔ انگریزی، فرانسیسی، اسپینی، اطالوی، لاطینی، روسی، یونانی وغیرہ اور ایشیائی زبانوں میں جاپانی، چینی، کوریائی کے علاوہ دائیں سے بائیں لکھی جانے والی زبانوں جیسے عربی، فارسی، عبرانی میں تک معقول اور کارآمد او۔سی۔آر ایجاد ہو چکے ہیں۔ حتیٰ کہ 2011 میں جرمن ڈیولوپر/پروگرامر ڈاکٹر اولیور ہیلوگ [Dr. Oliver Hellwig] کے قائم کردہ ہندوستانی ادارہ انڈ۔سنز Ind.Senz کے ذریعے ہندی، مراٹھی، گجراتی، تامل اور سنسکرت کے او۔سی۔آر بھی منظر عام پر آ چکے ہیں۔
۔۔۔ "او سی آر" کا اہم فائدہ یہ بھی ہوگا کہ ہزارہا علمی و معلوماتی کتب کو، جو اب آسانی سے دستیاب نہیں ہوتیں، اسکین کر کے یونیکوڈ تحریر میں تبدیل کیا جا سکتا ہے۔ اور پھر لفظ/فقرہ کی تلاش بھی اسی تحریری فائل میں ممکن العمل ہوگی۔
شاید یہی سبب ہو کہ ماہ اگست 2016 میں لسانیات کے پینل کی ایک میٹنگ میں قومی اردو کونسل کے ڈائرکٹر پروفیسر ارتضیٰ کریم نے کہا تھا : "آج کے بدلتے حالات میں نئی ٹیکنالوجی کی اہمیت و افادیت سے انکار ممکن نہیں ہے اور نہ ہی اس کے بغیر ترقی کا سفر طے کیا جاسکتا ہے۔ اس لیے اردو میں ایک او سی آر کی اہم ضرورت ہے۔ اس وقت ملک کی دوسر ی زبانوں مثلاً بنگلہ، ہندی اور تمل میں یہ سہولیات فراہم ہیں۔ اس ٹیکنالوجی کے ذریعے کسی کتاب کے تصویری مسودے میں ٹائپ کیے ہوئے الفاظ کو تحریری صورت میں شناخت کرنا بھی ممکن ہو جائے گا۔"
***
گزشتہ ڈیڑھ دو عشرے کے دوران مختلف سرکاری و غیرسرکاری اداروں کی جانب سے اردو بصری حرف شناس کی ایجاد کے لیے کافی کوششیں ہوئی ہیں۔
پاکستان کے قومی انفارمیشن ٹیکنالوجی ادارہ آئی۔سی۔ٹی۔آر۔ڈی۔ایف نے لاہور کے الخوارزمی انسٹی ٹیوٹ آف کمپیوٹر سائنس کو اردو نستعلیق بصری حرف شناسی نظام کی تخلیق کے لیے تقریباً 30 ملین پاکستانی روپے کا عطیہ مارچ 2012 میں فراہم کیا اور پراجیکٹ تکمیل کے لیے تیس مہینوں کی مدت دی گئی (آن-لائن حوالہ)۔ متذکرہ سرکاری ادارہ کی ویب سائٹ پر اس منصوبے کی پیش رفت رپورٹ ہر چند کہ دستیاب نہیں ہے، لیکن دیگر ذرائع کی اطلاعات کے بموجب یہ منصوبہ اس قدر کامیاب نہیں رہا جتنا کہ اس کی امید کی گئی تھی۔
ویسے اسی پراجکٹ کے نگران اعلیٰ ڈاکٹر سرمد حسین کے زیرتحت پاکستانی ادارہ "سنٹر فار لینگویج انجینئرنگ" نے "سی۔ایل۔ای نستعلیق او سی آر، ورڑن 1.0.0" کے نام سے پہلا اردو او سی آر 15 ہزار پاکستانی روپیوں میں مارچ 2016 میں جاری کیا ہے۔ جس کے مثبت نتائج یا کامیابی کے فیصد کی کوئی اطلاع ابھی تک تو سائبر دنیا میں دستیاب نہیں ہے۔
حکومت ہند کے ڈپارٹمنٹ آف انفارمیشن ٹیکنالوجی کے ادارہ آئی۔ایل۔ٹی۔پی۔ڈی۔سی کے تحت 2013 میں آن لائن او۔سی۔آر پر مبنی ویب سائٹ قائم کی گئی اور اعلان کیا گیا کہ بنگلہ، دیوناگری، گرمکھی، کنڑ ، ملیالم اور تلگو زبانوں میں بصری حرف شناسی نظام اس وقت آن لائن دستیاب ہے اور عنقریب اردو، تامل، گجراتی اور دیگر ہندوستانی زبانوں میں بھی یہ سہولت دستیاب ہوگی۔اور اس وقت اردو زبان میں بھی یہ سہولت فراہم کی جا چکی ہے۔ اس پر کیے گئے ایک آن لائن تجربہ کے مطابق یہ ویب او۔سی۔آر تقریباً سو (100) الفاظ کی امیج فائل کو تحریر میں بدلنے کے لیے قریب چار منٹ لیتا ہے اور نتیجہ تقریباً ساٹھ تا ستر فیصد درست ہے۔
*****
اردو بصری حرف شناس سے بالخصوص اور جدید تیکنالوجی سے بالعموم چند متعلقہ سوالات یہاں قائم ہوتے ہیں:
1) اردو میں سائنسی مضامین، کتب و رسائل تو کسی نہ کسی حد تک موجود ہیں لیکن انفارمیشن اور موبائل ٹیکنالوجی سے متعلق مضامین، کتب اور رسائل کی اس قدر کمی کا سبب کیا ہے؟
2) جامعاتی تحقیق میں اردو زبان کے حوالے سے او۔سی۔آر یا ٹکسٹ ٹو اسپیچ یا اسپیچ ٹو ٹکسٹ یا مشینی ترجمہ پراجیکٹس پر اگر کسی ہندوستانی یونیورسٹی میں کوئی کام ہوا ہے تو ان کی تفصیلات انٹرنیٹ سرچنگ میں کیوں کر دستیاب نہیں ہیں؟
3) اگر پڑوسی ملک کی حکومت نے جامعاتی سطح پر اردو او۔سی۔آر سے متعلق تعاون کیا یا سرگرمی دکھائی ہے تو ہمارے ملک کی جامعات کے متعلقہ شعبوں میں اس اہم ترین تحقیقی موضوع کو کیوں نظرانداز کیا گیا ہے جبکہ اردو کے نام پر ایک علیحدہ یونیورسٹی میں قائم ہے؟
4) مشہور و مقبول ادارہ "ریختہ" سے ہٹ کر اردو کی دیگر سرکاری و غیرسرکاری تنظیمیں اور ادارے، اردو زبان و ادب کے ذخیرے کو انٹرنیٹ پر تلاش کے قابل متن کی شکل میں مہیا کرنے کے سلسلے میں تیکنالوجی ماہرین سے کیونکر رابطہ نہیں کرتے؟
5) گوگل کے سی۔ای۔او اتفاق سے ہندوستانی نڑاد ہیں ، کیا یہ امید رکھی جا سکتی ہے کہ قومی اردو جامعہ کے سربراہان سرکاری سطح پر ان سے رابطے کے ذریعے اردو کے اہم ذخیرہ کتب کو گوگل او۔سی۔آر کی مدد سے ڈیجیٹائز کرنے کے سلسلے میں باہمی اشتراک کا کوئی لائحہ عمل ترتیب دیں گے؟
(از: مکرم نیاز، حیدرآباد۔ انڈیا)