سعادت
تکنیکی معاون
کل ٹوئٹر کے ذریعے یہ خبر ملی کہ یونیورسٹی آف انجینیئرنگ اینڈ ٹیکنالوجی لاہور کے اداروں، الخوارزمی انسٹیٹوٹ آف کمپیوٹر سائنس اور مرکزِ تحقیقاتِ لسانیات، نے اردو او سی آر کے لیے ایک نیا نظام، "اردو نستعلیق حرف شناس"، کا تجرباتی ورژن ریلیز کیا ہے۔ اس کی ویب سائٹ کے مطابق "اُردو نستعلیق حرف شناس (آپٹیکل کیریکٹر ریکگنائزر) ایک ایسا خودکار نظام ہے جو سکین کردہ صفحے سے متن اخذ کرتا ہے تاکہ اس میں ردّو بدل کیا جا سکے۔"
اس پروجیکٹ کی ویب سائٹ پر سسٹم کا ڈیمو بھی موجود ہے۔ میرے پاس کوئی سکین شدہ صفحہ تو تھا نہیں، اس لیے ویب سائٹ پر موجود مثالی صفحات میں سے ایک پر تجربہ کر کے دیکھا: نتائج مِلے جُلے ہی ہیں، لیکن ایک ابتدائی، تجرباتی ورژن کے لیے اتنا بھی بہت ہے۔ اگر آپ کے پاس سکین شدہ متن ہو، یا اگر کسی کتاب کا کوئی صفحہ سکین کر سکیں، تو اس سسٹم کو آزمانا ایک دلچسپ مشق ہو سکتی ہے۔
یہیں محفل پر کچھ عرصہ قبل ڈی-اے-ستی صاحب نے اپنا پی-ایچ-ڈی تھیسس شیئر کیا تھا جو اردو او سی آر کی تحقیق ہی پر مبنی تھا؛ یقیناً وہ اس نظام پر زیادہ بہتر روشنی ڈال سکیں گے۔ اچھی بات یہ ہے کہ پاکستانی یونیورسٹیز کے محققین اب اردو او سی آر کے لئے سنجیدگی سے کوششیں کر رہے ہیں، جو ایک قابلِ ستائش امر ہے۔
اس پروجیکٹ کی ویب سائٹ پر سسٹم کا ڈیمو بھی موجود ہے۔ میرے پاس کوئی سکین شدہ صفحہ تو تھا نہیں، اس لیے ویب سائٹ پر موجود مثالی صفحات میں سے ایک پر تجربہ کر کے دیکھا: نتائج مِلے جُلے ہی ہیں، لیکن ایک ابتدائی، تجرباتی ورژن کے لیے اتنا بھی بہت ہے۔ اگر آپ کے پاس سکین شدہ متن ہو، یا اگر کسی کتاب کا کوئی صفحہ سکین کر سکیں، تو اس سسٹم کو آزمانا ایک دلچسپ مشق ہو سکتی ہے۔
یہیں محفل پر کچھ عرصہ قبل ڈی-اے-ستی صاحب نے اپنا پی-ایچ-ڈی تھیسس شیئر کیا تھا جو اردو او سی آر کی تحقیق ہی پر مبنی تھا؛ یقیناً وہ اس نظام پر زیادہ بہتر روشنی ڈال سکیں گے۔ اچھی بات یہ ہے کہ پاکستانی یونیورسٹیز کے محققین اب اردو او سی آر کے لئے سنجیدگی سے کوششیں کر رہے ہیں، جو ایک قابلِ ستائش امر ہے۔