Akkaas! The OCR

الف نظامی

لائبریرین
Its an OCR that recognizes Urdu text optically from an offline image in any format and generates an Urdu document file easily editable in any word processor including MS Word.
It is generally based on the flexible Ligature Recognition Engine which can be used to develop any kind of customized text recognition software according to the specific needs of the client depending upon the font. It accepts input in the form of different image formats taken from an image capturing device like scanner. It extracts each ligature’s geometry from that input image and generates a polar map which is RTS invariant. This polar image is analyzed in the frequency domain. The Fourier coefficients are obtained from the so obtained frequencies. These coefficients are then used as features to recognize a specific ligature. Nastalique Font of Urdu is in progress and more than 1500 ligatures of different sizes have been tested using the technique with an accuracy of 92%.It is being developed as a Final Year Project and it is still in progress.

بحوالہ
 

الف نظامی

لائبریرین
Fourier coefficients are commonly used for shape description because they are invariant to scale, rotation and translation.
کیا کوئی بتائے گا کہ یہ polar map کیا ہوتا ہے؟ اور RTS invariant کیا چیز ہے؟
 
پولر سسٹم کو آرڈینیٹ‌ سسٹم کا وہ نظام ہوتا ہے جس میں X اور Y ایکسس کے بجائے ایک نقطہ سے دوری اور اس سے نکلی معین شعاع سے زاویوں کی مدد سے کسی نقطے کی نشاندہی کی جاتی ہے۔ اس نقطے کو اس کوآرڈینیٹ نظام کا پول کہتے ہیں۔

اس نظام میں اگر کسی آبجیکٹ کا خاکہ بنایا جائے تو آبجیکٹ کے مختلف نقطوں کا ایڈریس قطب سے اس کی دوری اور بنیادی شعاع پر اس نقطے کے ذریعہ قطب سے بنے زاویے کا مرتب جوڑا ہوگا۔ ایسے خاکے گھماؤ سے آزاد اس طور ہوتے ہیں کہ کسی بھی حالت میں ہوں ان کے کنھیں بھی دو نقاط کی قطب سے دوری کا فرق اور کنھیں بھی دو نقاط کے ذریعہ قطب پر بنا زاویہ ہمیشہ غیر مبدل ہوگا۔ ایسے خاکے فنگر پرنٹ ریکگنیشن میں بھی انتہائی مدد گار ہوتے ہیں۔ کیوں کہ استعمال کرنے والا اسکینر پر اپنے انگلیوں کے نشان کسی بھی طرح چھوڑ سکتا ہے۔
 

الف نظامی

لائبریرین
ابن سعید ، کیا یہاں تمام ترسیمہ جات کے فورییرر عددی سروں کے ڈیٹا بیس سے "سیگمنٹیڈ امیج کے فورئیرر عددی سر کا تقابل" کا الگورتھم لگتا ہے؟
 
میں پچھلے پیغام میں مزید وضاحت کے لئے تبدیلی کر رہا تھا پر اس میں اسکیل انویرینس کی بات رہ گئی۔ اگر زاویے کو دیکھا جائے تو یہ از خود اسکیل انویرینٹ ہوتا ہے جب کہ قطب سے دوری اسکیل انویرینٹ نہیں ہوتی۔ پر عموماً‌ ایسے کاموں کے لئے ہمیں‌ صرف نقاط کے زاویوں کا مجموعہ ہی کافی ہوتا ہے۔

اور ہاں میرا مطالعہ اس سمت زیادہ تو نہیں پر آثار یہی ہیں کہ ترسیموں کی پہچان کے لئے فورئر کا ہی سہارا لیا جاتا ہوگا۔
 

arifkarim

معطل
میں پچھلے پیغام میں مزید وضاحت کے لئے تبدیلی کر رہا تھا پر اس میں اسکیل انویرینس کی بات رہ گئی۔ اگر زاویے کو دیکھا جائے تو یہ از خود اسکیل انویرینٹ ہوتا ہے جب کہ قطب سے دوری اسکیل انویرینٹ نہیں ہوتی۔ پر عموماً‌ ایسے کاموں کے لئے ہمیں‌ صرف نقاط کے زاویوں کا مجموعہ ہی کافی ہوتا ہے۔

اور ہاں میرا مطالعہ اس سمت زیادہ تو نہیں پر آثار یہی ہیں کہ ترسیموں کی پہچان کے لئے فورئر کا ہی سہارا لیا جاتا ہوگا۔
کیا اسکام کیلئے نوری نستعلیق کے تمام ترسیمہ جات کی گلفس امیجز درکار ہوں گیں؟
 

نبیل

تکنیکی معاون
میں ایک پروگرام کو فائنل کر رہا ہوں جس کے ذریعے کسی بھی فونٹ کے تمام گلفس کو بطور جف امیج ایکسپورٹ کیا جا سکے گا۔ لیکن ان کو ویکٹر امیج میں علیحدہ سے ٹریس کرنے کی ضرورت پیش آئے گی۔ ویسے ٹروٹائپ فونٹس کے گلفس کے curve ڈیٹا کو پڑھنا اور ان پوائنٹس کو فائل میں لکھنا بھی ممکن ہے۔ ضرورت پڑنے پر اس کے لیے بھی ٹول لکھا جا سکتا ہے۔
 

arifkarim

معطل
میں ایک پروگرام کو فائنل کر رہا ہوں جس کے ذریعے کسی بھی فونٹ کے تمام گلفس کو بطور جف امیج ایکسپورٹ کیا جا سکے گا۔ لیکن ان کو ویکٹر امیج میں علیحدہ سے ٹریس کرنے کی ضرورت پیش آئے گی۔ ویسے ٹروٹائپ فونٹس کے گلفس کے Curve ڈیٹا کو پڑھنا اور ان پوائنٹس کو فائل میں لکھنا بھی ممکن ہے۔ ضرورت پڑنے پر اس کے لیے بھی ٹول لکھا جا سکتا ہے۔

شکریہ نبیل بھائی، میرا اشارع اسی طرف تھا ;)
 

علوی امجد

محفلین
its An Ocr That Recognizes Urdu Text Optically From An Offline Image In Any Format And Generates An Urdu Document File Easily Editable In Any Word Processor Including Ms Word.
It Is Generally Based On The flexible Ligature Recognition Engine Which Can Be Used To Develop Any Kind Of Customized Text Recognition Software According To The Specific Needs Of The Client Depending Upon The Font. It Accepts Input In The Form Of Different Image Formats Taken From An Image Capturing Device Like Scanner. It Extracts Each Ligature’s Geometry From That Input Image And Generates A Polar Map Which Is Rts Invariant. This Polar Image Is Analyzed In The Frequency Domain. The Fourier Coefficients Are Obtained From The So Obtained Frequencies. these Coefficients Are Then Used As Features To Recognize A Specific Ligature. Nastalique Font Of Urdu Is In Progress And More Than 1500 Ligatures Of Different Sizes have Been Tested Using The Technique With An Accuracy Of 92%.it Is Being Developed As A Final Year Project And It Is Still In Progress.

بحوالہ


مجھے اس میں کوئی ڈاؤن لوڈ لنک نظر نہیں آیا۔
کیایہ سافٹ وئیرکہیں سے ڈاؤن لوڈ ہوسکتا ہے یا صرف تعارف ہی ہے؟
 
Top