'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

شکیب

محفلین
فلسفی
یہ او سی آر ہوتا کن مرحلوں میں ہے؟ مکمل سطر ایک ساتھ؟ حروف؟ یا ترسیمے؟

پوچھنے کا مقصد یہ کہ کیا ہم ہر ترسیمے کی شناخت کے بعد کچھ کوڈ ڈال سکتے ہیں؟ اگر ہاں تو براہ راست الفاظ کو لغت کے مقابل چیک کرنے کے بعد write کیا جا سکتا ہے۔
 

فلسفی

محفلین
فلسفی
یہ او سی آر ہوتا کن مرحلوں میں ہے؟ مکمل سطر ایک ساتھ؟ حروف؟ یا ترسیمے؟

پوچھنے کا مقصد یہ کہ کیا ہم ہر ترسیمے کی شناخت کے بعد کچھ کوڈ ڈال سکتے ہیں؟ اگر ہاں تو براہ راست الفاظ کو لغت کے مقابل چیک کرنے کے بعد write کیا جا سکتا ہے۔
ٹیکسریٹ کی ہائی لیول اے پی آئی میں امیج فائل کو پروسیس کرنے کی سہولت ہے، اس میں پورا صفحہ بھی دے سکتے ہیں یا پری پروسیسنگ کے ذریعے سطروں کو علیحدہ کر کے ایک ایک سطر کا مواد بھی حاصل کیا جاسکتا ہے۔
 

فلسفی

محفلین
سطروں کو علیحدہ کرنے والا پروگرام علیحدہ سے لکھنا ہو گا وہ ٹیکسریٹ کی اے پی آئی کا حصہ نہیں ہے۔
 

جاسم محمد

محفلین
گٹ ہب پر "ایشو" بنا دیا ہے، اب دیکھتے ہیں کہ جھاڑ پڑتی ہے کہ نہیں۔ :D
یہ ٹیسٹ سیمپل آپ نے بہتر نتائج کیلئے ایسا بنایا ہے؟
56678798-3b8d7a80-66cc-11e9-99f8-db5efed4ea02.png
 

فلسفی

محفلین
کسی کے پاس اگر یونیکوڈ میں اگر اردو کا مواد ، کتب وغیرہ ہیں تو وہ مہربانی کرکے شئیر کرے۔ ابھی تک میرے پاس جو مواد تھا اس سے تقریبا ایک لاکھ تیس ہزار سطریں بن سکیں ہیں۔ بہت سا مواد اسلامی کتب سے لیا گیا ہے جس میں عربی والا متن نکال دیا ہے۔ بہت سے سپیشل کریکٹرز، سپیسز وغیرہ کو علیحدہ کرنے کے بعد ابھی تک صرف ایک لاکھ تیس ہزار سطریں ہی بن سکیں ہیں۔ فائل یہاں موجود ہے۔
 

دوست

محفلین
جنگ کا ڈیٹا ابنِ سعید نے سکریپ کیا تھا 2012 میں شاید، وہ ڈراپ باکس پر شیئر کیا ہوا ہے میرے پاس۔ اس کی آئی ڈی ذاتی پیغام میں بھیجیں تو میں فولڈر شیئر کر دیتا ہوں۔
 

فلسفی

محفلین
بہت شکریہ میں سکرپٹ سے سطریں بنا کر تربیتی مواد بناتا ہوں۔

ویسے ٹیسریکٹ کی ٹیم کی جانب سے گٹ ہپ والے ایشو پر مزید سوالات پوچھے گئے ہیں۔ دیکھتے ہیں کہ ان کی طرف سے بہتری کے لئے کوئی تجویز سامنے آتی ہے یا نہیں۔
 

الف عین

لائبریرین
میری لائبریری کی کتب سے مواد حاصل کریں تو بہتر ہے، محفل اور جنگ سے جمع کردہ مواد میں پہلے ہی سے بے تحاشا اعلاط ہیں، ورڈ لسٹ بھی مجھے اپنی ہی پسند ہے کہ مقتدرہ کی فہرست میں بھی ایسے ہی Non-words شامل ہیں( اس کا پہلا لفظ ہی' آآکر' تھا۔)
 

فلسفی

محفلین
میری لائبریری کی کتب سے مواد حاصل کریں تو بہتر ہے، محفل اور جنگ سے جمع کردہ مواد میں پہلے ہی سے بے تحاشا اعلاط ہیں، ورڈ لسٹ بھی مجھے اپنی ہی پسند ہے کہ مقتدرہ کی فہرست میں بھی ایسے ہی Non-words شامل ہیں( اس کا پہلا لفظ ہی' آآکر' تھا۔)
بہت شکریہ سر۔ اصل میں کچھ کتابیں آپ کے بلاگ سے بھی ڈاؤنلوڈ کیں تھی۔ کیا تمام مواد ٹیکسٹ فائل میں (چاہے علیحدہ علیحدہ ہو) ایک زپ فائل یا کچھ زپ فائلز میں مل سکتا ہے؟
 

فلسفی

محفلین
بہت شکریہ فرقان بھائی، پہلا ربط دیکھتا ہوں۔ دوسرا والا تو پہلے ہی کنگھال چکا ہو :)
ویسے دوست بھائی والا ڈیٹا سکرپٹ پر لگایا ہوا ہے۔ ابھی تک ایک لاکھ پچاس ہزار سطریں بن گئیں ہیں۔ لیکن ان کو مزید ایک فلٹر سے گزارنا ہوگا۔ پھر فائنل مواد تیار کر کے آپ حضرات سے شئیر کروں گا۔
 

فرقان احمد

محفلین
بہت شکریہ فرقان بھائی، پہلا ربط دیکھتا ہوں۔ دوسرا والا تو پہلے ہی کنگھال چکا ہو :)
ویسے دوست بھائی والا ڈیٹا سکرپٹ پر لگایا ہوا ہے۔ ابھی تک ایک لاکھ پچاس ہزار سطریں بن گئیں ہیں۔ لیکن ان کو مزید ایک فلٹر سے گزارنا ہوگا۔ پھر فائنل مواد تیار کر کے آپ حضرات سے شئیر کروں گا۔
اس ربط کو بھی ملاحظہ کیجیے گا کیونکہ اردو ادب سے متعلقہ ویب سائٹس سے مواد لینے کی صورت میں اغلاط کا خدشہ کم سے کم ہو گا۔ اس صفحہ پر موجود روابط پر کلک کرنے پر آپ کو یونی کوڈ مواد دستیاب ہو گا۔
 

فلسفی

محفلین
اس ربط کو بھی ملاحظہ کیجیے گا کیونکہ اردو ادب سے متعلقہ ویب سائٹس سے مواد لینے کی صورت میں اغلاط کا خدشہ کم سے کم ہو گا۔ اس صفحہ پر موجود روابط پر کلک کرنے پر آپ کو یونی کوڈ مواد دستیاب ہو گا۔
بہت شکریہ فرقان بھائی۔
اس میں ڈیٹا تو پی ڈی ایف میں ہے۔ سارا مواد ڈاؤنلوڈ اور پروسیس کرنے کے لیے علیحدہ سے جگاڑ لگانی پڑے گی۔ :p
فی الحال تو میں ڈیٹا ٹیکسٹ فائل میں حاصل کرنے کے موڈ میں ہوں۔ کیونکہ سطریں بنانے والا سکرپٹ سادہ ٹیکسٹ فائلز کو پروسیس کرتا ہے۔ خیر مواد کافی جاندار لگا رہا ہے۔ اس کو بھی وقت نکال کر دیکھتا ہوں۔ ان شاءاللہ۔
 

فرقان احمد

محفلین
بہت شکریہ فرقان بھائی۔
اس میں ڈیٹا تو پی ڈی ایف میں ہے۔ سارا مواد ڈاؤنلوڈ اور پروسیس کرنے کے لیے علیحدہ سے جگاڑ لگانی پڑے گی۔ :p
فی الحال تو میں ڈیٹا ٹیکسٹ فائل میں حاصل کرنے کے موڈ میں ہوں۔ کیونکہ سطریں بنانے والا سکرپٹ سادہ ٹیکسٹ فائلز کو پروسیس کرتا ہے۔ خیر مواد کافی جاندار لگا رہا ہے۔ اس کو بھی وقت نکال کر دیکھتا ہوں۔ ان شاءاللہ۔
دراصل، پی ڈی ایف کے ساتھ ساتھ انہوں نے یونیکوڈ میں بھی مواد دیا ہوا ہے تاہم سائیڈ بائی سائیڈ ۔۔۔! ان روابط پر کلک کر کے یہ مواد کاپی پیسٹ کرنا ہو گا۔ وقت تو لگے گا، محترم ۔۔۔! :)
 

فلسفی

محفلین
دراصل، پی ڈی ایف کے ساتھ ساتھ انہوں نے یونیکوڈ میں بھی مواد دیا ہوا ہے تاہم سائیڈ بائی سائیڈ ۔۔۔! ان روابط پر کلک کر کے یہ مواد کاپی پیسٹ کرنا ہو گا۔ وقت تو لگے گا، محترم ۔۔۔! :)
اچھا ہے فرقان بھائی، یہ میں نے نوٹ نہیں کیا تھا۔ یونیکوڈ ڈیٹا سکرپٹ کے ذریعے آسانی سے نکل سکتا ہے۔ کرتا ہوں اس کا کچھ :)
 
Top