فلسفی
محفلین
میں نے متن والی فائل کو "tesstrain.sh" میں استعمال کیا ہے۔ اس کے ذریعے جو باکس فائل بنی ہے وہ بائیں سے دائیں بنی ہے۔ جبکہ متن اور ٹف فائل دائیں سے بائیں ہی ہے۔ سکرپٹ موجودہ تربیتی مواد کے مطابق کوئی فلیگ کی بنیاد پر باکس فائل کو الٹ کرتا ہے۔
کمانڈ
باکس فائل
ٹف
متن
اس سے یہ بات بھی سمجھ آتی ہے کہ متن کی ہر لائن کے لیے علیحدہ فائل بنانے کی ضرورت نہیں۔ ٹیسریکٹ کا اپنا تربیتی مواد ایک ہی فائل میں ہے۔
کمانڈ
./tesstrain.sh --fonts_dir /usr/share/fonts --lang urd --training_text ./urd.training_text --linedata_only --noextract_font_properties --langdata_dir ./langdata --tessdata_dir ./tesseract/tessdata --fontlist "Jameel Noori Nastaleeq Regular" --output_dir ./traindata --save_box_tif
باکس فائل
ٹف
متن
اس سے یہ بات بھی سمجھ آتی ہے کہ متن کی ہر لائن کے لیے علیحدہ فائل بنانے کی ضرورت نہیں۔ ٹیسریکٹ کا اپنا تربیتی مواد ایک ہی فائل میں ہے۔