نتائج تلاش

  1. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    اگلی کوشش اور کچھ سرچ کے بعد۔ یہ ایرر 35 کریکٹرز فی سطر کی حد کی وجہ سے آتا ہے۔ جمیل نوری نستعلیق کے علاوہ فجر نوری نستعلیق استعمال کیا تو ملتا جلتا ایرر ملا۔ یہ دیکھیں اس کے بعد بس لگیچر والی فائل کے ہی ایک لفظ فی سطر (1000 سطریں) دیں۔ اور آؤٹ پُٹ یہ رہی۔ کچھ پیش رفت نظر آئی ہے لیکن ابھی مزید...
  2. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    میں نے آج پھر کوشش کی ہے کہ کنفگریشن فائل اردو ٹرینڈ ڈیٹا سے نکال کر استعمال کروں۔ اس میں (اوپر مہیا کردہ مثال کے برعکس) اردو کے لیے صرف ایک سطر ہے۔ اس کے ساتھ سٹارٹر ٹرین ڈیٹا فائل کی آؤٹ پٹ وہی ہے اور ٹیس ٹرین نے وہی راگ الاپنا ہے جیسے اوپر مثال دی تھی۔ اگر ایل ایس ٹی ایم کی ٹرینڈ ڈیٹا فائل مل...
  3. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    آج ٹیس ٹرین چلا کر دیکھا ہے۔ ان کی تیار کردہ ٹریننگ فائل پر بھی اور اپنی پر بھی، ہر دو صورتوں میں یہی کہانی ہے: tesstrain.sh --fonts_dir '/usr/share/fonts' --lang urd --linedata_only --noextract_font_properties --langdata_dir '/home/ss/input' --fontlist "Jameel Noori Nastaleeq" --tessdata_dir...
  4. دوست

    آن لائن پیسے کمائیں۔

    ہیں جی؟ دس ڈالر اکاؤنٹ فیس کا چکر ہے بس باقی سب باتاں ہیں۔
  5. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    آج دماغ کا دہی اور لسی بنانے کے بعد اپنے ہاتھ کھڑے ہیں فی الحال۔ combine_lang_model --input_unicharset ~/shared-windows10/langdata/urd.unicharset --script_dir ~/langdata/ --output_dir ~/langdata --lang urd --lang_is_rtl TRUE مینوئل پیج کے مطابق بالا کمانڈ لگائی تھی۔ سٹروک فائل، یونی کریسٹ، ایکس...
  6. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    ہمارے پاس ایک لاکھ سے اوپر اردو کے الفاظ ہیں جن میں نوری نستعلیق کے لگیچرز بھی ہیں۔ اس سے ٹریننگ ڈیٹا بھی بن جائے گا، بس الفاظ کو آگے پیچھے رکھ کر سطریں بنانی ہیں۔ ہمیں یہ بھی معلوم ہے کہ ہر فونٹ کے لیے الگ سے ٹرین کروانا ہو گا، پرانے ماڈل کے اوپر نئی لیئرز چاہئیے ہوں گی۔ نوے فیصد عام امیجز...
  7. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    وہ تجربہ غلط باکس فائلوں کے ساتھ تھا۔
  8. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    ماشاءاللہ، بہت اچھا کام ہے۔ اب سلسلہ یہ ہے کہ ہمارا مقصد تو پھر ایک اوپن سورس مفتا پروگرام (کمپیوٹر والا) تیار کرنا ہے۔ یا کم از کم کوشش کر کے دیکھنا ہے۔ آپ کوئی مدد کر سکتے ہیں تو بسم اللہ۔ کوئی تکنیکی مشورہ، ٹیسرکٹ کو کیسے استعمال کیا جائے۔ آپ پچھلے 11 صفحات میں ملاحظہ کر سکتے ہیں کہ ہم...
  9. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    جی میں دیکھ چکا ہوں، بہت اچھا کام ہے۔ ہمارے لیے تو ونڈو شاپنگ جسے اردو میں کھڑکی خریداری کہتے ہیں، ہوا نا۔ ہمیں کیا فائدہ ہے آپ کے ٹیلنٹ کا۔ آپ کا حلوہ میٹھا لگ رہا ہے، لیکن ہم کھائیں گے تو پتہ چلے گا۔ ہماری تو اتنی عرض ہے کہ اردو کا او سی آر مل جاوے، اور اللہ واسطے مل جاوے جسے عربی میں فی سبیل...
  10. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    آپ کا کام بہت اچھا ہے، اسی طرح کا کام سنٹر فار لینگوئج انجینرنگ والے بھی کر چکے ہیں، ملاحظہ کیجیے۔ آنلائن اور ڈیکسٹاپ بھی قیمتاً۔ میں پائتھون میں این ایل ٹی کے وغیرہ سے واقف ہوں۔ اور ان کی اردو کی صلاحیت سے بھی۔ مقصد میں اوپر عرض کر چکا ہوں، اگر ٹیسرکٹ کی ٹریننگ میں مدد کر سکتے ہیں تو کیا کہنے۔...
  11. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    بھائی ویب سائٹ اشتہارات سمیت بہت اچھی لگ رہی ہے۔ یہاں پر ہمارا مقصد یہ ہے کہ ایک عدد ڈیسکٹاپ ایپلیکیشن تیار ہو جائے، جو مفت بھی ہو۔ مزید برآں اس ایپلیکیشن کو مختلف پروگرامنگ لینگویجز میں استعمال کرکے اپنے مطلب کی اپلیکیشنز بھی بنائی جا سکتی ہیں۔ مثلاً ڈیٹا پروسیسنگ کے لئے مجھے اس کا اطلاق آر...
  12. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    میں کل سے کچھ مزید تحقیق کر رہا ہوں ٹریننگ ڈیٹا بنانے کے حوالے سے۔ ایک تو ٹریننگ ڈیٹا موجود ہے یہاں، جیسا کہ اوپر بھی دو ایک مرتبہ اس کا ذکر کیا گیا لیکن تب میری ستر سی سی کھوپڑی میں یہ بات نہیں آ رہی تھی۔ ٹریننگ ٹیکسٹ اور ورڈ لسٹ میں تقریباً ایک لاکھ الفاظ موجود نہیں ہیں۔ پھر بھی ٹریننگ ٹیکسٹ...
  13. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    سطری فائل اور اضافی الفاظ جو نہیں مل سکے یہاں سے حاصل کیے جا سکتے ہیں۔ کل سطور 223,397 جن میں کہیں کہیں مسائل بھی نظر آئیں گے، یہ میری دانست میں بہترین دستیاب حل تھا۔ لائن جنریٹر پروگرام کو اپڈیٹ کر دیا ہے، اب پیرالل لوپنگ سے گھنٹوں کا کام منٹوں میں ہو جاتا ہے۔ شرط یہ ہے کہ پہلے سب سے چھوٹی...
  14. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    اگر فونٹس سے مصنوعی امیجز تیار کرنا ہیں تو یہی طریقہ ہے۔ ورنہ اصلی والے صفحات یعنی سکینز استعمال کیے جائیں۔ یہ بھی دھیان رہے کہ اردو جیسی زبانوں کے پیچیدہ رسم الخط کی وجہ سے ٹریننگ کرواتے ہوئے 10000 پھیروں کی بجائے بیس ہزار پھیروں تک کے مشورے بھی دیے گئے ہیں۔ مزید براں ڈیٹا جتنا مرضی ہو اس بات...
  15. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    اردو کے زیادہ فریکوئنسی والے الفاظ ان سطور میں موجود سیاق و سباق کی وجہ سے بار بار دوہرائے جائیں گے۔ دراصل صرف چند سو الفاظ ہی بہت زیادہ فریکوئنسی کے حامل الفاظ ہوتے ہیں، اس کے بعد الفاظ کی فریکوئنسی گرتی چلی جاتی ہے اور بڑے سے بڑے ڈیٹا سیٹ میں بھی آپ کو دسیوں ہزار ایسے الفاظ ملتے ہیں جن کی...
  16. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    میرا مقصد اس سلسلے صرف اتنا تھا کہ ایک ایسی ٹریننگ ڈیٹا فائل تیار ہوجائے جس میں اردو کے زیادہ سے زیادہ دستیاب اور درست کردہ الفاظ اپنے سیاق و سباق سمیت موجود ہوں۔ اس لئے میں نے ترسیموں اور سپیل چیکر سے حاصل کردہ الفاظ، اور اردو کی بورڈ سے تقریباً تمام علامات، اعراب وغیرہ کو یکجا کر کے کئی برسوں...
  17. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    وہی نیم حکیم، پہلی مرتبہ یہ کام کیا ہے۔ 12 برس ہو گئے سی شارپ میں کوڈنگ کرتے، کوڈنگ کیا کرتے بس ترلے کرتے۔ اب چیک کریں۔ اردو ورڈ لسٹ کا لنک بدل دیا ہے۔
  18. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    تب تک یہ انجوائے کریں۔
  19. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    منفرد الفاظ ہیں جو لگیچرز اور ہن سپیل کی ڈکشنری والی لسٹ سے اٹھائے ہیں۔ یہ لسٹ آٹھ برس قبل کرلپ کی سپیل چیکر لسٹ اور اسی ٹیکسٹ آرکائیو سے حاصل کردہ منفرد الفاظ کو ملا کر بنائی گئی تھی۔ پروف ریڈنگ کر کے مہمل بے کار املا کی غلطیاں نکالی گئی تھیں۔ سطور نکالنے کے پروگرام اور ورڈ لسٹ یہاں موجود ہیں۔
Top