فرہنگ اصطلاحاتِ جامعہ عثمانیہ

اسد

محفلین
میں نے یہ فرہنگ سکین کرنا شروع کر دی ہے۔ ابھی صرف A کے صفحات سکین کیے ہیں۔ کچھ تجربے کرنے کے بعد، باقی بھی ہوتے رہیں گے۔ کیونکہ اردو کی پرنٹنگ کچھ اچھی نہیں ہے، اس لئے ایسا کرنا ضروری ہے تاکہ امیجز کا سائز کم سے کم ہو سکے۔

چند صفحات کے انگلش متن کو OCR بھی کیا ہے۔ مزید کام کرنے سے پہلے میں جاننا چاہوں گا کہ انگلش متن کس فورمیٹ میں رکھا جائے۔ لغت کے کام میں ڈیٹا انٹری کے لئے جو اطلاقیے استعمال ہوئے ہیں انکے لئے کیا فورمیٹ ہونا چاہئیے؟



Attraction of a sphere (Chem, Physiol)
(Astron)
Attractive force (Math, Phys)
Attractive property (Phys)
Attribute (Philos)
Attributes (Log)
Atyadae (Hist)​
کیا یہ سادہ ٹیکسٹ فورمیٹ ٹھیک رہے گا؟
لنکس نیچے دیتا جاؤں گا۔
اگر ڈائریکٹ ڈاؤنلوڈ لنک کام نہ کریں تو ای سنپ کے صفحے سے ڈاؤنلوڈ کریں۔
 

نبیل

تکنیکی معاون
شکریہ اسد، لغت کی ڈیٹا انٹری کے سلسلے میں الف نظامی آپ کی بہتر رہنمائی کر سکیں گے۔ ویسے آپ چاہیں تو comma sepaerated ٹیکسٹ فائل میں ڈیٹا محوظ کر سکتے ہیں۔
 

اسد

محفلین
شکریہ اسد، لغت کی ڈیٹا انٹری کے سلسلے میں الف نظامی آپ کی بہتر رہنمائی کر سکیں گے۔ ویسے آپ چاہیں تو Comma Sepaerated ٹیکسٹ فائل میں ڈیٹا محوظ کر سکتے ہیں۔
فورمیٹ ایسا ہے کہ Csv فائل میں سیو کرنے کا کوئی فائدہ نظر نہیں آتا۔ سوائے ڈبل کوٹس لگانے کے اور کچھ نہیں ہوتا۔ میں سوچ رہا تھا کہ سبجیکٹس کے نام الگ ہو جاتے تو بہتر ہوتا، لیکن یہ کسی سکرپٹ کے ذریعے ہی ہو سکتا ہے۔
‭"attraction Of A Sphere (chem, Physiol)"
(astron)
"attractive Force (math, Phys)"
"attractive Property (phys)"
"attribute (philos)"
"attributes (log)"
"atyadae (hist)"‬​
اب میں صرف امیجز کا سائز کم کرنے پر توجہ دوں گا۔
 

قیصرانی

لائبریرین
فائلز کو آپ شاید او سی آر کے حوالے سے سکین کر رہے ہیں۔ اس وجہ سے اردو پڑھنے میں‌مشکل ہو رہی ہے۔ اگر اسے بلیک اینڈ وائٹ پر سکین کر یں تو شاید بہتر نتیجہ نکلے
 

اسد

محفلین
فائلز کو آپ شاید او سی آر کے حوالے سے سکین کر رہے ہیں۔ اس وجہ سے اردو پڑھنے میں‌مشکل ہو رہی ہے۔ اگر اسے بلیک اینڈ وائٹ پر سکین کر یں تو شاید بہتر نتیجہ نکلے
میں ‭ 300 Dpi‬بلیک اینڈ وہائٹ پر ہی سکین کر رہا ہوں۔ اوپر والا امیج ری‌سائزڈ ہے، اس لئے زیادہ برا ہو گیا ہے۔ اردو متن کہیں بہت گہرا ہے، کہیں درست اور کہیں مدہم۔ مختلف سیٹنگز چیک کروں گا، کیونکہ مقتدرہ کی زیادہ تر انگلش/اردو کتب کی پرنٹنگ ایسی ہی ہے۔ ایک ہی دفعہ بہتر حل تلاش کرنا مناسب ہے۔
 

قیصرانی

لائبریرین
ہممم۔ میرے ذاتی مشاہدے میں 150 ڈی پی آئی بھی بالکل ٹھیک کام کرتی ہے۔ فائل کے سائز کے ساتھ ساتھ کوالٹی کا بہتر کمبی نیشن بنتا ہے۔ تاہم میری رائے سے آپ کا یا کسی اور کا اتفاق کرنا ضروری نہیں
 
برادرم اسد آپ بس اس سکین کر دیں۔ او سی آر کا استعمال کر کے اسے متن میں تبدیل کرنا ایک مزید مصیبت ہے۔ کیو‫‫ں کہ اردو متن کے باعث سب کچھ خلط ملط ہو کر رہ جائے گا۔ میں ان شاء اللہ اس کو برقیانے کے لئے بہت جلد ایک عدد اطلاقیہ بنا دوں گا۔ اس کام کو اپنی ٹو ڈو فہرست میں ڈال لیتا ہوں۔
 

مہوش علی

لائبریرین
برادرم اسد آپ بس اس سکین کر دیں۔ او سی آر کا استعمال کر کے اسے متن میں تبدیل کرنا ایک مزید مصیبت ہے۔ کیو‫‫ں کہ اردو متن کے باعث سب کچھ خلط ملط ہو کر رہ جائے گا۔ میں ان شاء اللہ اس کو برقیانے کے لئے بہت جلد ایک عدد اطلاقیہ بنا دوں گا۔ اس کام کو اپنی ٹو ڈو فہرست میں ڈال لیتا ہوں۔

ابن سعید کی یہ بات بالکل درست ہے۔
بہرحال، دوسری طرف یہ بھی بہت ضروری ہے کہ انگلش کا ٹیکسٹ ہمارے پاس یونیکوڈ میں میسر ہو تاکہ ٹائپنگ کرتے ہوئے صرف اردو ٹائپ کرنا پڑے۔

"مجھے پہلے یہ بتائیں کہ جب اردو کے صفحات کو او سی آر سے گذارتے ہیں تو ٹیکسٹ کس شکل میں سامنے آتا ہے؟

اگر تو اردو ہی کے الفاظ ٹوٹی پھوٹی شکل میں آتے ہیں تو پھر یہ کیا جا سکتا ہے کہ تمام امیجز کی ایک ٹیکسٹ فائل بنائی جائے، اور پھر فائینڈ اینڈ ریپلیس کے ذریعے "ا" "ب" "پ" ۔۔۔۔۔ تا "ے" تک کو ٹیکسٹ فائل سے حذف کر دیا جائے۔ اس طرح آخر میں جو ٹیکسٹ بچے گا وہ صرف انگلش ٹیکسٹ پر مشتمل ہو گا۔

بہرحال، اگر اردو ٹیکسٹ کے الفاظ کسی اور ہی شکل میں نمودار ہوتے ہیں [یعنی الف بے تے کی شکل میں نہیں، تو پھر یہ طریقہ کار نہیں آزمایا جا سکتا]۔

نیز میں دیکھ رہی ہوں کہ اس کتاب میں ٹیکسٹ نسخ فونٹ میں ہے۔ اسکے لیے عربی کے کسی او سی آر سے فائدہ اٹھانے کی کوشش کی جا سکتی ہے۔
 
اگر آپ بآسانی انگلش ٹیکسٹ کو علیحدہ کر پا رہے ہیں جیسا کہ آپ نے اور کوٹ کیا ہے تو ٹحیک ہےخواہ پلین ٹیکسٹ ہو خواہ ڈبل کوٹیڈ۔ اس کو با آسانی مائن کیا جا سکتا ہے۔ بس علیحدہ سطروں میں ہو۔ نیز یہ کہ موضوع کو بھی علیحدہ کیا جا سکے گا۔ آپ ایسے چند صفحات فراہم کر دیجئے گا تو میں کوشش کروں گا۔ اور نتائج سے آگاہ کروں گا۔
 

مہوش علی

لائبریرین
ویسے نظامی بھائی سے رابطہ کیا جائے تو وہ ہر صورت میں ایسا اطلاقیہ لکھ کر دے سکتے ہیں جو کہ کسی بھی ٹیکسٹ فائل سے صرف انگلش ٹیکسٹ کو الگ کر لے اور باقی کو حذف کر دے۔

جہاں تک لائن کا تعلق ہے تو او سی آر میں ویسے ہیں لائنیں بنتی ہیں جیسا کہ کتاب کے سیکن میں ہوتی ہیں۔ ہو سکتا ہے کہ اس کا ہمیں فائدہ ہو جائے اور یوں ایک اصطلاح صرف ایک لائن میں ہی آ جائے۔ [بہرحال جن اصطلاحات کا مطلب کئی لائنوں پر محیط ہیں، ان میں پرابلم ہو سکتی ہے]۔ ۔۔۔۔۔ یعنی اسکا واحد حل شاید یہ ہی ہو کہ ہاتھ سے کام کرنا پڑے۔
 

اسد

محفلین
اگر آپ بآسانی انگلش ٹیکسٹ کو علیحدہ کر پا رہے ہیں جیسا کہ آپ نے اور کوٹ کیا ہے تو ٹحیک ہےخواہ پلین ٹیکسٹ ہو خواہ ڈبل کوٹیڈ۔ اس کو با آسانی مائن کیا جا سکتا ہے۔ بس علیحدہ سطروں میں ہو۔ نیز یہ کہ موضوع کو بھی علیحدہ کیا جا سکے گا۔ آپ ایسے چند صفحات فراہم کر دیجئے گا تو میں کوشش کروں گا۔ اور نتائج سے آگاہ کروں گا۔
اوپر والا ٹیکسٹ او سی آر کی آؤٹ پٹ ہے۔ ابھی میں نے B کے صفحات مکمل کیے ہیں۔ 18 صفحات کی زپ فائل 1.8 Mb کی ہے۔ ہر صفحہ کی علیحدہ Png امیج اور پلین Txt فائل ہے۔ ایک Txt فائل میں تمام صفحات کا ٹیکسٹ اکٹھا بھی ہے۔
مہوش علی نے کہا:
"مجھے پہلے یہ بتائیں کہ جب اردو کے صفحات کو او سی آر سے گذارتے ہیں تو ٹیکسٹ کس شکل میں سامنے آتا ہے؟
او سی آر صرف انگلش کے لئے ہے۔ آؤٹ پٹ ایسی ہے۔ یہ B کا پہلے صفحہ ہے۔
کوڈ:
[LEFT]
B
Baalbec (hist)
Babeuf (hist)
Babylon (hist)
Babylonia (hist)
Babylonian (hist)
Baccate   (-atus) (bot)
Baccate Fruits (berries)    (bot)
Baccetum   (bot)
Bacchus   (hist)
Bacchylides   (hist)
Bacheterew (astron)
Bacillary    (med)
Bacillary Diseases (med)
Bacillus (bot, Med)
Bacillus Coli   (med)
Bacillus Coli Infection (med)
Back (anat)
Backache   (pathol)
Back Boy   (pubad)
Back E.m.f. (phys)
(chem)
Back-ground (hist, Lit)
(bot)
Backing (tech)
Back-loading    (econ)
Back Pressure    (phys)
Back Stay (tech)
Back Surface (phys)
Backward Action (chem)
Backward Displacement    (pathol)
Backward Reading Vernier (phsy, Tech)
Back Water    (agric, Phys, Tech)
Back Wounds(   (med)
Bacteria    (bot, Chem, Med, Physiol)
Bacteria Action (med)
Bacterial Action   (chem, Physiol)
Bacterial Diseases (med)
Bacterial Fermentation (chem)
Bactericidal Action    (chem, Physiol)
Bactericidal Nature   (med)
Bactericidal Power    (chem, Physiol)
Bactericide   (chem)
Bacteroid (bot)
Bacteriological Examination (pathol)
Bacteriolysins   (chem, Physiol)
Bacterium Coli (med)
Bactra (hist)
Bactria (hist)
Bactrian   (hist)
Badajoz    (hist)
Bad Conductor (phys)
Badeley M.   (hist)
Badious    (bot)
Bag (agirc)
Bagdad Boil     (med)
Bag Of Membranes   Med)
Bagration     (hist)
Bailly   (hist)
Bainbridge Reflex     (chem, Physiol)
Balance    (econ, Pathol, Phys, Tech)
Balance (libra)    (astorn)
Balance Case    (phys)
Balanced Action   (chem)
Balance Of Acconnts(econ)
Balance Of Debit And Credit (econ)
Balance Of Import And Export (econ)
Balance Of Trade (econ)
Balance Point (phys)
Balances (econ)
Balance Sheet (econ)
Balance Wheel (phys)
Balancing Columns (phys)
Balancing Rotating Weights (tech)‬[/LEFT]
 

الف نظامی

لائبریرین
بہت خوب اسد!!!
ابن سعید کے بنائے ہوئے اطلاقیے چاچو ٹائپنگ ہیلپر کے ذریعے اس کو برقیانہ کیسا ہوگا۔
براہ کرم جو لوگ برقیانے کے کام میں شامل ہونا چاہتے ہوں وہ یہاں آمادگی ظاہر کردیں۔
 

اسد

محفلین
بہت خوب اسد!!!
ابن سعید کے بنائے ہوئے اطلاقیے چاچو ٹائپنگ ہیلپر کے ذریعے اس کو برقیانہ کیسا ہوگا۔
براہ کرم جو لوگ برقیانے کے کام میں شامل ہونا چاہتے ہوں وہ یہاں آمادگی ظاہر کردیں۔

میں اس بارے میں کچھ کہہ نہیں سکتا کیونکہ میں نے یہ اطلاقیہ استعمال نہیں کیا، لیکن میرا خیال ہے کہ یہ صرف اردو کے لئے ہے۔ اس سے پہلے انگلش اردو لغت کے لئے کیا ہوا تھا؟

لغت میں بہت سے مسائل ہوتے ہیں جو عام اردو کتابوں میں نہیں ہوتے اور انگلش اردو لغت میں ایک اضافی مسئلہ دو مختلف زبانوں کا ہوتا ہے۔ ایک LTR اور دوسری RTL۔ بہتر تو یہی ہو گا کہ کسی ڈیٹا بیس یا سپریڈشیٹ میں کام کیا جائے تاکہ اردو اور انگلش الفاظ علیحدہ فیلڈز یا سیلوں میں رہیں۔ کیونکہ انگلش الفاظ کی لسٹ موجود ہے اس لئے یہ مسئلہ نہیں ہونا چاہئیے۔ سپریڈشیٹ سب کے کمپیوٹرز پر ہو گی، چاہے M$ Excel ہو یا اوپن آفس Calc، یا کوئی اور۔ ایک کالم میں انگلش الفاظ ہوں گے، دوسرے میں اردو الفاظ ٹائپ کرنے ہوں گے۔ اس طرح ہم بہت سے مسائل سے بچ جائیں گے۔
 

مہوش علی

لائبریرین
السلام علیکم
میں اس بات کے بہت حق میں ہوں کہ اسد نے جو ایک سافٹ ویئر بتایا تھا کہ جس میں پوری کمیونٹی مل کر کتابوں کو ٹائپ کرتی ہے اُسے استعمال کیا جائے۔

بہرحال، جملہ کی پراگریس دیکھتے ہوئے لگتا ہے کہ کسی نئی چیز کو انٹروڈیوز کروانا خاصا مشکل ثابت ہو گا۔ اسد، آپ کو خود کچھ اراکین کی مدد سے پہلے قدم اس سمت میں اٹھانے ہوں گے۔

اسد برادر،
اگر وقتی طور پر میں آپکے اس پراجیکٹ کو جملہ پر شروع کروا دوں تو آپکو کوئی اعتراض تو نہیں؟
///////////////////////

مختصر بات یہ کہ میں نے جملہ پر اس پراجیکٹ کو "فرہنگ اصطلاحات" کے نام سے بطور نمونہ بنایا ہے [جہاں سب مل کر کتاب کو ٹائپ کر سکتے ہیں اور سب پراگرس سب کی آنکھوں کے سامنے ہر وقت آنلائن رہے گی]

نمونے کا لنک یہ ہے


مختصر تعارف
1۔ یہاں آپ کو A تا Z تمام ابواب نظر آ جائیں گے۔
2۔ ہر باب کے نیچے ٹائپسٹ اور پروف ریڈر کے نام، اور ہر باب پر پراگرس رپورٹ بطور نمونہ دی گئی ہے۔
3۔ ان تمام ابواب سے اوپر کتاب کے پروجیکٹ کا تعارف کروایا گیا ہے۔ [کتاب کا نام، مصنف، پروجیکٹ لیڈر، اراکین وغیرہ]۔
4۔ نیز میں نے یہ کیا ہے کہ حروف تہجی کے اعتبار سے امیجز کے فولڈرز کو نیٹ پر منتقل کر دیا ہے۔ اب جو بھی رکن کسی "حرف" پر کام کرنا چاہتا ہے، اسکے پاس اس حرف کے تمام امیجز یہاں پر موجود ہوں گے۔

کام کرنے کا طریقہ
5۔ اراکین کے پاس ہر حرف کی ٹیکسٹ فائل ہے۔۔۔۔۔ اور ہر حرف کے امیجز کی فائل بھی۔
وہ ٹائپنگ کا کام آنلائن ایڈیٹر میں بھی کر سکتے ہیں، اور آفلائن اپنے پسندیدہ ایڈیٹر میں بھی اور بعد میں سادگی سے اسے متعلقہ آنلائن باب میں پیسٹ کر کے Save کر دیں تاکہ چیزیں نیٹ پر شائع ہو جائیں۔

[نوٹ: ابتدا میں آپ لوگ آفلائن اپنے پسندیدہ ایڈیٹر میں کام کریں۔ جلد ہی ہم نیا آنلائن ایڈیٹر متعارف کروائیں گے جو کہ بہت ہی تیز رفتار ہو گا [موجودہ ڈیفالٹ ایڈیٹر بہت ہی سست رفتار ہے]

6۔ کام کرنے کا طریقہ بہت آسان ہے۔
۔ پہلے پروجیکٹ کتاب پر جائیں۔ [لنک میں نے اوپر دے دیا ہے]
۔ اراکین نے جس باب پر بھی کام کرنا ہے، اس پر کلک کر کے اس باب پر پہنچ جائیں۔
لائبریری کے ہر رکن کو ہر باب کے اوپر یہ امیج نظر آئے گا
edit.png

بس بالکل سادگی سے اس امیج پر کلک کریں، اور آپکے ایڈیٹر میں یہ باب لوڈ ہو کر خود بخود آپکے سامنے آ جائے گا۔
۔ اس ایڈیٹر باکس میں ٹیکسٹ کو پیسٹ کر دیں، اور پھر اسے Save کا بٹن دبا کر نیٹ پر شائع کر دی۔ ختم شد۔
۔ نہیں ٹہریے۔۔۔۔ ہر باب کے اوپر ہر ٹائپسٹ اور پروف ریڈر کو اپنا نام لکھنا ہو گا اور پراگرس رپورٹ لکھنا ہو گی۔ ۔۔۔۔ اور اب کے واقعی ختم شد۔

مجھے پتا ہے شروع میں ہر چیز ذرا مشکل نظر آتی ہے۔۔۔۔ مگر صرف ایک دو دفعہ کام کرنے کے بعد یہ گاجر کے حلوے کی طرح آسان چیز ثابت ہو گی۔

والسلام۔
 

الف نظامی

لائبریرین
میں اس بارے میں کچھ کہہ نہیں سکتا کیونکہ میں نے یہ اطلاقیہ استعمال نہیں کیا، لیکن میرا خیال ہے کہ یہ صرف اردو کے لئے ہے۔ اس سے پہلے انگلش اردو لغت کے لئے کیا ہوا تھا؟

لغت میں بہت سے مسائل ہوتے ہیں جو عام اردو کتابوں میں نہیں ہوتے اور انگلش اردو لغت میں ایک اضافی مسئلہ دو مختلف زبانوں کا ہوتا ہے۔ ایک Ltr اور دوسری Rtl۔ بہتر تو یہی ہو گا کہ کسی ڈیٹا بیس یا سپریڈشیٹ میں کام کیا جائے تاکہ اردو اور انگلش الفاظ علیحدہ فیلڈز یا سیلوں میں رہیں۔ کیونکہ انگلش الفاظ کی لسٹ موجود ہے اس لئے یہ مسئلہ نہیں ہونا چاہئیے۔ سپریڈشیٹ سب کے کمپیوٹرز پر ہو گی، چاہے M$ Excel ہو یا اوپن آفس Calc، یا کوئی اور۔ ایک کالم میں انگلش الفاظ ہوں گے، دوسرے میں اردو الفاظ ٹائپ کرنے ہوں گے۔ اس طرح ہم بہت سے مسائل سے بچ جائیں گے۔
اسد لغت کے ڈیٹا کے اندراج کے لیے ایکسل میں کام کیا گیا تھا جس کو بعد میں اکٹھا کرکے ایکس ایم ایل میں تبدیل کرلیا گیا۔
اگر تو چاچو ٹائپنگ ہیلپر میں متن کو ایکس ایم ایل میں محفوظ کرنے کی آپشن ڈال دی جائے تو وہ زیادہ بہتر ہوگا کیونکہ بار بار تصویر سے دیکھنا نہیں پڑے گا کہ اس اطلاقیہ میں اوپر تصویر اور نیچے ٹیکسٹ باکس موجود ہے جس سے بڑی آسانی سے برقیانے کا کام ہوسکتا ہے۔
ورنہ ایکسل تو ہے ہی۔
 

اسد

محفلین
السلام علیکم
اسد برادر،
اگر وقتی طور پر میں آپکے اس پراجیکٹ کو جملہ پر شروع کروا دوں تو آپکو کوئی اعتراض تو نہیں؟

مجھے اعتراض تو نہیں ہے، لیکن اس میں کاپی رائٹ کا تھوڑا سا مسئلہ ہے۔ میں ان لوگوں میں سے ہوں جو کاپی رائٹ کا خیال رکھتے ہیں۔ لیکن اس قسم کی علمی کتابوں، خصوصاً لغت، کے بارے میں کچھ نرم گوشہ رکھتا ہوں۔ سائٹ پر لغت کا مواد کتابی متن کی صورت میں رکھنا کچھ مناسب نہیں ہے۔ ہاں اس کا مواد کسی لغت اطلاقیہ میں استعمال ہو تو وہ اور بات ہے۔ ویسے تو یہ مقتدرہ نے شائع کی تھی، اسلئے جائز/حلال ہونی چاہئیے... مرتب: ڈاکٹر جمیل جالبی۔ سال اشاعت 1991

باقی لوگوں کا کیا خیال ہے؟

ایک سوال: کیا جملہ میں مواد ظاہر کرنے کے لئے ٹیبل دستیاب ہیں؟ یعنی ایک سیل میں اردو اور دوسرے میں انگلش۔
 
Top