زہیر عبّاس
محفلین
مجھے مائیکروسافٹ ورڈ کی فائل یا ٹیکسٹ فائل کو جملوں میں توڑنا ہے۔ یعنی فائل میں مختلف پیراگراف موجود ہیں اور ہر پیراگراف میں مختلف جملے۔ میں چاہتا ہوں کہ ہر پیراگراف کا ہر جملہ ایک نئی سطر سے شروع ہو۔ کوئی میکرو کی صورت میں یا کسی دوسری صورت میں مدد کرسکتا ہے۔
مجھے انٹرنیٹ سے تلاش کرتے ہوئے یہ کوڈ ملا ہے تاہم یہ شاید پیتھون میں ہے جس کی مجھے کچھ سمجھ نہیں ہے کہ اس کو میں کیسے اور کہاں استعمال کروں:
مجھے انٹرنیٹ سے تلاش کرتے ہوئے یہ کوڈ ملا ہے تاہم یہ شاید پیتھون میں ہے جس کی مجھے کچھ سمجھ نہیں ہے کہ اس کو میں کیسے اور کہاں استعمال کروں:
کوڈ:
String str = "This is how I tried to split a paragraph into a sentence. But, there is a problem. My paragraph includes dates like Jan.13, 2014 , words like U.S and numbers like 2.2. They all got splitted by the above code.";
Pattern re = Pattern.compile("[^.!?\\s][^.!?]*(?:[.!?](?!['\"]?\\s|$)[^.!?]*)*[.!?]?['\"]?(?=\\s|$)", Pattern.MULTILINE | Pattern.COMMENTS);
Matcher reMatcher = re.matcher(str);
while (reMatcher.find()) {
System.out.println(reMatcher.group());
}