以下程序将乌尔都语字符串与常规英语字符串分开。我写了这个程序
try {
File f = new File("C:/Users/user/Desktop/tes.txt");
FileReader reader = new FileReader(f);
BufferedReader br = new BufferedReader(reader);
String text = "";
String s;
while( ( s = br.readLine() ) != null) {
text += s;
}
String splits[] = text.split("سٹیمپ ختم ہو جاتی ہے");
for(int i=0;i<splits.length;i++) {
System.out.println(splits[i]);
}
} catch(Exception exc) {
exc.printStackTrace();
}
在记事本++中编译它,并运行它来得到这个输出:
∩╗┐╪│┘╣█î┘à┘╛ ╪«╪¬┘à █?┘ê ╪¼╪º╪¬█î █?█Æ
suhail
╪│┘╣█î┘à┘╛ ╪«╪¬┘à █?┘ê ╪¼╪º╪¬█î █?█Æ
gupta
╪│┘╣█î┘à┘╛ ╪«╪¬┘à █?┘ê ╪¼╪º╪¬█î █?█Æ
cse
╪│┘╣█î┘à┘╛ ╪«╪¬┘à █?┘ê ╪¼╪º╪¬█î █?█Æ
ghazal
╪│┘╣█î┘à┘╛ ╪«╪¬┘à █?┘ê ╪¼╪º╪¬█î █?█Æ
当文件tes.txt
看起来像这样时:
但是当我从 netbeans IDE 运行相同的程序时,我得到了预期的输出:
suhail
gupta
cse
ghazal
当我在notepad ++中编写后运行相同的程序然后使用命令编译它有什么区别:
javac -encoding UTF-8 checker.java
java checker
并在netbeans IDE中复制相同的程序并按下运行按钮?在第一种情况下,字符串不会从 regex 中拆分出来urdu string
。