我正在尝试读取具有 urdu 数据的文件。当我在记事本++中查看文件时,它有乌尔都语中的数据。但是当我在 Eclipse 中查看它时,它会显示某种类型的编码(可能是它有一些默认值)。
原始乌尔都语数据(记事本++):
"10","کراچی میں ٹماٹر کی قیمت میں کمی،25روپے فی کلو ہوگیا","Entertainment"
在日食中:
"10","کراچی میں ٹماٹر کی قیمت میں کمی،25روپے �ی کلو �وگیا","Entertainment"
现在这很奇怪,默认情况下会发生一些编码。有什么方法可以获取原始形式的数据,这样当我对其进行一些处理并将其写入文件时,我希望以原始乌尔都语形式而不是任何编码处理数据。
这是代码。
public class DataProcessing {
/**
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
DataProcessing dataProcessingObj = new DataProcessing();
dataProcessingObj.readDataFromFile("small_dataset.txt");
}
private void readDataFromFile(String fileName)
{
BufferedReader br = null;
try{
br = new BufferedReader(new FileReader(fileName));
String line = "";
while( (line = br.readLine()) != null )
{
System.out.println(line);
}
}
catch(Exception ex){
ex.printStackTrace();
}
}
}
如果你能帮助我,我会很感激你。