15

我的 Java 程序递归地读取目录的内容。这是一个示例树(注意非 ASCII 字符):

./sviluppo
./sviluppo/ciaò
./sviluppo/ciaò/subdir
./sviluppo/pippo
./sviluppo/pippo/prova2.txt <-file
./sviluppo/così

该程序作为 Upstart 服务启动,配置文件名为/init/myservice.conf

description "Private Service"
author "AD"
start on runlevel [2345]
stop on runlevel [! 2345]
exec java -jar /home/mainFind.jar >> /tmp/log.txt

当我启动服务时:

root@mdr:/tmp#  service myservice start
myservice start/running, process 15344

它不会记录名称中包含非 ASCII 字符的文件名:

root@mdr:/tmp#  cat /tmp/log.txt
Found dir: /mnt/sviluppo/pippo

相反,当我运行命令(以 root 身份运行,以模仿它作为服务启动时发生的情况)时,它工作正常,有和没有exec

root@mdr:/tmp# java -jar /home/mainFind.jar  >> /tmp/log.txt
root@mdr:/tmp# exec java -jar /home/mainFind.jar  >> /tmp/log.txt

root@mdr:/tmp#  cat /tmp/log.txt
Found dir: /mnt/sviluppo/ciaò
Found dir: /mnt/sviluppo/ciaò/subdir
Found dir: /mnt/sviluppo/pippo
Found dir: /mnt/sviluppo/così

为什么由同一用户运行的同一程序在 Upstart 服务中不起作用,但在从命令行运行时正确处理所有文件名?这是Java代码

public static void aggiungiFileDir(File f){
  File[] lista= f.listFiles();
  for(int i=0;i<lista.length;i++){
    if(lista[i].isDirectory()){
      System.out.println("Found dir: "+lista[i]); 
    }
  }
}

其中形式参数f是根目录。该函数将在每个子目录上递归调用。

编辑 2:发布 ls

root@mdr:/tmp# ls -al /mnt/sviluppo
totale 20
drwx------ 5 root root 4096 nov 15 15:10 .
drwxr-xr-x 7 root root 4096 nov  9 10:43 ..
drwxr-xr-x 2 root root 4096 nov 15 15:10 ciaò
drwxr-xr-x 2 root root 4096 nov 15 11:23 così
drwxr-xr-x 2 root root 4096 nov 15 17:57 pippo
4

2 回答 2

20

Java 使用本机调用来列出目录的内容。底层 C 运行时依赖于语言环境String概念,从文件系统存储的字节 blob 作为文件名构建 Java 。

当您从 shell(作为特权用户或非特权用户)执行 Java 程序时,它带有一个由变量组成的环境。读取该变量LANG以将字节流转码为 Java 字符串,默认情况下在 Ubuntu 上它与 UTF-8 编码相关联。

请注意,进程不需要从任何 shell 运行,但从代码来看,Upstart 似乎足够聪明,可以理解何时打算从 shell 执行配置文件中的命令。因此,假设通过 shell 调用 JVM,问题在于LANG未设置变量,因此 C 运行时假定默认字符集,它恰好不是UTF-8。解决方案在 Upstart 节中:

description "List UTF-8 encoded filenames"
author "Raffaele Sgarro"
env LANG=en_US.UTF-8
script
  cd /workspace
  java -jar list.jar test > log.txt
end script

我用作en_US.UTF-8语言环境,但任何支持 UTF-8 的语言环境都可以。测试的来源list.jar

public static void main(String[] args) {
    for (File file : new File(args[0]).listFiles()) {
        System.out.println(file.getName());
    }
}

该目录/workspace/test包含文件名,如àààèèè等等。现在您可以转到数据库部分;)

于 2012-11-16T21:57:42.057 回答
-1

将此添加到 /etc/init.d/script 为我解决了这个问题(我从 /etc/init.d/tomcat7 复制了它):

# Make sure script is started with system locale
if [ -r /etc/default/locale ]; then
    . /etc/default/locale
    export LANG
fi

我机器上 /etc/default/locale 的内容:

LANGUAGE=en_US:en
LANG=en_US.UTF-8
于 2018-03-25T08:06:36.433 回答