我想使用 java 解析多个 doc 文件(MS office)的文件名。我该怎么做呢?
我能够找到关于从文档本身中提取信息的 API,但我找不到有关文件名本身的信息。
所以说我有一个 doc 文件XX_232312_22
,我只想解析文件名(即232312
部分)。
编辑:如果我们需要解析的不仅仅是一个文件,我们会怎么做?例如,一个目录中的所有 1000 个文件?
我想使用 java 解析多个 doc 文件(MS office)的文件名。我该怎么做呢?
我能够找到关于从文档本身中提取信息的 API,但我找不到有关文件名本身的信息。
所以说我有一个 doc 文件XX_232312_22
,我只想解析文件名(即232312
部分)。
编辑:如果我们需要解析的不仅仅是一个文件,我们会怎么做?例如,一个目录中的所有 1000 个文件?
String[] parts = filename.split("-");
parts[0] // part before dash
parts[1] // part after dash
您可以在 java 文档中查找 String.split:http: //docs.oracle.com/javase/6/docs/api/java/lang/String.html#split%28java.lang.String%29
编辑:
OP 将文件名的格式更改为 XX_filename__00。
那将是
String[] parts = filename.split("_");
parts[0] // part before first _
parts[1] // part between two _
parts[2] // part after second _
这应该适合你。
fileName.split("-")[0]