0

我目前有一个文本文件,其中包含以下内容:

1 Commercial & Enterprise  5   SLICE    59.99  IP MICRO 
2 Commercial & Enterprise  5   SLICE    59.99  MULTI-USE SWITCH
.
.
.
.
18 Government & Military   6   TCP      15.00  TCP 

我正在尝试拆分线路,以便我可以拥有以下内容:

Product number:  18
Category:        Government & Military
Product name:  TCP
Units in stock: 6
Price: $15.00
Total value: $90.00
Fee: $4.50
Total value: $94.50  

我目前有以下代码:

while ((line = lineReader.readLine()) != null) {

            StringTokenizer tokens = new StringTokenizer(line, "\t");

            p = new ActionProduct();
            add(p);
            String category = p.getCategory();
            String name = p.getName();
            category = tokens.nextToken();
            int item = p.getItem();
            double price = p.getPrice();
            int units = p.getUnits();

            while (tokens.hasMoreTokens()) {
            item = Integer.parseInt(tokens.nextToken());
            price = Double.parseDouble(tokens.nextToken());
            units = Integer.parseInt(tokens.nextToken());
            }

            System.out.println("Category: " + category);
            System.out.println("Product number:  " + item);
            System.out.println("Product name:  " + name);
            System.out.println("Units in stock: "+ units);
            System.out.println("Price: $" + String.format("%.2f", price)); 
            System.out.println("Total value: $" + String.format("%.2f",p.value()));
            System.out.println("Fee: $" + String.format("%.2f", p.fee()));

            System.out.println("Total value: $" + String.format("%.2f", value()));
        }

而我得到的是这个输出:

Category: 1 Commercial & Enterprise  5   SLICE    59.99  IP MICRO             
Product number:  0
Product name:  null
Units in stock: 0
Price: $0.00
Total value: $0.00
Fee: $0.00
Total value: $0.00
Category: 2 Commercial & Enterprise  5   SLICE    59.99  MULTI-USE SWITCH     
Product number:  0
Product name:  null
Units in stock: 0
Price: $0.00
Total value: $0.00
Fee: $0.00
Total value: $0.00

所以我的问题是……我必须做些什么来拆分生产线,这样我就可以单独打印我的纺织品的每个价值?在此先感谢各位,非常感谢一些指导!

这是我的文本文件:

1 Commercial & Enterprise  5   SLICE    59.99  IP MICRO             
2 Commercial & Enterprise  5   SLICE    59.99  MULTI-USE SWITCH     
3 Commercial & Enterprise  4   SLICE    59.99  2100                 
4 Commercial & Enterprise  6   SLICE    59.99  IP                   
5 Commercial & Enterprise  4   HDX      45.00  HYBRID CARRIER       
6 Commercial & Enterprise  10  TRANSip  45.00  IP Technology Suite  
7 Commercial & Enterprise  5   GUI      30.00  LINK COMMAND SYS     
8 Commercial & Enterprise  5   GUI      30.00  MAUI                 
9 Commercial & Enterprise  6   RCP      20.00  RCP                  
10 Government & Military   5   SLICE    60.00  IP MICRO             
11 Government & Military   5   SLICE    60.00  MULTI-USE SWITCH     
12 Government & Military   4   SLICE    60.00  2100                 
13 Government & Military   6   SLICE    55.00  IP                   
14 Government & Military   4   HDX.C    35.00  HYBRID CARRIER       
15 Government & Military   10  TRANSip  30.00  IP Technology Suite  
16 Government & Military   5   GUI      20.00  LINK COMMAND SYS     
17 Government & Military   5   GUI      20.00  MAUI                 
18 Government & Military   6   TCP      15.00  TCP  
4

2 回答 2

1

由于您想根据任意模式拆分文本,这正是RegEx 的用途;使用 RegEx 解析器对您的输入进行标记,然后根据需要处理标记。

简而言之,您读取文件,将其传递给 RegEx 标记器,然后处理标记(即字符串)

您的数据的示例正则表达式模式是

[0-9]+[\s]+[a-zA-Z\s\Q&\E]+[\s]+[0-9]+[\s]+[a-zA-Z]+[ \s]+[0-9\Q.\E]+[\s]+[a-zA-Z0-9]+

您可以使用例如快速有效地创建您的模式

http://gskinner.com/RegExr/

进一步阅读:

http://en.wikipedia.org/wiki/Regular_expression

http://docs.oracle.com/javase/tutorial/essential/regex/

http://docs.oracle.com/javase/1.4.2/docs/api/java/util/regex/Pattern.html

于 2012-03-31T20:07:41.807 回答
1

好好看看数据。您是否获得更多数据,或者这是唯一的文件?

如果您要获取更多数据,则需要某种规范,这样您就可以确定您的解析器将继续工作。

如果您有固定的数据定位,那么您可以使用

String part = line.substring(beginIndex, endIndex)

这个数据文件几乎是固定位置的,除了产品编号增加的时候..

相反,您可以尝试使用 regex 或 line.split(delimitor)

在你真正理解它们之前,不要过多地使用正则表达式。

如果这是唯一的文件,我想我会从一个

String[] parts = line.split("  ") //two spaces

然后从你得到的字符串数组中解析。

第一部分,parts[0],将包含产品编号和类别,但您也可以将其拆分。

于 2012-03-31T20:38:27.310 回答