0

大家好,我在尝试使其正常工作时遇到问题。基本上我想做的是读取一个包含这种数据的文本文件,但不是完全相似,而是相似,并计算每个字母出现在每一行的频率。真实数据还包含 0-255 之间的任何随机 ASCII。

一个例子是:

嗨,这是约翰。
我们要 .4%2) &,.! 米@ll

我想要的是在地图列表中实现的类似的东西

{H=3, i=3, ' '=3, t=1, h=2, s=2,... 直到行尾 },
{W=1, e=2, ' '=4 , a=1, r=1, g=2, o=1, i=1, n=1, .=2, 4=1, %=1....直到行尾},

所以它是一个地图列表

我曾尝试研究类似的问题,但在编码方面我能做的最接近的是这个。

List <Map<String, Integer>> storeListsofMaps = new ArrayList<Map<String, Integer>>();
ArrayList <String> storePerLine = new ArrayList<String>();
String getBuf;

try {
FileReader rf = new FileReader("simpleTextCharDist.txt");
BufferedReader encapRF = new BufferedReader(rf);

getBuf = encapRF.readLine();

while (getBuf!=null){
storePerLine.add(getBuf);

getBuf = encapRF.readLine();
}

for (String index: storePerLine){
Map<String, Integer> storeCharAndCount = new HashMap<String, Integer>();

Integer count = storeCharAndCount.get(index);
storeCharAndCount.put(index, (count==null)?count = 1:count+1);

storeListsofMaps.add(storeCharAndCount);
}

System.out.println("StoreListsofMaps: "+ storeListsofMaps);

encapRF.close();
}

我知道这段代码不会执行我描述的代码,但一直坚持到这一部分。我显示的代码只会计算单词本身而不是字符串中的每个字母。我尝试通过将字符串转换为 char [] 并再次将其转换回字符串来计算对字符串中每个元素的迭代,但它的效率非常低并且会产生很多错误。希望有人愿意提供帮助。

4

2 回答 2

1

这是实现此目的的伪算法-

  1. 使用文件 I/O 创建一个列表,其中包含 1 行作为列表中的 1 个元素
  2. 编写一个小的辅助函数,它将:
    1. 取字符串(表示步骤 1 中创建的列表中的元素)
    2. 遍历该行
    3. 创建一个 char 和 count 的映射。这个映射应该是返回类型。
  3. 创建一个Map<String,Map<String,Int>>其中第一个字符串是“Line1”、“Line2”等。第二个字符串是 char 值。内联写入的 Map 是从第 2 步返回的映射。

这应该有效。

于 2012-05-14T12:51:30.423 回答
1

想想你想要做什么。以文本形式写下你的算法。考虑一下何时必须创建变量,以及变量需要具有哪些类型。将您编写的算法与您的实际代码进行比较。

示例算法:

  1. 打开文件
  2. 创建字符到整数的映射列表 (ArrayList>)
  3. 阅读所有行;对于每一行:
    1. 为该行创建一个映射 char -> int (HashMap)
    2. 对于行中的每个字符 c:
      1. 更新地图中的计数
    3. 将地图存储在地图列表中的一行
于 2012-05-14T12:57:35.323 回答