我的项目目的:有 4 个文件。他们每个人都有不同的行数。每行由一个或几个单词组成。现在,对于这些文件中的每一个,我想计算哪个文件具有最多的常用词。
- 例如。(',' 是一个新行\n)
- 输入:
- 文件 1 行:A、B、C、D
- 文件 2 行:C、D、E、F
- 文件 3 行:A、E、C、G
文件 4 行:C、E、F、A
输出 :
- 文件 1:最多常用词为 2,它们在文件中:文件 2 (C,D)、文件 3 (A,C) 和文件 4 (C,A)。
- 文件 2:最多常用词为 3,它们在文件中:文件 4 (C,E,F)。
- 文件 3:最多常用词为 3,它们在文件中:文件 4 (C,E,A)。
- 文件 4:最多常用词为 3,它们在文件中:文件 2 (C,E,F)。
我的逻辑:
- 开始
- 从文件中读取每一行并将其作为一维数组存储在内存中(例如,array1[0] = "A"、array1[1] = "B" 等等。
- 由于有 4 个文件,我创建了 4 个数组 = array1 到 array4。它们中的每一个都将具有其相应文件的内容。
- 现在我将比较第一个数组中的第一个单词和第二个数组中的第一个单词。
- 现在我将比较第一个数组中的第一个单词和第二个数组中的第二个单词,依此类推,直到第二个数组的末尾。
- 我将继续这个直到最后一个数组中的最后一个单词。
- 当我发现匹配的东西时,我会通过递增 1 在变量中记下。
想知道这是否是解决这个问题的权利。
或者有没有更好的方法来思考这个问题?
编辑:1.忘记添加,将使用php。