-3

编辑:对于那些投反对票的人:我非常清楚我不想要代码并且我自己已经尝试过。我所寻找的只是对产生样本结果的数学过程的解释。

第一个问题。我做了很多研究,最后求助于提问,所以如果我在某个地方错过了答案,我深表歉意。我有一个问题我真的很挣扎:

编写一个接受三个命令行参数的 Python 3 脚本:

1. 包含 n 个由空格分隔的字符串的文本文件的名称。
2.一个正整数k。
3. 脚本将创建的文本文件的名称,以便存储来自输入文件的 n 个字符串中的 k 个唯一字符串的所有可能子序列,每行一个子序列。

例如,假设命令行是 gen.py input.txt 3 output.txt 并且文件 input.txt 包含以下行:

Python Java C++ Java Java Python

那么程序应该创建包含以下行的文件 output.txt (以任何顺序):

Python Java C++
Python C++ Java
Java C++ Python
C++ Java Python

这些组合应该通过您的生成器函数实现生成(即使用关键字yield)。



据我了解,根据示例输出,这并不完全符合子序列的定义;它们也不是很排列,所以我不知道如何去做。我知道如何处理文件 IO 和命令行参数部分,我只是无法获得正确的子序列。我不需要直接的答案,因为我应该解决这个问题,但如果有人能给我一些有用的见解,我将不胜感激。

4

1 回答 1

1

如果您被允许使用 itertools:

import itertools
import sys

def unique_substrings(txt_lst:list, k:int) -> set:
    return set([' '.join(combo) for combo in itertools.combinations(txt_lst, 3) \
                if len(set(combo))==3])

if __name__ == "__main__":
    infile, k, outfile = sys.argv[1:]
    with open(infile) as inf:
        txt_lst = infile.read().split()
    with open(outfile) as outf:
        for line in unique_substrings(txt_lst, k):
            outf.write(line + "\n")

但是,从您的讲师的评论中:

这些组合应该通过您的生成器函数实现生成(即使用关键字yield)。

看起来这实际上不会起作用。

itertools.combinations可以用近似以下的东西(来自文档)重新实现:

def combinations(iterable, r):
    # combinations('ABCD', 2) --> AB AC AD BC BD CD
    # combinations(range(4), 3) --> 012 013 023 123
    pool = tuple(iterable)
    n = len(pool)
    if r > n:
        return
    indices = list(range(r))
    yield tuple(pool[i] for i in indices)
    while True:
        for i in reversed(range(r)):
            if indices[i] != i + n - r:
                break
        else:
            return
        indices[i] += 1
        for j in range(i+1, r):
            indices[j] = indices[j-1] + 1
        yield tuple(pool[i] for i in indices)
于 2015-02-09T03:34:43.050 回答