我有一个由许多字符串组成的文件。对于每个字符串,我想创建长度为 4 的子字符串,然后将每个子字符串与另一个 SPSS 文件中的单词字典进行比较。例如,如果我有字符串“transport”,我想创建一个由 4 个字母组成的字符串列表(例如,'tran'、'rans'、'ansp' 等)。对于这些 4 字母字符串中的每一个,我想知道它是否存在于另一个包含一长串单词的文件中。这是我在 SPSS 中的语法:
*rawNonword 是我的第一个文件中字符串的名称。
计算 chars = char.length(rawNonword)。
琴弦架 (A50)。
循环 #i = 1 到 chars-4。
计算持有人 = char.substr(rawNonword, #i, 4)。
*这里我想将持有者与另一个文件中的字符串进行比较。
结束循环。
执行。
我意识到合并和匹配函数通常在 SPSS 中使用,但似乎我不能在循环中使用它们。我相信这个问题在 python 中相当容易,但我需要在 SPSS 中完成这个任务。如果 4 个字母的字符串存在于另一个文件中,SPSS 中是否有一个简单的函数将返回值 1 或 true?