0

我有一个由许多字符串组成的文件。对于每个字符串,我想创建长度为 4 的子字符串,然后将每个子字符串与另一个 SPSS 文件中的单词字典进行比较。例如,如果我有字符串“transport”,我想创建一个由 4 个字母组成的字符串列表(例如,'tran'、'rans'、'ansp' 等)。对于这些 4 字母字符串中的每一个,我想知道它是否存在于另一个包含一长串单词的文件中。这是我在 SPSS 中的语法:

*rawNonword 是我的第一个文件中字符串的名称。

计算 chars = char.length(rawNonword)。

琴弦架 (A50)。

循环 #i = 1 到 chars-4。

计算持有人 = char.substr(rawNonword, #i, 4)。

*这里我想将持有者与另一个文件中的字符串进行比较。

结束循环。

执行。

我意识到合并和匹配函数通常在 SPSS 中使用,但似乎我不能在循环中使用它们。我相信这个问题在 python 中相当容易,但我需要在 SPSS 中完成这个任务。如果 4 个字母的字符串存在于另一个文件中,SPSS 中是否有一个简单的函数将返回值 1 或 true?

4

1 回答 1

0

使用 Python 插件和 extendedTransforms.vlookup 函数当然更容易,但在传统语法中,您可以创建一个包含所有四字母片段的变量,对两个文件进行排序,并使用该变量作为匹配文件的表匹配钥匙。

于 2013-09-13T21:06:17.927 回答