我的函数解析文本并删除短词,例如“a”、“the”、“in”、“on”、“at”等。
将来可能会修改这些单词的列表。此外,在不同列表之间切换(即,针对不同语言)也可能是一种选择。
那么,我应该在哪里存储这样的列表?
- 约50-200字
- 每分钟阅读很多次
- 几乎没有写入(修改)——例如,几个月一次
我有这些选择:
- 代码中的列表(最快,但听起来不是一个好习惯)
- 一个单独的文件“stop_words.txt”(从文件中读取的速度有多快?我应该每隔几秒钟从同一个文件中读取相同的数据吗?我调用同一个函数?)
- 一个数据库表。当单词列表应该几乎是静态的时,它真的有效吗?
我正在使用 Ruby on Rails(如果这有什么不同的话)。