我有一个 1500 万字的语料库,我想将其存储在数据库中。然后我希望能够找到给定单词,它在语料库中的上下文。例如,对于“朋友”这个词,我可能会选择以下内容,我也会在每个“朋友”之前和之后选择五个词:
... night i went to my FRIENDS house for a cup of tea ...
... what did you say my FRIENDS cat is sick and ...
... if you like my FRIENDS dad can pick you up ...
我怎样才能最好地组织我的数据库以以这种方式有效地选择给定的单词?当我需要数据库时,我通常使用 sqlite,但在这种情况下,也许其他东西会更好。