我正在使用基于 MySpell 的Hunspell ,但我不知道如何对中间带有撇号的单词进行拼写检查。
根据以下示例,我正在 Max OS X Terminal 的命令行上对其进行测试:
这个短语有单引号和一个撇号(全部使用 ASCII 0x27 '
)
He doesn't like 'Big Jon'
我正在保存这个文件,test.txt
然后hunspell
按如下方式运行程序以显示拼写错误:
~$ /usr/bin/hunspell -d en-GB -l test.txt
doesn
这打印"doesn"
为拼写失败。所有其他单词都通过了,包括砍掉的"t"
。
这个词doesn't
在我的字典里。(从 Mozilla 下载)
我可以通过添加到词缀文件(en-GB.aff)来强制字典不拆分单词,WORDCHARS '
但是引用的单词会被认为拼写错误,所以我得到:
~$ /usr/bin/hunspell -d en-GB -l test.txt
'Big
Jon'
有没有办法(无需预处理文本)来匹配有效的缩写和 decapse 引用?