问题标签 [pyenchant]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - PyEnchant 将字典中的单词“纠正”为不在字典中的单词
我正在尝试从网络论坛中获取大量自然语言并使用 PyEnchant 更正拼写。文本通常是非正式的,而且是关于医疗问题的,所以我创建了一个文本文件“test.pwl”,其中包含相关的医疗词汇、聊天缩写等。在某些情况下,不幸的是,一小部分 html、url 等仍然保留在其中。
我的脚本旨在同时使用 en_US 字典和 PWL 来查找所有拼写错误的单词,并完全自动将它们更正为 d.suggest 的第一个建议。它打印一个拼写错误的单词列表,然后是一个没有建议的单词列表,并将更正的文本写入“spellfixed.txt”:
问题是输出通常包含对字典或 pwl 中单词的“更正”。例如,当输入的第一部分是:
我的新医生觉得我现在是双极的。这是在被其他人认为严重抑郁9年后
我懂了:
我的新医生觉得我现在是躁郁症。这是在被其他人认为严重抑郁9年后
我可以处理案件的变化,但医生 --> dotor 一点也不好。当输入要短得多时(例如,上面的引用是整个输入),结果是可取的:
我的新医生觉得我现在患有躁郁症。这是在被其他人认为严重抑郁9年后
有人可以向我解释为什么吗?请用非常简单的话说,因为我对编程很陌生,对 Python 也很陌生。一步一步的解决方案将不胜感激。
python - 在 python 中使用 pyenchant 进行拼写检查,而不是英语
我在 python 中使用 pyenchant 进行拼写检查。我的代码适用于英语,但现在我想让它也适用于其他语言。为此,首先我需要确认特定单词是否属于所选语言。例如,tree
可能是英文单词,也可能不是英文单词,即这个单词中的所有字符都属于,english
所以它可能是一个有效的英文单词。我可以使用python的isalpha
函数来检查它与英语的归属。
isalpha
将返回 falsetree's
因为'
不是英文字符。
在这种情况下,我会将单词从任何不在英语词典中的字符中拆分出来。为此,我使用以下代码:
我将再次isalpha
对每个字符使用函数并在函数返回 false 时拆分。
不幸的是,我没有得到任何类似于isalpha
其他语言的功能。其次,如果我将上述代码用于其他语言,那么它会在输出中打印奇数值。例如,如果我想为hindi
语言运行它,
此代码的输出?
在每一行中打印。
我有两个问题要问
1)阅读英语以外的语言字符的正确方法是什么?
isalpha
2)除了英语之外,还有其他语言的替代功能吗?
python - PyEnchant:带有个人单词列表的文本拼写检查块
因此,PyEnchant 允许您在语言词典之外定义正确拼写单词的个人单词列表:
但是,生成的d2
检查器属于 class Dict
,只能用于检查单个单词,例如:
该类SpellChecker
允许对文本块进行拼写检查。但是,我似乎无法找到如何指定个人单词列表,如Dict
. 这不是受支持的功能吗?我想根据 en_US 加上我的个人单词列表对一段文本进行拼写检查。有任何想法吗?
python - EC2 Enchant 找不到字典 en_US
我正在尝试运行该命令d = enchant.Dict('en_US')
,但收到一条错误消息"enchant.errors.DictNotFoundError: Dictionary for language 'en_US' could not be found"
我已经运行了命令sudo yum install aspell -en
并尝试设置参数路径"enchant.set_param("enchant.aspell.dictionary.path","/usr/lib64/aspell-0.60")"
无济于事。
有什么建议么?
python - 从 Windows 上的 pyenchant 导入附魔时出错
我已经在我的系统上安装了 pyenchant,但是当我运行“import enchant”命令时,我收到一条错误消息,告诉我“找不到 附魔 'C' 库”。我试过安装 Abiword 文字处理器来单独安装附魔,可以这么说。但仍然得到同样的错误。
在 OSX 上使用 pip 安装 pyenchant 时,我已阅读“未找到附魔 C 库”中的解决方案,但这是针对 Mac 的,我在 Windows 8.1 上运行
python - 我可以从 PyEnchant 的字典中排除单词吗?
使用 PyEnchant 时是否可以从字典中排除某些单词?例如,我想检查一个单词是英语('en_EN'
在我的情况下)还是法语('fr_FR'
)。"de
但是,当我针对两个字典检查字符串" 时,都返回 true。
python - PyEnchant 在导入时引发 WinError 193,使用 Python 3.3.4
当我尝试导入 PyEnchant 时,它会引发错误。我已经使用 pip 和他们在其网站上提供的 exe 安装和卸载了它。
只是一个通过命令提示符使用 Python 的示例:
python - Python附魔字典存在但不起作用
我正在使用 Python2.7 并试图获得 enchant 或 aspell 以提供一些丹麦语拼写建议。我正在使用 OS X Yosemite
我下载了brew install aspell --with-lang-da
并且似乎工作,因为字典似乎存在。
问题是没有出现任何建议。就像字典存在但为空一样。
谢谢...
python - Python - 检查字符串是否是英文单词的开头
我一直在玩各种模块(例如PyEnchant),我想做的是确定一个字符串是否是一个英文单词的开头。例如
但我不确定是否有办法做到这一点,而无需创建和加载我自己的单词列表。
python - 安装 Enchant 库 + PyEnchant
我目前正在尝试安装 Enchant 库,以便将它与 PyEnchant 一起用于我正在从事的项目。我从官方 SVN 存储库中检查了源代码,并找到了一个文档,指导我如何正确地将源代码构建到一个版本中:
http://svn.abisource.com/enchant/trunk/msvc/Build.win32.readme
但是,我在其他地方找到了生成的二进制文件,并决定抓住它们,看看里面有什么。我发现了这个:
http://i.gyazo.com/33e3d2e79cf03182725466dfbefc1dc6.png
在 lib 目录中:http: //gyazo.com/e9a0097ce96e5f1bc0859ec80076f38c
上面引用的说明提到了需要从一个地方复制到另一个地方的 6 个不同文件,但是我不知道这个神秘的位置在哪里,也不知道它为什么让这个库神奇地工作。有问题的说明是:
对此的任何帮助都将不胜感激,因为它让我陷入困境,我讨厌不知道一些事情,特别是考虑到这可能是显而易见的事情,我应该知道。
此外,您应该知道我在 amd64 机器/安装上使用 Python 3.4,因此包含 Enchant 的 PyEnchant 预构建包不是一个选项,或者至少据我所知。
提前致谢!
问候,
刘易斯·瓦茨