问题标签 [pyenchant]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 在 Python Pandas 的列表中过滤掉非英语句子
所以有一个excel文件,我已经通过pandas读取并将其存储在数据框'df'中。现在该 excel 文件包含 24 列作为“问题”和 631 行作为“响应/答案”。
因此,我将一个这样的问题转换为一个列表,以便我可以对其进行标记并在其上应用更多与 nlp 相关的任务。
现在,这给了我一个包含 631 个句子的列表,其中一些句子是非英语的。所以我想过滤掉非英语句子,这样最后我就剩下一个只包含英语句子的列表.
我有的:
输出(我想要的):
另外,我读到了一个名为 pyenchant 的 python 库,它应该能够做到这一点,但它与 windows 64bit 和 python 3 不兼容。有没有其他方法可以做到这一点?
谢谢!
python - Pyenchant:如何以“err.word,string”格式打印结果
我正在尝试对字符串列表进行拼写检查。使用下面的代码,我只得到错误词(err.word)。但是我想打印字符串以及错误词,例如
我尝试过
但它没有产生我想要的。有什么建议么?
python - 为凯撒密码编写蛮力,出错
所以我在 python 中编写了一个凯撒密码,我有一个蛮力选项来查看它是否可以解码具有随机偏移量的单词。出于某种原因,我得到了错误:
我的代码是:
感谢您的阅读,如果您能对您可以看到的任何改进发表评论,我将不胜感激。
python - IndexError:列表索引超出范围 - 附魔
我正在尝试使用 python 来纠正大型语料库的拼写(大约 100000 个短语):
买了一块大地毯后,我期待一个大包装,并对其非常小的尺寸感到惊讶我想验证内容是否与我的订单一致并且司机不允许它,但还是推荐在订单中?
降低环境音乐的声音......当我们进入这种类型的商店装饰时,我们是为了这句话来的,我们不想找到装饰的超市氛围。有库存的产品,我们可以离开。
店内员工的球童满载而归,在店内随处可见,无人看管,产生人流和整体视野 以论坛店铺为例
包重,单身女性不方便穿:我把车停在店门口,问有没有人可以帮我回答:不行,万一出事我们无权离开店!! !.
嵌入搜索而不是参考网站或在标签上注明产品名称 汽车 我需要知道产品的尺寸,但在网站上找到的时间很长,因为参考不允许我找到我买的物品前段时间有一个损坏的产品(对一幅画不好),但自从我想要它的那一刻起......我问它是否是最后一个副本,因为买一个产品很简单,我被派去螺栓部队!
...
脚本:
该程序可以运行,但会因错误而停止:
回溯(最近一次通话最后):
文件“correction.py”,第 4 行,更正 = error.suggest()[0] IndexError: list index out of range
python - 无法在 jupyter 笔记本上导入附魔
我为 python 3.6.7 32 位 Windows 为 pyenchant 创建了一个不同的环境。我已经完成了 pip install pyenchant。它已成功安装。从命令提示符中,我可以导入库并运行示例。但是,当从同一环境中,我加载 jupyter 笔记本,并尝试导入附魔但它给出了错误:ModuleNotFoundError: No module named 'enchant'。我浪费了很多时间试图修复它。任何线索表示赞赏。
python - 使用python获取不同语言的单词列表
NLTK
我正在尝试以与提供英语相同的方式获取一种语言中所有单词的列表。见英文示例:
我已经尝试使用pyenchant
来实现类似的结果,但是文档没有更新我在下载意大利语词典 (MacOS) 时遇到了一些麻烦。
是否有可能获得法文、德文和意大利文的类似列表?
python - 如何遍历包含字符串列表的熊猫行以检查每个单词是否为英文?
我有一个包含评论文本的熊猫数据框。在文本预处理之后,我最终得到了每行中的字符串列表。现在我想遍历这些字符串列表的每一行来检查每个字符串是否是英文的。我想计算非英语单词的出现次数以创建另一列“出现次数”。
对于英语检查,我将使用 pyenchant 库。
类似于下面的代码
python - Python 库找出段落中的有效英文单词
我有一个段落列表,我想检查这些单词是否是有效的英文单词。有时,由于一些外部问题,我可能无法在这些段落中找到有效的英文单词。我知道像 pyenchant 和 nltk 这样的库,它们有一组字典并提供一定程度的准确性,但这两者都没有什么缺点。我想知道是否存在另一个库或程序可以尽可能准确地为我提供我正在寻找的东西。