问题标签 [contractions]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
3201 浏览

python - ImportError:无法从“收缩”中导入名称“CONTRACTION_MAP”

一个问题是:该CONTRACTION_MAP变量是否已从contractions包中弃用?

0 投票
1 回答
204 浏览

python - 替换 Pandas DataFrame 中出现撇号的文本的问题

我正在使用一个 Pandas DataFrame,我从 Excel 中读取了它,并且想要查找和替换文本中的缩略词(例如,不要 -> 不要)。我使用的代码在替换不包含撇号的文本时有效,但不适用于包含撇号的单词。

我已经定义了一个字典来指定要进行哪些替换。我在下面提供了一个示例,以及执行替换的代码。

奇怪的是,上面的代码在我手动创建的数据帧上测试时有效,但它不适用于我从 Excel 读取的数据帧。任何想法为什么?

这是它工作的手动创建的数据框:

这是我用来在它不起作用的数据框中读取的代码:

我尝试在撇号之前使用转义字符(如上)。我试过双引号和单引号作为撇号

如果有人可以帮助确定为什么它不适用于 Excel 读取的数据并提出解决方案,我将不胜感激。

0 投票
0 回答
152 浏览

adjacency-list - Karger 算法 - 运行时间 - 边缘收缩

在用于无向(可能加权)多重图的Karger 最小割算法中,主要操作是收缩随机选择的边并将其事件顶点合并到一个元顶点中。重复这个过程,直到剩下两个顶点。这些顶点对应于一个切割。该算法可以使用邻接列表来实现。

问题:

  1. 我怎样才能找到已选择收缩的特定边缘?

  2. 边缘如何收缩(在未加权和/或加权图中)?

  3. 为什么这个过程需要二次时间?

编辑:我发现一些信息表明运行时间可以是二次的,因为我们有 O(n-2) 个顶点收缩并且每次收缩可能需要 O(n) 时间。如果有人能解释一下,为什么收缩在邻接列表中需要线性时间,那就太好了。注意收缩包括:删除一个相邻边,将两个顶点合并为一个超节点,并确保剩余的相邻边连接到超节点。

伪代码:

我已阅读相关主题Karger Min cut algorithm running time,但对我没有帮助。另外我没有太多经验,因此非常感谢“外行”术语解释!

0 投票
0 回答
61 浏览

python - 数据集中的扩展收缩

我的数据框有数千行。它看起来像这样:

我想扩大列标记的收缩。这是我的字典

和我试过的代码

但我收到这样的错误:

所需的最终输出如下所示:

我不明白错误是什么意思

0 投票
0 回答
1471 浏览

python - 无法安装包收缩

我已经跑!pip install contractions进去了jupyter notebook,它无法安装库收缩,并显示下面的消息;

错误:

命令出错,退出状态为 1:命令:'C:\Users\tassa\anaconda3\python.exe' -u -c 'import sys, setuptools, tokenize; sys.argv[0] = '"'"'C:\Users\tassa\AppData\Local\Temp\pip-install-6m7bhg7o\pyahocorasick\setup.py'"'"'; file ='"'"'C:\Users\tassa\AppData\Local\Temp\pip-install-6m7bhg7o\pyahocorasick\setup.py'"'"';f=getattr(tokenize, '"'"'open' "'"', open)( file );code=f.read().replace('"'"'\r\n'"'"', '"'"'\n'"'"'); f.close();exec(compile(code, file , '"'"'exec'"'"'))' bdist_wheel -d 'C:
运行 build_ext 构建“ahocorasick”扩展错误:需要 Microsoft Visual C++ 14.0 或更高版本。使用“Microsoft C++ 构建工具”获取它: https
://visualstudio.microsoft.com/visual-cpp-build-tools/ ---------- ------------------ 错误:pyahocorasick 构建轮子失败错误:命令出错,退出状态为 1:命令:'C:\Users\tassa\anaconda3\python.exe ' -u -c '导入系统,设置工具,标记化;sys.argv[0] = '"'"'C:\Users\tassa\AppData\Local\Temp\pip-install-6m7bhg7o\pyahocorasick\setup.py'"'"'; file ='"'"'C:\Users\tassa\AppData\Local\Temp\pip-install-6m7bhg7o\pyahocorasick\setup.py'"'"';f=getattr(tokenize, '"'"'open'文件,'"'"'exec'"'"'))' 安装 --record 'C:\Users\tassa\AppData\Local\Temp\pip-record-b10kt37w\install-record.txt' --single-版本-外部管理 --compile --install-headers 'C:\Users\tassa\anaconda3\Include\pyahocorasick' cwd: C:\Users\tassa\AppData\Local\Temp\pip-install-6m7bhg7o\pyahocorasick
Complete输出(5 行):运行 install running build running build_ext building 'ahocorasick' 扩展错误:需要 Microsoft Visual C++ 14.0 或更高版本。使用“Microsoft C++ 构建工具”获取它: https ://visualstudio.microsoft.com/visual-cpp-build-tools/ ---------------------------------------- 错误:命令出错,退出状态为 1: 'C:\Users\tassa\anaconda3\python.exe' -u -c 'import sys, setuptools, tokenize; sys.argv[0] = '"'"'C:\Users\tassa\AppData\Local\Temp\pip-install-6m7bhg7o\pyahocorasick\setup.py'"'"'; file ='"'"'C:\Users\tassa\AppData\Local\Temp\pip-install-6m7bhg7o\pyahocorasick\setup.py'"'"';f=getattr(tokenize, '"'"'open' "'"', open)( file );code=f.read().replace('"'"'\r\n'"'"', '"'"'\n'"'"'); f.close();exec(compile(code, file , '"'"'exec'"'"