问题标签 [mecab]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在 R 中标记日文文本:仅对指定列的第一行进行标记
我正在尝试使用 Japanese tokenizer 标记一组推文RMeCab
,特别是函数RMeCabDF
(用于数据帧)。
该文档说明了以下用法:
RMeCabDF
描述
RMeCabDF 将数据帧作为第一个参数,并分析第二个参数指定的列。空白数据应替换为 NA。如果将 1 指定为第三个参数,则返回每个语素的基本形式。
用法
RMeCabDF(dataf, coln, mypref, dic = "", mecabrc = "", etc = "")
论据
dataf 数据帧
coln 包含日语句子的列号或名称
mypref 默认为 0,返回文本中出现的相同词素形式。如果指定了 1,则它们的基本形式是相反的。
dic 指定用户字典,ex ishida.dic
mecabrc 未实现(指定 mecab 资源文件)
等 mecab的其他选项
因此,在此之后,我使用以下代码来标记数据框中的列89
号trump_ja
:
这导致List of 1
- 但如您所见,数据框有 989 行。
我的其他行去哪儿了?
我必须逐行标记吗?如果是这样,有没有办法自动化这个过程以避免输入 1000 行代码(或使用 Excel 生成 1000 行代码)?
python - 如何使用 pip 在 mac OS 上安装 mecab-python3
我正在尝试通过 安装mecab-python3
,pip install mecab-python3
但出现以下错误。
仅供参考,这是 pip 的版本:pip 18.1 from /Users/XXX/.pyenv/versions/anaconda3-5.2.0/lib/python3.6/site-packages/pip (python 3.6)
谁能帮我?
更新。
跟随mmedina的评论后,出现以下错误。
java - 无法在java窗口中加载mecab
我正在尝试在 Windows 上的 java 中使用 mecab 库。我已经为 Windows 安装了一个预建的 mecab 库。当我尝试加载它时
它会引发以下错误。
我在库路径上添加了 mecab
我可以从 Windows 命令提示符访问 Mecab。有没有人遇到过类似的问题并解决了这个问题?任何帮助在这里表示赞赏。
php - 如何排除 Mecab 解析器功能障碍
背景:我已经建立了一个自定义搜索引擎,它在英语中运行良好,但在日语中失败,尽管我的主机服务器确认我已经正确执行了日语 mecab 解析器的安装。我自己的检查显示以下内容:
1)显示创建表:
FULLTEXT KEY
search_newsletter
(letter_title
,letter_abstract
,letter_body
) /*!50100 WITH PARSERmecab
*/ ) ENGINE=InnoDB AUTO_INCREMENT=5 DEFAULT CHARSET=latin1
2)显示插件:
格拉姆 | 活跃 | 解析器 | 空 | 通用公共许可证 | 出租车 | 活跃 | 解析器 | libpluginmecab.so | GPL
执行
1)MYSQL语句:
$sql ="SELECT letter_no, letter_lang, letter_title, letter_abstract, submission_date, revision_date, MATCH (letter_title, letter_abstract, letter_body) AGAINST (? IN NATURAL LANGUAGE MODE) AS letter_score FROM sevengates_letter WHERE MATCH (letter_title, letter_abstract, letter_body) AGAINST (? IN NATURAL LANGUAGE MODE) ORDER BY letter_score DESC";
2)自定义搜索引擎:
请参阅https://www.grammarcaptive.com/overview.html下的本地搜索/新闻通讯
3)文件搜索:
请参阅https://www.grammarcaptive.com/overview.html下的定期更新/时事通讯/档案/日语
评论:PHP 和 MySQL 都没有抱怨。只是不返回任何需要解析的日语单词搜索。例如,日本语这个词可以被搜索到,但不需要任何解析来检索。在时事通讯中搜索任何其他日语单词都会失败。
请求:任何故障排除提示将不胜感激。
罗迪
python-3.x - MeCab 解析不正确
我下载了 MeCab 来解析一些日文文本。为了测试它,我尝试了一些在线示例。
例如,我逐字遵循这个人的提示:http ://www.robfahey.co.uk/blog/japanese-text-analysis-in-python/
代码如下:
我期待的输出是:
但是,我得到了这个:
对于熟悉 MeCab 或解析节点的人来说,我到底做错了什么?再次感谢你的帮助!
python-3.x - 尽管 pip3 show 找到了 python 包,但无法导入它
我对找不到已安装软件包的错误感到困扰:
我尝试通过运行 setup.py 或从 pip 安装它。
下面是展示结果:
运行 pip3 install mecab-python3 时收到此警告。想知道是否相关。
目录 '/home/labmanager/.cache/pip/http' 或其父目录不归当前用户所有,缓存已被禁用。请检查该目录的权限和所有者。如果使用 sudo 执行 pip,您可能需要 sudo 的 -H 标志。目录 '/home/labmanager/.cache/pip' 或其父目录不归当前用户所有,并且缓存轮已被禁用。检查该目录的权限和所有者。如果使用 sudo 执行 pip,您可能需要 sudo 的 -H 标志。
非常感谢您的帮助。
python - 在 Mac OS 上安装 mecab-python3 时出错
我的电脑是 MacOS Mojave 10.14.3。
当我安装时:
我收到以下错误消息:
我单独安装了'swig',它工作正常:
可能是什么问题?我希望原代码的 setup.py 不需要修改。那是因为我的Mac是新的吗?
感谢帮助。
mecab - 为什么会发生运行时错误?导入 Mecab 后
什么是问题?我用python3 windows10环境是Anaconda
mecab - 是否有 mecab(日语单词解析器)算法的描述?
是否有描述 Mecab 算法的文档?
或者有人可以给出一个简单的一段或一页的描述吗?
我发现很难理解现有代码以及数据库包含的内容。
我需要在我的免费网站和电话应用程序中使用此功能来教授语言 (www.jtlanguage.com)。我还想将它推广到其他语言,并利用我已经实现的共轭检测机制,而且我也需要它而无需许可。因此,我想创建自己的实现(C#)。
我已经有一个从 EDICT 派生的字典数据库。还需要什么?使用频率数据库?
谢谢你。
ruby-on-rails - 无法打开库“/usr/lib/libmecab.so.2”:/usr/lib/libmecab.so.2:无法打开共享对象文件:没有这样的文件或目录(LoadError)
当我尝试启动我的 Rails 服务器时,出现与 mecab 相关的错误所以我按照下面给出的说明安装 mecab 并成功安装我检查了 mecab 的版本
在安装 mecab 时,遵循的步骤是
毕竟,当我尝试启动 Rails 服务器时,我得到了以下错误