问题标签 [mecab]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
250 浏览

r - 在 R 中标记日文文本:仅对指定列的第一行进行标记

我正在尝试使用 Japanese tokenizer 标记一组推文RMeCab,特别是函数RMeCabDF(用于数据帧)。

该文档说明了以下用法:

RMeCabDF

描述

RMeCabDF 将数据帧作为第一个参数,并分析第二个参数指定的列。空白数据应替换为 NA。如果将 1 指定为第三个参数,则返回每个语素的基本形式。

用法

RMeCabDF(dataf, coln, mypref, dic = "", mecabrc = "", etc = "")

论据

dataf 数据帧

coln 包含日语句子的列号或名称

mypref 默认为 0,返回文本中出现的相同词素形式。如果指定了 1,则它们的基本形式是相反的。

dic 指定用户字典,ex ishida.dic

mecabrc 未实现(指定 mecab 资源文件)

mecab的其他选项

因此,在此之后,我使用以下代码来标记数据框中的列89trump_ja

这导致List of 1- 但如您所见,数据框有 989 行。

在此处输入图像描述

我的其他行去哪儿了?

我必须逐行标记吗?如果是这样,有没有办法自动化这个过程以避免输入 1000 行代码(或使用 Excel 生成 1000 行代码)?

0 投票
2 回答
2144 浏览

python - 如何使用 pip 在 mac OS 上安装 mecab-python3

我正在尝试通过 安装mecab-python3pip install mecab-python3但出现以下错误。

仅供参考,这是 pip 的版本:pip 18.1 from /Users/XXX/.pyenv/versions/anaconda3-5.2.0/lib/python3.6/site-packages/pip (python 3.6)

谁能帮我?


更新。

跟随mmedina的评论后,出现以下错误。

0 投票
0 回答
274 浏览

java - 无法在java窗口中加载mecab

我正在尝试在 Windows 上的 java 中使用 mecab 库。我已经为 Windows 安装了一个预建的 mecab 库。当我尝试加载它时

它会引发以下错误。

我在库路径上添加了 mecab

我可以从 Windows 命令提示符访问 Mecab。有没有人遇到过类似的问题并解决了这个问题?任何帮助在这里表示赞赏。

0 投票
2 回答
111 浏览

php - 如何排除 Mecab 解析器功能障碍

背景:我已经建立了一个自定义搜索引擎,它在英语中运行良好,但在日语中失败,尽管我的主机服务器确认我已经正确执行了日语 mecab 解析器的安装。我自己的检查显示以下内容:

1)显示创建表

FULLTEXT KEY search_newsletter( letter_title, letter_abstract, letter_body) /*!50100 WITH PARSER mecab*/ ) ENGINE=InnoDB AUTO_INCREMENT=5 DEFAULT CHARSET=latin1

2)显示插件

格拉姆 | 活跃 | 解析器 | 空 | 通用公共许可证 | 出租车 | 活跃 | 解析器 | libpluginmecab.so | GPL

执行

1)MYSQL语句

$sql ="SELECT letter_no, letter_lang, letter_title, letter_abstract, submission_date, revision_date, MATCH (letter_title, letter_abstract, letter_body) AGAINST (? IN NATURAL LANGUAGE MODE) AS letter_score FROM sevengates_letter WHERE MATCH (letter_title, letter_abstract, letter_body) AGAINST (? IN NATURAL LANGUAGE MODE) ORDER BY letter_score DESC";

2)自定义搜索引擎

请参阅https://www.grammarcaptive.com/overview.html下的本地搜索/新闻通讯

3)文件搜索

请参阅https://www.grammarcaptive.com/overview.html下的定期更新/时事通讯/档案/日语

评论:PHP 和 MySQL 都没有抱怨。只是不返回任何需要解析的日语单词搜索。例如,日本语这个词可以被搜索到,但不需要任何解析来检索。在时事通讯中搜索任何其他日语单词都会失败。

请求:任何故障排除提示将不胜感激。

罗迪

0 投票
1 回答
142 浏览

python-3.x - MeCab 解析不正确

我下载了 MeCab 来解析一些日文文本。为了测试它,我尝试了一些在线示例。

例如,我逐字遵循这个人的提示:http ://www.robfahey.co.uk/blog/japanese-text-analysis-in-python/

代码如下:

我期待的输出是:

但是,我得到了这个:

对于熟悉 MeCab 或解析节点的人来说,我到底做错了什么?再次感谢你的帮助!

0 投票
1 回答
160 浏览

python-3.x - 尽管 pip3 show 找到了 python 包,但无法导入它

我对找不到已安装软件包的错误感到困扰:

我尝试通过运行 setup.py 或从 pip 安装它。

下面是展示结果:

运行 pip3 install mecab-python3 时收到此警告。想知道是否相关。

目录 '/home/labmanager/.cache/pip/http' 或其父目录不归当前用户所有,缓存已被禁用。请检查该目录的权限和所有者。如果使用 sudo 执行 pip,您可能需要 sudo 的 -H 标志。目录 '/home/labmanager/.cache/pip' 或其父目录不归当前用户所有,并且缓存轮已被禁用。检查该目录的权限和所有者。如果使用 sudo 执行 pip,您可能需要 sudo 的 -H 标志。

非常感谢您的帮助。

0 投票
1 回答
545 浏览

python - 在 Mac OS 上安装 mecab-python3 时出错

我的电脑是 MacOS Mojave 10.14.3。

当我安装时:

我收到以下错误消息:

我单独安装了'swig',它工作正常:

可能是什么问题?我希望原代码的 setup.py 不需要修改。那是因为我的Mac是新的吗?

感谢帮助。

0 投票
1 回答
874 浏览

mecab - 为什么会发生运行时错误?导入 Mecab 后

什么是问题?我用python3 windows10环境是Anaconda

0 投票
1 回答
1149 浏览

mecab - 是否有 mecab(日语单词解析器)算法的描述?

是否有描述 Mecab 算法的文档?

或者有人可以给出一个简单的一段或一页的描述吗?

我发现很难理解现有代码以及数据库包含的内容。

我需要在我的免费网站和电话应用程序中使用此功能来教授语言 (www.jtlanguage.com)。我还想将它推广到其他语言,并利用我已经实现的共轭检测机制,而且我也需要它而无需许可。因此,我想创建自己的实现(C#)。

我已经有一个从 EDICT 派生的字典数据库。还需要什么?使用频率数据库?

谢谢你。

0 投票
1 回答
720 浏览

ruby-on-rails - 无法打开库“/usr/lib/libmecab.so.2”:/usr/lib/libmecab.so.2:无法打开共享对象文件:没有这样的文件或目录(LoadError)

当我尝试启动我的 Rails 服务器时,出现与 mecab 相关的错误所以我按照下面给出的说明安装 mecab 并成功安装我检查了 mecab 的版本

在安装 mecab 时,遵循的步骤是

毕竟,当我尝试启动 Rails 服务器时,我得到了以下错误