问题标签 [morphological-analysis]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
8 回答
3557 浏览

morphological-analysis - 有免费的德语形态分析库吗?

我正在寻找一个可以对德语单词进行形态分析的库,即将任何单词转换为其根形式并提供有关分析单词的元信息。

例如:

我的收藏:

  • 它必须与名词和动词一起使用。
  • 我知道鉴于德语的复杂性,这是一项非常艰巨的任务,因此我也在寻找仅提供近似值或可能仅 80% 准确的库。
  • 我更喜欢不使用字典的库,但考虑到情况,我也愿意妥协。
  • 我也更喜欢 C/C++/Delphi Windows 库,因为这会使它们更容易集成,但 .NET、Java 等也可以。
  • 它必须是一个免费的图书馆。(L)GPL、MPL、...

编辑:我知道,由于单词不规则,根本无法在没有任何字典的情况下进行形态分析。当我说,我更喜欢没有字典的库时,我的意思是那些映射每个单词的完整字典:

这些字典有几个缺点,包括体积庞大和无法处理未知单词。

当然所有的异常只能用字典来处理:

(我的脑子现在在旋转:))

0 投票
1 回答
104 浏览

nlp - Java中的形态音素处理库

是否有任何带有预建字典的好的 Java 库,我可以使用这些库来尝试从输入单词中提取词根?

我问了一个更一般的问题,它取代了这个问题。它就在这里。请投票结束这个问题。

0 投票
2 回答
4682 浏览

matlab - 是否有图像处理函数可以在 MATLAB 中获取二进制图像的骨架

骨架化的目的是用最小的像素集表示二值图像。骨架必须考虑形状的几何属性并保留关联关系。

我的问题是如何从二进制图像中获取骨架?

0 投票
2 回答
3509 浏览

matlab - Skeleton的算法是什么

此函数bwmorph (Img,' skel ', Inf ) 返回二值图像的骨架。

我正在寻找的是这个函数用来手动执行它的算法?

0 投票
1 回答
173 浏览

forms - 如何在字符串中搜索不同的时态?

我可以使用词干、过滤器等。没问题。

但是这种情况呢,例如源文本包含以下短语:

狐狸跳了起来。

用户已输入:fox AND make Results = 0;

问题是如何处理不规则形式的单词?

0 投票
1 回答
1131 浏览

algorithm - 二值图像中环形或空心伪影检测的算法

有谁知道可以检测环或空心物体的算法,以及它们各自用于二进制图像的像素集?

我宁愿它是自动的,因为空心人工制品的数量和分钟大小(通过边界提取处理的指纹)。

我目前正在制定一个应该给出结果的像素连接算法,但它在性能方面绝不是有效的。

0 投票
1 回答
4696 浏览

image-processing - opencv形态膨胀过滤器作为最大过滤器

就像中值滤波器的定义一样,我可以将“最大滤波器”定义为本地窗口

例如 dst(x,y) = max(3x3 局部窗口像素)

但是我在opencv中找不到这样的过滤器,最接近的是“扩张”功能

然后我使用“扩张”功能的默认配置,但与我的最大过滤器的蛮力实现相比,结果是不正确的。

我发现对于 3x3 的情况,等效扩张配置是使用 1x1 矩形结构元素,即

dilate(src, dst, getStructuringElement(MORPH_RECT, Size(1,1)))

我的问题是:

  1. 对我来说,我认为结构元素等同于本地窗口似乎违反直觉。但是现在本地窗口的大小只有 1x1 像素?

  2. 如果我的最大过滤器的本地窗口扩大(例如 5x5、7x7)怎么办?最大过滤器和膨胀过滤器之间有什么关系吗?

0 投票
2 回答
588 浏览

c# - 创建树数据结构

我有一些数据:

……

每行都是数组,每个字母都是对象。我有比较器功能,可以说字母 A 与字母 a 等价(实际上它不是字母。它是俄语单词,比较器功能使用形态学让我知道单词相等,例如 матрешка==матрешки==матрешкины 和数组俄语句子。例如:“Мама мыла раму”)。我想创建如下所示的树数据结构:

否则子节点必须包含来自父节点的字母。如果您知道如何使用 google adwords,我想您可以理解我。我的问题是如何快速做到这一点。我需要用数千个数组创建树。比较功能工作得非常慢(它使用大字典),这就是为什么速度是真正的问题。

一些简单的数据(对不起俄语):

这是一组句子

我们必须创建以下树数据结构

其他父节点:

子节点必须包含比父节点更多的单词。

0 投票
2 回答
2361 浏览

nlp - 英语词形还原数据库?

您是否知道任何足够大的 lemmatizer 数据库可以为以下示例词返回正确结果:

Wordnet 的形态分析器是不够的,因为它给出了以下不正确的结果:

0 投票
4 回答
3704 浏览

php - 使用 wordnet 获取单词的引理

如何使用 Wordnet 获得给定单词的引理。我似乎无法在 wordnet 文档中找到我想要的东西。 http://wordnet.princeton.edu/wordnet/man/wn.1WN.html

例如,对于“books”这个词,我想得到“book”,ashes => ash,booking => book,apples => apple .... 等。

我想在命令行中使用 wordnet 来实现这一点,但我找不到准确的选项来检索这种情况。

一个 php 解决方案也会有很大帮助,因为我最初打算使用 wordnet php API,但他们网站上的当前 API 似乎无法正常工作。