问题标签 [morphological-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
morphological-analysis - 有免费的德语形态分析库吗?
我正在寻找一个可以对德语单词进行形态分析的库,即将任何单词转换为其根形式并提供有关分析单词的元信息。
例如:
我的收藏:
- 它必须与名词和动词一起使用。
- 我知道鉴于德语的复杂性,这是一项非常艰巨的任务,因此我也在寻找仅提供近似值或可能仅 80% 准确的库。
- 我更喜欢不使用字典的库,但考虑到情况,我也愿意妥协。
- 我也更喜欢 C/C++/Delphi Windows 库,因为这会使它们更容易集成,但 .NET、Java 等也可以。
- 它必须是一个免费的图书馆。(L)GPL、MPL、...
编辑:我知道,由于单词不规则,根本无法在没有任何字典的情况下进行形态分析。当我说,我更喜欢没有字典的库时,我的意思是那些映射每个单词的完整字典:
这些字典有几个缺点,包括体积庞大和无法处理未知单词。
当然所有的异常只能用字典来处理:
(我的脑子现在在旋转:))
nlp - Java中的形态音素处理库
是否有任何带有预建字典的好的 Java 库,我可以使用这些库来尝试从输入单词中提取词根?
我问了一个更一般的问题,它取代了这个问题。它就在这里。请投票结束这个问题。
matlab - 是否有图像处理函数可以在 MATLAB 中获取二进制图像的骨架
骨架化的目的是用最小的像素集表示二值图像。骨架必须考虑形状的几何属性并保留关联关系。
我的问题是如何从二进制图像中获取骨架?
matlab - Skeleton的算法是什么
此函数bwmorph (Img,' skel ', Inf ) 返回二值图像的骨架。
我正在寻找的是这个函数用来手动执行它的算法?
forms - 如何在字符串中搜索不同的时态?
我可以使用词干、过滤器等。没问题。
但是这种情况呢,例如源文本包含以下短语:
狐狸跳了起来。
用户已输入:fox AND make Results = 0;
问题是如何处理不规则形式的单词?
algorithm - 二值图像中环形或空心伪影检测的算法
有谁知道可以检测环或空心物体的算法,以及它们各自用于二进制图像的像素集?
我宁愿它是自动的,因为空心人工制品的数量和分钟大小(通过边界提取处理的指纹)。
我目前正在制定一个应该给出结果的像素连接算法,但它在性能方面绝不是有效的。
image-processing - opencv形态膨胀过滤器作为最大过滤器
就像中值滤波器的定义一样,我可以将“最大滤波器”定义为本地窗口
例如 dst(x,y) = max(3x3 局部窗口像素)
但是我在opencv中找不到这样的过滤器,最接近的是“扩张”功能
然后我使用“扩张”功能的默认配置,但与我的最大过滤器的蛮力实现相比,结果是不正确的。
我发现对于 3x3 的情况,等效扩张配置是使用 1x1 矩形结构元素,即
dilate(src, dst, getStructuringElement(MORPH_RECT, Size(1,1)))
我的问题是:
对我来说,我认为结构元素等同于本地窗口似乎违反直觉。但是现在本地窗口的大小只有 1x1 像素?
如果我的最大过滤器的本地窗口扩大(例如 5x5、7x7)怎么办?最大过滤器和膨胀过滤器之间有什么关系吗?
c# - 创建树数据结构
我有一些数据:
……
每行都是数组,每个字母都是对象。我有比较器功能,可以说字母 A 与字母 a 等价(实际上它不是字母。它是俄语单词,比较器功能使用形态学让我知道单词相等,例如 матрешка==матрешки==матрешкины 和数组俄语句子。例如:“Мама мыла раму”)。我想创建如下所示的树数据结构:
否则子节点必须包含来自父节点的字母。如果您知道如何使用 google adwords,我想您可以理解我。我的问题是如何快速做到这一点。我需要用数千个数组创建树。比较功能工作得非常慢(它使用大字典),这就是为什么速度是真正的问题。
一些简单的数据(对不起俄语):
这是一组句子
我们必须创建以下树数据结构
其他父节点:
子节点必须包含比父节点更多的单词。
nlp - 英语词形还原数据库?
您是否知道任何足够大的 lemmatizer 数据库可以为以下示例词返回正确结果:
Wordnet 的形态分析器是不够的,因为它给出了以下不正确的结果:
php - 使用 wordnet 获取单词的引理
如何使用 Wordnet 获得给定单词的引理。我似乎无法在 wordnet 文档中找到我想要的东西。 http://wordnet.princeton.edu/wordnet/man/wn.1WN.html
例如,对于“books”这个词,我想得到“book”,ashes => ash,booking => book,apples => apple .... 等。
我想在命令行中使用 wordnet 来实现这一点,但我找不到准确的选项来检索这种情况。
一个 php 解决方案也会有很大帮助,因为我最初打算使用 wordnet php API,但他们网站上的当前 API 似乎无法正常工作。