问题标签 [morphological-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
windows - 从 Windows 命令行使用 foma/flookup
我正在关注https://fomafst.github.io/morphtut.html上的 foma 教程,除了flookup之外,一切都对我有用。我已将 C:\Program Files\foma 添加到我的 PATH 系统变量并编译了 lexc、foma 和 bin 文件,但是当我尝试
我明白了
当我尝试
我明白了
正确的输出应该是
和
分别。
我最好的猜测是这是 Linux 和 Windows 之间的兼容性问题。我应该怎么做才能完成这项工作?
solr - 使用 Solr 实现形态搜索
我正在尝试使用 Solr 实现形态搜索。
下面是形态搜索的快速介绍:这意味着搜索算法在创建搜索索引和搜索所请求的短语时会考虑单词的所有语法形式。
例如,在索引单词 child 时,系统会将 child 和 children 同时添加到索引中。类似的规则也适用于动词:对于带来,系统添加带来,带来等。因此,如果用户搜索短语“儿童带来”,系统将显示所有包含孩子,孩子,带来,带来,带来等的结果。
这是我的两个选项:
1) Lemmatize 每个标记并在索引时使用它,并在搜索时对查询字符串执行相同操作。我不想使用这种方法,因为当我开始支持形态搜索时,这会使我的索引不一致,因为以前的文档将缺少引理标记。我也不想重新索引。
2)仅在查询时,找到引理的所有变体(例如:“brought”的引理是“bring”)并通过我的令牌过滤器将这些作为附加令牌生成。这将服务于形态搜索,而无需索引/重新索引任何内容。
问题:
是否有任何好的 Java 库可以为我提供引理的变体/变形(或词根。例如:“brought”的引理是“bring”)?
python - 如何获取二进制二维数组中不完整多边形的计数
计算布尔二维矩阵中多边形的程序
当前代码:能够使用递归 DFS 算法获得总多边形的数量(无论是否完成)。但我需要单独计算已完成和未完成的。
样本 10x10 二进制矩阵:
在此如何获取封闭多边形和不完整多边形的计数。
python - 打印文件中标记有形态标记的所有标记
我想打印文件中带有形态标记的所有标记。到目前为止,我编写了如下所示的代码。
输出是这样的,我可以在标记和行号中找到名词,但无法打印我想要的部分。我只想要+号之前的单词部分。
我的文件中的行是这样的:
例如,当我编写标签时,我想获取令牌。例如,当我编写 +Adj 时,我想获取所有包含 +Adj 的标记(nispi,izafi ....(例如))。
image-processing - 填充 3D 体积中的孔
我正在尝试找到可以填充体积内的小空腔以及像管子一样穿过体积的孔的库。我曾尝试过SimpleITK,但没有取得任何成功。我在那里尝试了所有的灰度形态学操作,但这些漏洞并没有被填满。我想知道这个问题的解决方案。
过滤器是使用默认参数以这种方式创建的,然后应用于输入图像。
谢谢并恭祝安康
瓦布哈夫
r - 如何修复在 RStudios Geomorph 包中注册为大气矢量的 3D ACII .ply?
当我尝试在我的 3D 模型上放置地标时,在打开它并将其放入 RStudios 全局环境后,我得到“错误:$ 运算符对原子向量无效”。在此步骤之前,我能够在数据框中成功绘制对象。当我尝试使用 $material 以及 [material] 命令更改颜色时,我也遇到了这个问题。是否需要事先进行某种转换过程才能将文件转换为数据框或数组?
我对该软件包没有太多经验,因此我尝试将原始二进制 .ply 重新导出为 MeshLab 和 Rhino 的 ACII .ply 无济于事。
库("geomorph", lib.loc="~/R/win-library/3.5")
read.ply("...")
BI98<-read.ply("...")
digit.fixed(..., 10,,ptsize = .1)
错误:$ 运算符对原子向量无效
颜色:
...$材料<-“灰色”
错误:$ 运算符对原子向量无效
...[材质]<-“灰色”
错误:$ 运算符对大气向量无效
至少我希望能够放置地标,即使我无法更改对象的颜色。
c# - 从后缀列表中获取主要单词
我有一个像“itibarsızlaştırmak”这样的词。
词干是“itibar”,后缀列表是“a, ak, ar, ı, laş, m, sız, i”。
后缀列表丢失。“ma, tır, ız, i, ı, a, m, sı, mak, tı, sız, ak, ar, laş”是正确的。
我怎样才能达到“itibarsızlaştırmak”的后缀列表顺序?
例如:itibar + suffixList[6] -> itibarsız
itibar + suffixList[6] + suffixList[5] -> itibarsızlaş
单词和后缀列表一直在变化。所以我需要一个算法。我尝试将后缀与词干和比较一一合并,但不适用于所有列表。
谢谢。