问题标签 [maxent]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 用于语言特征的 Java 中的 MaxEnt 分类器实现?
我想在训练语料库上训练 MaxEnt 分类器。我的特征是语法和语义的,如 POS 标签或 NER 标签等。Java中是否有任何支持定义此类功能的MaxEnt分类器实现?
machine-learning - 大型多类 NLP 分类的不平衡数据和样本量
我正在做一个 NLP 项目,我希望使用 MaxEnt 将文本分类为 20 个不同的类之一。我正在根据手写的管理数据手动创建训练、验证和测试集。
我想确定训练集中的类所需的样本量以及验证/测试集的适当大小。
在现实世界中,这 20 个结果是不平衡的。但我正在考虑创建一个平衡的训练集来帮助构建模型。
所以我有两个问题:
我应该如何确定训练集中每个类别的适当样本量?
验证/测试集是否应该不平衡以反映模型在面对现实世界数据时可能遇到的情况?
stanford-nlp - 如何读取 stanford pos tagger 附带的 .tagger 文件
我无法使用文本编辑器读取我的语言的 stanford maxent 标记器随附的 .tagger 文件。我如何查看 .tagger 文件的内容。
r - MaxEnt(软件 R)的预测函数
我正在尝试使用预测功能来预测空间转移中的潜在发生点。为此,我使用 dismo 包加载原始空间中的存在点,原始空间的 17 个栅格层和传输空间的 17 个栅格层。所有栅格在范围、网格分辨率和维度上都是相同的,仅在地理坐标上有所不同。原始空间和转移空间位于不同的大陆,我在训练和测试中使用了 kfold 技术对我的样本进行分区。
我适合我的 maxent 模型:
但是,我无法在传输空间中投影我的拟合模型,返回:
*预测器 1 和 2 在光栅堆栈文件中
*正确选择了所有目录,并且在目录中找到了文件。
*both, stack 对于每个地理空间都包含相同的变量
ocr - 使用斯坦福分类器进行字符识别
我正在开发一个与 OCR 相关的 android 应用程序,我需要使用多元逻辑回归来对字母进行分类。我的问题是,我可以使用斯坦福分类器(http://nlp.stanford.edu/software/classifier.shtml)进行字符识别吗?如果它可以在图像数据集上进行训练?如果我不能,那么请为此目的向我推荐一个 JAVA 库。
stanford-nlp - 为什么 MaxentTagger 有时会将数字标记为 NN?
我正在尝试标记一个充满空格分隔数字的 HTML 页面,例如“5320412185 5320412184 5320412189...”,以观察标记器如何处理数字。我english-left3words-distsim.tagger
在构造函数中使用。我在控制台上观察到大多数数字都被标记为,CD
但有时也有数字被标记为NN
. 我在 nlp.stanford.edu 的常见问题页面上进行了搜索,但在那里找不到。谁能帮助我理解这一点?
我不知道是否需要提及这一点:我通过基于空格分隔符拆分大量输入(1045000 个数字!),将每个数字分别提供给标记器。
r - Modifying and Masking Environmental Layers within specific asia area in R
I am trying to prepare the environmental layers (constrained in specific Asia area) for use in Maxent model. However, I ran into some error messages in the last line:
Error in compareRaster(x, mask) : different extent
The details for predictors3 were
The details for ra were:
My goal is to prepare a RasterLayer or Rasterstack contains all variables of "predictors3" but limited in the range of "ra". As you can see the extent of ra was included in the extent of predictors3 and their resolutions were identical. How should I fix the error?
java - 无法查看 MaxEnt 输出图
我最近从http://www.cs.princeton.edu/~schapire/maxent/网站下载了 MaxEnt Model v3.3.3e 软件。我已经解决了许多问题,并且成功地运行了带有要查看的输出文件的程序。但是,输出文件没有为我提供地图图片。我确实得到了包含所有统计数据和绘图的 html 文档,我还得到了一个 plots 文件夹,但我没有得到显示我物种的生态位模型的图片或地图。
有谁知道为什么会发生这种情况?这与我在运行程序之前检查的选项有关吗?任何想法或建议都会很有帮助。谢谢。
雅各布
r - 在 R 中运行 Maxent
抱歉,如果这个问题以前出现过,但我想问一下是否有人知道maxent()
dismo 包中每个参数的内容?我搜索了各种 R 论坛站点和 R 帮助页面本身,但我不明白如何提出我的论点。我在这里有一个用于预测变量的数据框样本
每行要么是背景点,要么是存在点。之后我不明白的是maxent()
公式中的 p 和 a 参数。p 参数是否包含 x 和 y 坐标以及指示 1(存在)和 0(不存在)的第 3 列?还是包含 1 和 0 的列改为 a 参数?forest_cover
是一个分类变量。
请告诉我是否应该移动一些东西,以及它们是否在正确的数据框中。提前致谢
r - 重用保存的模型 (Maxent) 来预测 R 中的新输入
我正在尝试从多个来源重新创建学习,并尝试使用我自己的数据在 R 中构建一个带有 maxent 的模型。我能够训练、测试和验证数据集的结果。
我已经保存了训练好的模型,并试图通过加载新模型来预测新的输入。
下面是我的训练模型代码
我使用以下代码重新加载模型:
我接近这个权利吗?验证后的结果未达到预期水平,但这也可能是因为输入。召回分数低于 20%。