问题标签 [mallet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 如何使用槌获得词主题概率
我已经使用槌制作了一个平行主题模型。
我想获得每个文档的热门词。
为此,我试图获得一个词主题概率矩阵。
我将如何实现这一目标?
java - 在 Java 中运行 MALLET
我正在尝试在 Java 中运行 Mallet 并收到以下错误。
我正在尝试从 Mallet 的网站 ( http://mallet.cs.umass.edu/topics-devel.php ) 运行示例。下面是我的代码。任何帮助表示赞赏。
mallet - 您如何从命令行使用 GenericAcrfTui 查看测试集的标签?
我正在使用 Mallet 的 GenericAcrfTui 训练和测试数据。所以我正在使用槌中的图形模型 (GRMM) 进行 CRF 训练。我已经为我的训练集和测试集创建了功能,并希望从命令行运行 GenericAcrfTui。当我运行它时,我会取回每个标签的 F 分数和准确度度量,但我不会取回每一行的实际标签。我做这样的事情:
这是槌示例中给出的示例。似乎没有用于获取标签的开关。如何做到这一点?
mallet - 将txt文件导入mallet时出错
我在将一些 txt 文件转换为木槌时遇到了麻烦。我不断得到:
线程“主”java.lang.IllegalStateException 中的异常:第 39843 行与正则表达式不匹配:
行#39843 为:24393584 |针对四肢肉瘤患者的丹麦版多伦多肢体挽救评分问卷的标题验证。多伦多肢体挽救评分 (TESS) 问卷是一种自我管理的问卷,旨在评估患者的身体残疾接受过四肢手术。本研究的目的是验证 TESS 的丹麦语翻译。TESS 是根据国际指南翻译的。该研究共招募了 22 名参加常规门诊控制计划的连续患者。为了测试他们对问卷的理解,他们被要求描述从 TESS 中随机选择的五个问题的含义。测试了丹麦版 TESS 的心理测量学特性的有效性和可靠性。为了评估重测信度,患者在完成第一个问卷一周后填写了一份额外的 TESS 问卷。患者对问卷表现出良好的理解。由 Cronbach's α 测量的上下问卷具有良好的内部一致性。BlandAltman 图显示了测试重测中两个问卷的可接受的一致性限制。两份问卷的组内相关系数也很好。将 TESS 与 QLQC30 进行比较的 Spearman 等级相关系数表示的有效性对于上肢和下肢问卷分别为 0.89 和 0.90。丹麦 TESS 的心理测量学特性显示出良好的效度和信度。不相关。不相关。患者在完成第一个问卷一周后填写了一份额外的 TESS 问卷。患者对问卷表现出良好的理解。由 Cronbach's α 测量的上下问卷具有良好的内部一致性。BlandAltman 图显示了测试重测中两个问卷的可接受的一致性限制。两份问卷的组内相关系数也很好。将 TESS 与 QLQC30 进行比较的 Spearman 等级相关系数表示的有效性对于上肢和下肢问卷分别为 0.89 和 0.90。丹麦 TESS 的心理测量学特性显示出良好的效度和信度。不相关。不相关。患者在完成第一个问卷一周后填写了一份额外的 TESS 问卷。患者对问卷表现出良好的理解。由 Cronbach's α 测量的上下问卷具有良好的内部一致性。BlandAltman 图显示了测试重测中两个问卷的可接受的一致性限制。两份问卷的组内相关系数也很好。将 TESS 与 QLQC30 进行比较的 Spearman 等级相关系数表示的有效性对于上肢和下肢问卷分别为 0.89 和 0.90。丹麦 TESS 的心理测量学特性显示出良好的效度和信度。不相关。不相关。患者对问卷表现出良好的理解。由 Cronbach's α 测量的上下问卷具有良好的内部一致性。BlandAltman 图显示了测试重测中两个问卷的可接受的一致性限制。两份问卷的组内相关系数也很好。将 TESS 与 QLQC30 进行比较的 Spearman 等级相关系数表示的有效性对于上肢和下肢问卷分别为 0.89 和 0.90。丹麦 TESS 的心理测量学特性显示出良好的效度和信度。不相关。不相关。患者对问卷表现出良好的理解。由 Cronbach's α 测量的上下问卷具有良好的内部一致性。BlandAltman 图显示了测试重测中两个问卷的可接受的一致性限制。两份问卷的组内相关系数也很好。将 TESS 与 QLQC30 进行比较的 Spearman 等级相关系数表示的有效性对于上肢和下肢问卷分别为 0.89 和 0.90。丹麦 TESS 的心理测量学特性显示出良好的效度和信度。不相关。不相关。BlandAltman 图显示了测试重测中两个问卷的可接受的一致性限制。两份问卷的组内相关系数也很好。将 TESS 与 QLQC30 进行比较的 Spearman 等级相关系数表示的有效性对于上肢和下肢问卷分别为 0.89 和 0.90。丹麦 TESS 的心理测量学特性显示出良好的效度和信度。不相关。不相关。BlandAltman 图显示了测试重测中两个问卷的可接受的一致性限制。两份问卷的组内相关系数也很好。将 TESS 与 QLQC30 进行比较的 Spearman 等级相关系数表示的有效性对于上肢和下肢问卷分别为 0.89 和 0.90。丹麦 TESS 的心理测量学特性显示出良好的效度和信度。不相关。不相关。丹麦 TESS 的心理测量学特性显示出良好的效度和信度。不相关。不相关。丹麦 TESS 的心理测量学特性显示出良好的效度和信度。不相关。不相关。
这发生在相当多的行中,当我删除该行时,文件的其余部分被导入到 mallet 中。这一行中的什么正则表达式可能是问题所在?
谢谢,普里亚
maven - 无法在项目槌上执行目标 org.codehaus.mojo:exec-maven-plugin:1.2.1:exec (default-cli)
首次运行槌项目示例时,出现以下错误。我的 netbeans 有 Maven,还阅读了下面的错误说明。但我无法修复这个问题。我应该怎么办?
无法在项目槌上执行目标 org.codehaus.mojo:exec-maven-plugin:1.2.1:exec (default-cli):命令执行失败。进程退出并出现错误:1(退出值:1)-> [帮助 1]
要查看错误的完整堆栈跟踪,请使用 -e 开关重新运行 Maven。使用 -X 开关重新运行 Maven 以启用完整的调试日志记录。
有关错误和可能的解决方案的更多信息,请阅读以下文章:[帮助 1] http://cwiki.apache.org/confluence/display/MAVEN/MojoExecutionException
Pom 文件。
java - Mallet SimpleTagger FileNotFoundException: c:\mallet-2.0.7 (访问被拒绝)
我尝试完全按照文档中的示例以及从这篇文章中的解决方案从 windows cmd 运行 Mallet 我不断收到此错误,可能是什么问题?
linux - Mallet 适用于 Linux,但不适用于 Windows
好的,我正在尝试使用 Mallet 对 Windows 中的一些文档进行分类
我已经在 Linux 中实现了它。只是无法在 Windows 中完成工作(目标环境)
我已将数据导入 .mallet 文件。
然后使用这个输入数据创建一个分类器。
和
但是,当我在 Linux 中运行时:
bin/mallet 分类目录 --input ./testfolder --output - --classifier nntp.classifier
它迭代测试文件夹中的任何文件并转储出它认为每个它的类。
但是如果我在 Windows 中运行相同的命令:
它只是转储了命令列表:
我确实注意到的一件事:我
f 我bin/mallet classify-dir --help
在 linux 中运行我得到帮助文件,即每个命令的描述,但是在 Windows 中相同的东西bin\mallet classify-dir --help
不会产生相同的结果 - 只是上面的命令列表......(如果你输入 junk 作为命令,它会做同样的事情)
而较早的命令之一,例如bin/mallet import-dir --help
并bin\mallet import-dir --help
产生相同的完整帮助文件输出。
java - 主题建模槌:如何解释 Kullback-Leibler 散度
从 mallet 中的各种文档中获得各种概率分布后,我应用以下代码来计算第一个和第二个文档之间的 KL 散度:
我应该如何解释获得的数据?例如,我得到:12.3640... 这是什么意思?这两个分布是近还是远?