问题标签 [knime]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
data-mining - 我们可以将集群与 C-Index 平均值进行比较吗?
我使用 K-Means 算法来创建集群。如您所知,K-means 算法需要簇数作为参数。我尝试将集群计数从 8 开始计算为两个,并在每个循环中计算集群的所有 C-Index,然后获得这些 C-Index 的平均值。然后比较 C-Index 平均值并选择最小 C-Index 平均值作为最佳质量集群计数。这是检测集群计数的真正方法吗?
java - 使用 Knime 定义 Oozie 工作流程
我目前的问题是尝试开发一组提供与 Apache Oozie 集成的 Knime 节点。也就是说,我正在尝试从 Knime 中构建、启动和监控 Oozie 工作流程。
我在为线性 Oozie 工作流程实现这一点方面取得了一些成功,但在需要包含分支时变得相当困难。
作为背景,让我解释一下我为线性工作流执行此操作的方式:
本质上,我的解决方案将每个 Oozie Action 表示为一个 Knime 节点。这些节点中的每一个都有 2 种操作模式,根据某些流变量的内容调用正确的一种。这两种模式是必需的,因为我必须执行 Oozie 部分(OozieStartAction 到 OozieStopAction)两次,第一次迭代生成 Oozie 工作流,第二次启动并监控它。此外,流变量在此循环的迭代之间持续存在。
在一种操作模式中,节点将特定于它所代表的 Oozie 操作的 xml 内容附加到整个 Oozie 工作流 xml,然后转发它。
另一方面,节点简单地轮询 Oozie 以获取它所代表的操作的状态。
此工作流中使用了以下流变量:
-OOZIE_XML:包含 oozie 工作流 xml
-OOZIE_JOB_ID:使用组装工作流启动的正在运行的 oozie 作业的 ID
-PREV_ACTION_NAME:上一个动作的名称
在上面的示例中,逐步发生的情况如下:
-OozieStartNode 运行,看到它有一个空白或没有 OOZIE_XML 变量,所以它自己创建一个,设置基本的工作流应用程序并启动 xml 节点。它还创建一个值为“start”的 PREV_ACTION_NAME 流变量。
- 第一个 OozieGenericAction 看到它有一个空白的 OOZIE_JOB_ID,因此它在接收到的 OOZIE_XML 中将一个新操作附加到工作流应用程序节点,获取“名称”属性等于 PREV_ACTION_NAME 的节点并将其转换设置为它刚刚创建的操作. PREV_ACTION_NAME 然后被当前操作的名称覆盖。
...
- StopOozieAction 简单地创建一个结束节点并将前一个动作的过渡设置到它,很像前一个通用动作。
- 在第二次迭代中,OozieStart 看到它有 XML 数据,所以调用了二次执行模式。这会将工作流 XML 上传到 hdfs 并使用此工作流创建一个新的 Oozie 作业,并将收到的 JobId 转发为 OOZIE_JOB_ID。
-以下 Oozie Actions,具有有效的 OOZIE_JOB_ID,只需轮询 Oozie 以获取其动作名称的状态,一旦它们各自的动作完成运行就结束执行
我面临的主要问题是在工作流 xml 程序集中,一方面,我不能在使用分支时使用 prev 节点名称变量。如果我有许多节点链接到它的连接操作,一个前一个节点将覆盖其他节点,节点关系数据将丢失。
有没有人有任何广泛的想法我可以采取这种方式?
java - 在 Knime 中执行取消工作流的 java 代码
我目前正在使用一些与单独的 Hadoop 集群交互的自定义 Knime 节点,当取消 Knime 工作流时,我基本上希望能够告诉集群终止它启动的作业。我认为这将是特定于工作流的功能而不是特定于节点的功能,因此节点不是实现此代码的地方。
有谁知道我怎么能实现这个?我在 Knime 文档中找到了有关工作流管理器的内容,但我还没有看到任何关于扩展其功能的示例。任何有关此的想法和资源将不胜感激。
text-mining - 任何呼叫中心对话日志数据集?
我正在分析几种情绪分析算法来对呼叫中心的呼叫进行分类和优先级排序。我一直试图在网上寻找这种类型的数据,但一无所获。
理想情况下,我想进行几次双向对话,最好是关于烘焙或保险行业。
我们的想法是处理这些数据,以查看客户是否饿了,需要快速回复,或者他是否没有太多紧迫感。
任何帮助是极大的赞赏。
r - R-snippet 错误:延迟加载数据库“P”已损坏
我在“R 片段”中遇到错误,虽然它在 RStudio 中运行良好:
这是在 RStudio 中有效但在 Knime 中无效的代码。
如何追踪此错误的来源?
谢谢!
java - KNIME Reporting Tool
I am trying to make use of KNIME tool for our DB reporting purpose.
Our DB is SQL Server. I am able to perform a successfull DB read operation also from KNIME. But I am not getting the idea of its deployment at about 100's client boxes.
Do we need to install KNIME at each client box for access to data?
How can we block the user from accessing nothing other than views that we have created - no new thing the user can do apart from views / data access that has been created by us?
How would the front end data be rendered - does the client needs to be educated on KNIME ?
My requirement is to use KNIME fetch data from DB prepare reports and render to user - with no additional functionality client can make use?
knime - 如何检查可选输入?
我已经在网上搜索了几个小时,似乎找不到关于如何在我的 NodeModelexecute
函数中实际处理可选输入端口的提示。根据文档,inData
is nevernull
也不包含null
值。
那么如何检查是否连接了可选输入端口?
java - 两者如何结合具有不同时间戳的变量?
我在 KNIME 中有两个不同的带有测量值的表。两者都包含同一对象的不同测量值及其特定的时间戳。我想按时间组合它们。变量 1 有大约 5.000 个观测值。变量 2 大约 300.000 个观察值。我想将变量 1 与变量 2 结合起来,并最小化 time-difference。我的最大可能时差是 180 秒。有什么建议么?
我的想法是使用交叉连接节点。第一个表的每一行与第二个表的每一行连接,然后使用 time-diff 节点,依此类推。该解决方案需要大量时间,因为操作非常昂贵。有没有更好的办法?在KNIME或R或 JAVA中。没关系。
我必须将每个值与另一个值进行比较吗?
java - 在 KNIME 中使用外部 java 库。为什么一个类的初始化失败而另一个类的初始化成功?
我在将 Java 代码集成到 KNIME 时遇到问题。Knime 论坛上的类似帖子(http://tech.knime.org/forum/knime-general/using-external-jar-in-java-snippet-node-workflow-not-able-to-initialize-class-of)没有什么帮助,我也在那里发布了一个问题,但到目前为止还没有得到答案,所以我在这里试试运气。
我正在尝试使用 JavaSnippet 将我的代码集成到 KNIME 工作流程中。我已将代码导出到 jar 中并将其放入 KNIME jre/lib/endorsed 文件夹中。代码引用了CDK 1.4.19,我也把对应的jar文件放到了同一个目录下。我没有在 KNIME 中安装 CDK 节点扩展,在我的情况下也不能使用它们。
代码以:
当我尝试执行 JavaSnippet 时,我收到以下异常消息:
当我尝试
它有效,我没有收到异常消息。我已经检查过,构建器不是空值。但是,当我尝试初始化 SmilesParser 时,它失败了。这堂课是公开的。它没有默认构造函数,并且有一个以 IChemObjectBuilder 作为参数的公共构造函数。
我尝试使用类加载器:
我确信这不是 CDK 错误,因为我可以在 Eclipse 中执行代码。
为什么可以从 KNIME 调用一个类的构造函数而没有任何问题,而另一个类的构造函数却不能?
如果您能提出解决方案或发生这种情况的可能原因,我将不胜感激。
谢谢!