问题标签 [n-way]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
header - 仅显示 20 个左右文件之间的相似性?
假设我有一个充满 html 页面的目录。它们的页眉和页脚基本相同,但我希望只能看到所有页面中相同的部分。我想将其称为 n 向合并,但这不是它的本质,它只是在寻找所有文件的页眉和页脚之间的相似之处。
(和我的标题,我不仅仅指 <head> 标签,而是页面中相似的部分)。
注意:大约有 20 个 html 文件。
是否有执行此操作的工具的名称?
diff - 是否有任何具有垂直比较的 n 路差异工具?
我开始使用diffuse,你可以用它来比较多个文件,但它有点没用,因为当你有20个文件需要一起比较时,你不能水平比较行,我想也许二十个文件中的一行水平显示的文件。
r - R中的树模型可以在节点处处理n路拆分,对于n> = 4
关于 R 树模型的快速问题。我想在很多变量(主要是数字或因子变量)上生成一个树模型。其中一个变量是Gender,其中类别为male、female和unknown。当我使用and库中的tree
orrpart
函数时,我只从Gender根中得到两个分支。未知性别已与女性归为一个类别。所以我得到的分支是Female+Unknown和Male。我检查了树包pdf http://cran.r-project.org/web/packages/tree/tree.pdf它说tree
rpart
无序因子的水平分为两个非空组。rpart 函数在处理超过 2 个级别的因素方面似乎与树函数非常相似。
因此,我的问题是R 中是否还有其他功能或包可以让我从单个节点生成 3 个以上的分支,或者是否有人对其他开源工具有任何建议可以做同样的事情。如果您需要更多信息,请告诉我。
multidimensional-array - 如何在 R 中执行三向 PCA
我想在 R 中执行三向主成分分析,尽管我找到了一些解释它如何工作以及如何解释结果的文章,但我在网上找不到任何有用的指南来说明如何在 R 中进行分析。
我的数据由 230 个样本、250,000 个变量和 50 个注释组成。通常人们只对以下类型的数据使用一个注释来做一个标准的 PCA:
标准数据:
但是,我想将所有注释信息实现到分析中,以便我将所有 50 个矩阵组合用于分析。以这种方式,注释的组合可以比单个注释单独解释更多样本之间的方差,例如注释1和4一起解释比单独注释1更多的方差。
注释1:
注释2:
注释3:
注释4:
根据我的发现,可以执行 Tucker 3-way PCA 的三个软件包:ThreeWay、PTAk 和 rTensor。我曾尝试运行 ThreeWay,但他们使用的数据结构似乎很难使用。也许我可以做到这一点,但 ThreeWay 文章中的示例也产生了错误,所以我更喜欢另一个包:
三路数据结构:
PTAk 包需要:“一个 k 阶张量(作为一个数组),如果使用非身份度量 X 是一个列表,其中数据作为数组并满足一个度量列表”
我不清楚这意味着什么。我试图研究如何生成张量的张量包,但他们的示例非常复杂,因为他们对各种张量进行了大量的乘法运算,而不是解释如何从数据中创建张量的基础知识。
对于这种方法的弱点以及如何创建张量以及如何使用任何软件包分析它们,我将不胜感激。
谢谢