问题标签 [data-representation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R中类别的矩阵表示
我有一列包含一组类别,例如 Category1、Category2、Category3、Category2 等。有没有办法在 R 中将它们表示为具有以下视图的矩阵:
非常感谢任何反馈。
java - 使用哈希映射的数据表示
我有一个包含许多重复条目的文件,如下所示:
那里的每个实体也与一个 ID 相关联,可能一个,可能更多,
我想自己获取每个实体,但是由于消歧,对于类似的东西Hudson
,每个实体都可以与多个 ID 相关联,所以也许在Hudson
There would be one for the river, and a different one for the bay, for the town,等等。
我想最好的方法是使用名称为键的哈希映射,对吗?
有没有办法以 JSON 格式或其他一些高度可塑性的数据表示形式输出哈希图?
python - LIBSVM 的多类表示
我的目标是制作一个多类分类器,以处理不同的文件,这些文件将被标记为至少两个类(或标签)。这些文件是议会倡议,因此每个文件都将在同义词库中以至少一对值进行索引。
我在 python 版本中使用'libsvm',因为在 python 中删除停用词、标记化和词干似乎更容易,这要归功于 Snowball、NLTK 等工具......
这个版本不能直接使用多分类
但是,可以编写一个多类分类器模型,生成总共 k * (k-1) / 2 (其中“k”是类的数量)。
LIBSVM 的表示是:
那么对于一个有 5 个类的文件,我应该生成前一行的 5 次只更改类吗?
例如:
1 1:3 2:4 6:5…。
2 1:3 2:4 6:5…。
3 1:3 2:4 6:5…。
4 1:3 2:4 6:5…。
5 1:3 2:4 6:5…。
谢谢并恭祝安康。
c++ - 多态数据翻译/转换设计模式
问题如下:
考虑以下课程
假设公开这个类的数据成员是完全有意义的。
现在考虑有很多这样的类,每个都有不同的成员,可能都派生自同一个基类“base_data”。
现在,这些类需要从其他任意数据表示中导出、导入、构造、“设置”和“获取”。
例如:
就是这样一种表示。
此外,所有这些操作都需要大量完成,即通过 base_data* 对象的集合以多态方式完成。
此问题的一种解决方案是在 base_data 中提供一个接口,如下所示
每个派生类都知道它的成员,因此它知道如何进行翻译。另外派生类可以提供以下形式的构造函数
允许轻松定义抽象工厂模式。
这个问题的另一个解决方案是在某些命名空间下为每个派生类型提供静态翻译函数,例如
因此,我们以“更少的 OO”解决方案和可能大规模执行这些翻译操作的能力为代价避免了派生类的污染。
如果我们考虑需要支持除 any_map 之外的许多表示的可能性,这也更有意义,例如
但再一次,它不是多态的。
我读过的大多数“翻译”设计模式都处理接口,但我还没有找到一种正式解决多态性上下文中数据的翻译/转换的模式。
我正在寻找对正式解决此问题的设计模式的参考,关于如何继续实施的建议和/或指出我的方法中明显的缺陷。
math - N维空间中一组点的数学表示?
给定 N 维空间中的一些 x 数据点,我试图找到一个可以描述这些 x 点的任何子集的固定长度表示?例如,s 子集的均值可以描述该子集,但它不是仅对该子集唯一的,也就是说,空间中的其他点可以产生相同的均值,因此均值不是唯一标识符。谁能告诉我一个可以描述点而不依赖于点数的独特度量?
floating-point - 使用 8 位机器以标准化浮点形式表达 0.03125
0.03125
使用 8 位机器以标准化浮点形式表达;1 位符号,3 位指数,4 位尾数。
指数以excess-3格式存储,尾数调整为小数点前一位。
哦对不起!这是我在 stackoverflow 上的第一篇文章,我不习惯这种网站。我的答案是 0 100 0001,我不知道它是否正确。我认为符号是 0,因为有一个正值,而 100 是指数,对于尾数,我尝试将其作为 0.03125*2 等等,所以我得到 00001 的值和尾数的 4 位所以答案是 0001。希望我已经清楚地解释了我做这个问题的方式,因为我的英语很糟糕。谢谢大家纠正我的提问方式。
bash - 在 bash 中存储和行走一棵树(列表为叶子)
我想知道一种基于统一格式的文件名对数据进行分类的方法。使用类似1_dog_yorkshire.sh
和1_cat_persian.sh
的文件名可以用简单的正则表达式表示:
[0-9]+_[a-z]+_[a-z]+.sh
我想制作如下所示的树状结构:
想到的第一个解决方案是多维关联数组。但是,bash 不支持多维数组。哈希表也不是完美的解决方案,因为在 Bash 中对哈希表进行迭代可能会出现问题。在 Bash 中使用 XML/JSON 是不可能的,除非它是可移植的并且是用 bash 编写的。
在理想情况下,任何数据都应该是可迭代的,例如:对于“2”中的每个条目、“1”中的每只狗或“2”中蜘蛛中的蜘蛛列表中的元素。
如何构建一个足以替代 Bash 中的多维关联数组的结构,其中子树可以被遍历并且叶子可以存储列表?
binary - 将大十进制数转换为二进制
我的任务是找到数字 3.4219087*10^12 的二进制表示。这是一个非常大的数字(我必须手动完成),所以我想知道是否有某种捷径或技术可以用来转换它。
excel - 可视化表示服务器和使用它们的应用程序的可能方法,反之亦然
我目前有一个 Excel 电子表格,其中包含大约 40 个应用程序名称和 130 个服务器,它们运行在上面。下面是工作表中的一行:
有谁知道显示哪些应用程序正在使用哪些服务器以及哪些应用程序正在使用哪些服务器的好方法?
它不一定必须在 Excel 中,我熟悉编程并且知道多种语言,所以我不害怕陷入任何人可能知道的有用库来帮助展示这一点。
如果一切都失败了,我会用手画出一个很大的维恩图,除了知道我的艺术技巧之外,这真的不会看起来很漂亮。
本练习的目的是能够快速确定要关闭的合适服务器以及是否有任何应用程序自行占用整个服务器等。
java - 用于本地化的地图表示
我想为机器人编写 Java 本地化系统。但是我一开始就被困住了。我不知道如何表示地图。地图并不复杂,永远不会超过几米乘几米。机器人移动时不会改变。
我将从传感器获得的读数是角度(由指南针提供)和整数对(角度和距离)。