问题标签 [graphlab]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - graphlab:如何将压缩文件加载到 SFrame
我想将 GraphLab 提供的压缩后的 csv 文件 () 读取到 SFrame。 https://dato.com/products/create/docs/generated/graphlab.SFrame.read_csv.html
我尝试了以下代码,但它不起作用。
r - 机器学习的数据转换
我有带有 SKU ID 及其计数的数据集,我需要将此数据输入机器学习算法,以使 SKU ID 成为列并且 COUNTs 位于事务 ID 和 SKU ID 的交集处。谁能建议如何实现这种转变。
当前数据
所需数据
csv - 在具有特定数据类型的图形实验室中导入 csv
在graphlab中,我面临以下问题:
“feat1”包含一个名为“movieId”的列,类型为“int”。
另一方面,存在一个标头名称为“movieId”并键入“str”的 SFrame
尝试加入他们时,我收到此错误:
如何控制导入的“csv”的一列以特定数据类型导入?在您看来,克服这个问题的最佳方法是什么?非常感谢您的意见。
python - Graphlab - OverflowError:长太大而无法转换
我通过传递相同教学特征的不同幂来创建不同的多项式回归模型。
因此,如果我想要特征“x”的 3 次多项式模型。然后到回归模型,我将 x^1、x^2 和 x^3 作为特征传递。
以下函数用于创建“x”幂的 Sframe 表。从传递给它的“x”的值,以及需要创建的度数权力。
然后使用从上述函数生成的 Sframe。我能够为不同程度的 X 生成不同的多项式表达式。如下面的代码所示。
Graphlab 能够生成高达 4 级的模型。之后,如果失败并用于以下代码。它将显示发生了溢出错误。
这个错误是因为我的计算机缺少内存来计算回归模型吗?如何修复此错误?
python - Graphlab SFrame 构造函数将 NumPy S1 dtype 转换为 int
这是一个例子:
我想了解:
- 为什么?
- 如果有办法防止这种情况。
graphlab - 在graphlab中计算均方根值和平均值
我有一个格式为 cp= [cars['car_models']=="chevy"] 的数据框如何获得 cp 的平均值?
到处寻找如何做到这一点。谢谢您的帮助
r - 将矩阵行分配给单个数据框列
我有一个矩阵tf.m
NxM 和df
N 行的数据框。
我想n
将矩阵的行分配给数据框中的列,在同一行n
。
如果我运行它,我会在数据框中再获得 4 列
我想要这个:
尝试根据词频训练 knn df$tf
(如果可能)
查询 a 的最近邻居df$id
。
我的目标是在 R 中运行这个“喜欢”的 python graphlab 函数:
python - 安装 ipython 后导入 numpy 和 graphlab 时出错
我有一个奇怪的问题。
我现在正在使用 graphlab/numpy 通过 Pycharm 5 开发一个项目。操作系统是 Mac OS 10.11.5。我为该项目创建了一个 p2.7 虚拟环境。程序运行良好。但是在我安装 ipython 之后,我无法再正确导入 graphlab 和 numpy。
错误信息:
AttributeError:“模块”对象没有属性“核心”
系统不断告诉属性“核心”和“连接”缺失。但我很确定它们可以在 graphlab/numpy 文件夹中找到,并且没有重复。
项目在终端运行正常。现在我必须卸载 ipython。然后一切又好了。
请帮助。
python - 如何乘以Python中SArray中每个元素的每个值?
我正在使用 Graphlab,但我想这个问题可以适用于熊猫。
我想创建一个新列,其中“user_score”中每个元素的值乘以“weight”中的数字。那是,
我尝试在下面编写一个简单的函数并应用无济于事。有什么想法吗?
它收到以下错误消息:
classification - 将丢失的数据视为另一个类别
我有一些数据,主要是用户人口统计数据。有很多调查问题,人们的回答是“是”或“不是”。但是数据自然包含很多缺失值。我不想估算缺失值。我想把它当作第三类。所以每个问题都有三个可能的答案——“是”、“否”和“不确定”。
到目前为止我正在做的是:
我在哪里target
预测(它是二进制 1 或 -1)。现在我的train
和test
数据集都有很多缺失值,所以我到目前为止所做的是:
但是这些预测并没有给我很好的准确性。我想将每两个类别的答案(Yes/No)转换为三个类别(Yes/No/NotSure)。该怎么做呢?
我试过了 :
这执行没有任何错误,但它不起作用。