问题标签 [sframe]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
95 浏览

python - 通过将分组类别转换为字段来转换分组数据(使用 GraphLab 或 Panda 的 DataFrame)

我有以下按 user_id 和 action 列分组的记录。

我想将此表转换为以下格式,其中每个操作现在是一列,行是计数值。

我知道如何使用循环来做到这一点,但我很好奇在 GraphLab 创建 SFrame 或 Panda 的 DataFrame 中是否有更有效的方法。

我很感激任何帮助!

0 投票
2 回答
309 浏览

python - 使用正则表达式从大型 SFrame 或数据帧中提取信息而不使用循环

我有以下代码,其中我使用循环来提取一些信息并使用这些信息来创建一个新矩阵。但是,因为我使用的是循环,所以这段代码需要很长时间才能完成。

我想知道是否有更好的方法通过使用 GraphLabSFrame或 pandas来做到这一点dataframe。我很感激任何帮助!

一些样本数据:

我想得到这个:

0 投票
2 回答
71 浏览

python - 如何在时间序列数据中取每三天的平均值

我有一个看起来像这样的时间序列数据:

我想要获得的是每三天(以及每周)的平均值,并将最后一天保持为这样的索引:

您可能会注意到剩下的 2 条记录只需要平均。dataframe在 pandas或 graphlab中是否有一种方便的方法SFrame?如果有人可以分享相关资源,那就太好了!

我很感激任何帮助!

0 投票
1 回答
116 浏览

python - 无法使用 apply() 更改 SFrame 中的 None 值

我正在使用此代码来更改NoneSFrame 中的值:

运行此代码后,我仍然看到相同的None值,没有效果。有什么想法吗?

0 投票
1 回答
104 浏览

graphlab - 上传数据时出现IOError

graphlab 中是否有任何数据大小限制?尝试链接文件时出现 IOError。

屏幕

0 投票
1 回答
353 浏览

python - Graphlab Sframe,检索多行

我正在尝试从 graphlab SFrame 访问多行并将它们转换为 numpy 数组。

我有一个 96000 行和 4096 列的数据库 fd,需要检索存储在 numpy 数组中的行号。我想出的方法很慢。我怀疑这是因为我在每次迭代时不断增加 sframe 的大小,但我不知道是否有任何方法可以预先分配值。我需要抓取 20000 行并且当前方法没有完成。

0 投票
1 回答
2359 浏览

python - 安装 sFrame 包的问题

在这一刻,我从 github https://github.com/turi-code/SFrame安装这个包时遇到问题 我使用的是 Windows 10,它是 python 版本 2.7

我试着用

这没用。

然后我尝试使用

git+ssh://git@github.com/nhooey/package.git

在处理上述异常的过程中,又出现了一个异常:


然后我从github下载了包并使用


任何想法请安装这个包?

0 投票
2 回答
650 浏览

python - Graphlab 中 SFrame.materialize() 的用途是什么?

当我试图通过graphlab的sframe数据结构获取属于userid = 1列的数据集行时sf[sf['userid'] == 1]

我得到了行,但是我也得到了这个消息,[? rows x 6 columns] Note: Only the head of the SFrame is printed. This SFrame is lazily evaluated. You can use sf.materialize() to force materialization.

我已经浏览了文档,但我无法理解 sf.materialize() 的作用!有人可以帮我吗?

0 投票
2 回答
125 浏览

pandas - 在 Pandas 中堆叠列表数组/在 Pandas 中等效的 SFrame 堆栈

熊猫数据帧中是否有等效的 SFrame 堆栈?Pandas 自己的堆栈仅适用于级别,而我正在寻找与包含列表的其他列在同一级别扩展单个列。

输入数据框:实际数据框中还有更多列,例如用户

输出数据框:在实际数据框中还有更多的列,如用户,应该类似地重复

0 投票
1 回答
723 浏览

python - graphlab - sframe:如何删除列上具有相同 ID 和条件的行?

我有一个 graphlab sframe 数据框,其中几行在“uid”列中具有相似的 id 值。

在这里,我想保留所有具有唯一 uid 的行,并且只保留具有相同 uid 的行,要保留的行可以是今天状态 = 1 的任何行,(即可以有 uid 和行状态的行相同,但其他字段不同,在这种情况下,我们可以保留这些行中的任何一行。)我想在 graphlab sframes 中执行这些操作,但无法弄清楚如何进行。