问题标签 [sframe]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

80 问题

0 投票

1 回答

249 浏览

python - 在 Sframes 中使用 .apply() 来操作每行的多列

我有一个包含 Date1 和 Date2 列的 SFrame。

我试图用来.apply()查找 Date1 和 Date2 之间的 datediff，但我不知道如何使用另一个参数。

理想情况下像

python sframe

2016-09-30T17:21:49.277

0 投票

1 回答

627 浏览

pandas - Pandas 中是否有 GraphLab SFrame.show() 等效项？

Graphlabs SFrame.show() 显示 SFrame 中每一列的综合视图，我想知道 Pandas 中是否有等价物？

df.describe() 只是没有提供 sf.show() 所提供的详细程度。

2016-10-14T18:21:01.793

0 投票

1 回答

317 浏览

python - Graphlab sframe - 有没有办法可以转置 sframe？

我正在sframes从graphlab图书馆使用。我需要逐行进行一些计算。此外，如果我能够转置 sframe，则 sframe 结构在我的情况下会更有意义。

有没有办法我可以做到这一点？或者是否有可能在我可以使用的任何其他数据框中？

谢谢你的时间！

python dataframe graphlab sframe

2016-10-20T07:55:14.097

0 投票

0 回答

101 浏览

python - Graphlab Sframe - 删除一个空列

我有很多 sframe，每个都有大约 25 列，我需要在这些上运行许多不同的分类器。但是，对于特定的 Sframe，很少有列会完全为空。我需要获取特定 sframe 的空列列表，以便我可以删除它们。当我需要删除测试数据的相同列时，该列表将帮助我跟踪它们。也就是说，我需要每个 sframe 的列列表，在该 sframe 中这些列完全是空的。

我不知道该怎么做。

请指教。谢谢

python dataframe graphlab sframe

2016-11-03T07:22:40.170

0 投票

1 回答

231 浏览

python - 错误框架 iPython

我正在 Coursera 上参加 ML 课程，但无法使用 . 打开文件SFrame，当我尝试时，出现以下错误：

我也尝试运行 Kernel > Restart

我是 Python 新手，谁能帮帮我？

python sframe

2016-11-18T13:40:04.583

0 投票

1 回答

291 浏览

python - 将唯一列转换为具有相应值的 SFrame 标头

我有一个制表符分隔的文件：

目标是实现一个不同的 SFrame，其中将有一个由“X1”组成的唯一行，列是来自“X2”的值，即：

我试过在没有 SFrame 的情况下这样做：

但这仍然没有让我得到想要的 SFrame。我应该如何将唯一列转换为具有相应值的 SFrame 标头？即达到：

必须有一种更简单的方法来做到这一点。想象一下，唯一的没有。列元素的数量可以达到 1,000,000，并且生成的 SFrame 的大小可能为 1,000,000 X 1,000,000，因此需要类似 SFrame 或 HDF 的数据结构，而不是 numpy 数组或原生 python 列表列表。

python pandas numpy graphlab sframe

2016-11-21T09:22:34.843

0 投票

1 回答

211 浏览

python - GraphLab 和 SFrame

我是 python 新手，我正在学习机器学习课程。我对 GraphLab 和 SFrames 的经验很少。我想知道在将数据存储为 SFrame 的情况下如何应用条件和逻辑操作。以下代码和输出可能有助于理解问题：

它有一个名为“sqft_living”的整数列。我想在这个特定的列中找到介于 2000 到 4000 平方英尺之间的所有值。

谁能建议如何实施它？

python graphlab sframe

2016-11-27T11:51:57.147

0 投票

1 回答

78 浏览

python - 添加新列后，SFrame 操作速度减慢

我正在使用 graphlab 和 sframes 在 ipython 笔记本中构建重复订单报告。我有一个 csv 文件，其中包含大约 100k 行数据，其中包含user_id, user_email, user_phone. 我添加了一个名为唯一标识符的新列。对于每一行，我都遍历所有其他行以查看是否或user_id匹配当前记录。如果唯一标识符不为空并且有匹配项，我从当前记录分配到每个匹配记录的 unique_identifier 槽。user_emailuser_phoneuser_id

最后，我得到一个有 4 列的 SFrame，其中unique_identifier包含user_id所有匹配订单的最旧订单。我通过.apply带有 lambda 函数的方法来做到这一点。整个过程在我的笔记本电脑上需要几秒钟。但是，在该过程完成后，SFframe 变得非常缓慢且难以管理，以至于 SFrame.save 似乎永远需要花费。

似乎我添加内存的过程会unique_identifier阻塞内存或类似的东西。但是，该问题与帧大小无关。如果我将其限制为 10 行，问题仍然存在。我究竟做错了什么？

这是我的方法

python machine-learning graphlab sframe

2016-12-12T09:09:07.060

0 投票

1 回答

535 浏览

dataframe - SFrame 列类型：字典

当我运行时：

我得到一个空白列，这就是我想要的。

但是，当我运行时：

我收到一个错误，指出意外的数据类型。

SFrame API 没有解决这个问题，如下所示：

https://turi.com/products/create/docs/generated/graphlab.SFrame.html

在这一点上，我的理解是 SFrame 列不能是字典。

但是，出于好奇，我尝试了这个：

这个结果确实与我之前的理解相反。

我想要的是一个字典列，每一行都有自己的字典，就像.count_words我使用从头开始制作的 word_count 字典一样，通过import string.

这是一条双向的街道，还是.count_words一个例外，我不应该期望能够重现这种数据转换？

请指教，

谢谢

更新

这里似乎是 GitHub 上的一些相关信息：

https://github.com/turi-code/how-to/blob/master/sframe_pack.py

我不确定这种技术是否可以创造出我所追求的东西，我仍在尝试。让我知道是否有人对此有任何想法。

dataframe graphlab sframe

2016-12-24T02:15:31.650

0 投票

0 回答

39 浏览

python-2.7 - 为什么不解码为 UTF8 就无法清理文本功能？

我在 python 2.7 中编写了以下函数来清理文本，但如果不将推文变量解码为 utf8，它就无法工作

任何人都可以解释为什么吗？因为我不想使用解码，因为它使graphlab中Sframe中文本的操作太慢了。

python-2.7 utf-8 text-mining graphlab sframe

2017-01-05T08:03:56.180

1 2 3 4 5 6 7 8 9 10

问题标签 [sframe]

Reference