问题标签 [sframe]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
249 浏览

python - 在 Sframes 中使用 .apply() 来操作每行的多列

我有一个包含 Date1 和 Date2 列的 SFrame。

我试图用来.apply()查找 Date1 和 Date2 之间的 datediff,但我不知道如何使用另一个参数。

理想情况下像

0 投票
1 回答
627 浏览

pandas - Pandas 中是否有 GraphLab SFrame.show() 等效项?

Graphlabs SFrame.show() 显示 SFrame 中每一列的综合视图,我想知道 Pandas 中是否有等价物?

df.describe() 只是没有提供 sf.show() 所提供的详细程度。

0 投票
1 回答
317 浏览

python - Graphlab sframe - 有没有办法可以转置 sframe?

我正在sframesgraphlab图书馆使用。我需要逐行进行一些计算。此外,如果我能够转置 sframe,则 sframe 结构在我的情况下会更有意义。

有没有办法我可以做到这一点?或者是否有可能在我可以使用的任何其他数据框中?

谢谢你的时间!

0 投票
0 回答
101 浏览

python - Graphlab Sframe - 删除一个空列

我有很多 sframe,每个都有大约 25 列,我需要在这些上运行许多不同的分类器。但是,对于特定的 Sframe,很少有列会完全为空。我需要获取特定 sframe 的空列列表,以便我可以删除它们。当我需要删除测试数据的相同列时,该列表将帮助我跟踪它们。也就是说,我需要每个 sframe 的列列表,在该 sframe 中这些列完全是空的。

我不知道该怎么做。

请指教。谢谢

0 投票
1 回答
231 浏览

python - 错误框架 iPython

我正在 Coursera 上参加 ML 课程,但无法使用 . 打开文件SFrame,当我尝试时,出现以下错误:

我也尝试运行 Kernel > Restart

我是 Python 新手,谁能帮帮我?

0 投票
1 回答
291 浏览

python - 将唯一列转换为具有相应值的 SFrame 标头

我有一个制表符分隔的文件:

目标是实现一个不同的 SFrame,其中将有一个由“X1”组成的唯一行,列是来自“X2”的值,即:

我试过在没有 SFrame 的情况下这样做:

但这仍然没有让我得到想要的 SFrame。我应该如何将唯一列转换为具有相应值的 SFrame 标头?即达到:

必须有一种更简单的方法来做到这一点。想象一下,唯一的没有。列元素的数量可以达到 1,000,000,并且生成的 SFrame 的大小可能为 1,000,000 X 1,000,000,因此需要类似 SFrame 或 HDF 的数据结构,而不是 numpy 数组或原生 python 列表列表。

0 投票
1 回答
211 浏览

python - GraphLab 和 SFrame

我是 python 新手,我正在学习机器学习课程。我对 GraphLab 和 SFrames 的经验很少。我想知道在将数据存储为 SFrame 的情况下如何应用条件和逻辑操作。以下代码和输出可能有助于理解问题:

它有一个名为“sqft_living”的整数列。我想在这个特定的列中找到介于 2000 到 4000 平方英尺之间的所有值。

谁能建议如何实施它?

0 投票
1 回答
78 浏览

python - 添加新列后,SFrame 操作速度减慢

我正在使用 graphlab 和 sframes 在 ipython 笔记本中构建重复订单报告。我有一个 csv 文件,其中包含大约 100k 行数据,其中包含user_id, user_email, user_phone. 我添加了一个名为唯一标识符的新列。对于每一行,我都遍历所有其他行以查看是否或user_id匹配当前记录。如果唯一标识符不为空并且有匹配项,我从当前记录分配到每个匹配记录的 unique_identifier 槽。user_emailuser_phoneuser_id

最后,我得到一个有 4 列的 SFrame,其中unique_identifier包含user_id所有匹配订单的最旧订单。我通过.apply带有 lambda 函数的方法来做到这一点。整个过程在我的笔记本电脑上需要几秒钟。但是,在该过程完成后,SFframe 变得非常缓慢且难以管理,以至于 SFrame.save 似乎永远需要花费。

似乎我添加内存的过程会unique_identifier阻塞内存或类似的东西。但是,该问题与帧大小无关。如果我将其限制为 10 行,问题仍然存在。我究竟做错了什么?

这是我的方法

0 投票
1 回答
535 浏览

dataframe - SFrame 列类型:字典

当我运行时:

我得到一个空白列,这就是我想要的。

但是,当我运行时:

我收到一个错误,指出意外的数据类型。

SFrame API 没有解决这个问题,如下所示:

https://turi.com/products/create/docs/generated/graphlab.SFrame.html

在这一点上,我的理解是 SFrame 列不能是字典。

但是,出于好奇,我尝试了这个:

这个结果确实与我之前的理解相反。

我想要的是一个字典列,每一行都有自己的字典,就像.count_words我使用从头开始制作的 word_count 字典一样,通过import string.

这是一条双向的街道,还是.count_words一个例外,我不应该期望能够重现这种数据转换?

请指教,

谢谢

更新

这里似乎是 GitHub 上的一些相关信息:

https://github.com/turi-code/how-to/blob/master/sframe_pack.py

我不确定这种技术是否可以创造出我所追求的东西,我仍在尝试。让我知道是否有人对此有任何想法。

0 投票
0 回答
39 浏览

python-2.7 - 为什么不解码为 UTF8 就无法清理文本功能?

我在 python 2.7 中编写了以下函数来清理文本,但如果不将推文变量解码为 utf8,它就无法工作

任何人都可以解释为什么吗?因为我不想使用解码,因为它使graphlab中Sframe中文本的操作太慢了。