问题标签 [sframe]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 在 Sframes 中使用 .apply() 来操作每行的多列
我有一个包含 Date1 和 Date2 列的 SFrame。
我试图用来.apply()
查找 Date1 和 Date2 之间的 datediff,但我不知道如何使用另一个参数。
理想情况下像
pandas - Pandas 中是否有 GraphLab SFrame.show() 等效项?
Graphlabs SFrame.show() 显示 SFrame 中每一列的综合视图,我想知道 Pandas 中是否有等价物?
df.describe() 只是没有提供 sf.show() 所提供的详细程度。
python - Graphlab sframe - 有没有办法可以转置 sframe?
我正在sframes
从graphlab
图书馆使用。我需要逐行进行一些计算。此外,如果我能够转置 sframe,则 sframe 结构在我的情况下会更有意义。
有没有办法我可以做到这一点?或者是否有可能在我可以使用的任何其他数据框中?
谢谢你的时间!
python - Graphlab Sframe - 删除一个空列
我有很多 sframe,每个都有大约 25 列,我需要在这些上运行许多不同的分类器。但是,对于特定的 Sframe,很少有列会完全为空。我需要获取特定 sframe 的空列列表,以便我可以删除它们。当我需要删除测试数据的相同列时,该列表将帮助我跟踪它们。也就是说,我需要每个 sframe 的列列表,在该 sframe 中这些列完全是空的。
我不知道该怎么做。
请指教。谢谢
python - 错误框架 iPython
我正在 Coursera 上参加 ML 课程,但无法使用 . 打开文件SFrame
,当我尝试时,出现以下错误:
我也尝试运行 Kernel > Restart
我是 Python 新手,谁能帮帮我?
python - 将唯一列转换为具有相应值的 SFrame 标头
我有一个制表符分隔的文件:
目标是实现一个不同的 SFrame,其中将有一个由“X1”组成的唯一行,列是来自“X2”的值,即:
我试过在没有 SFrame 的情况下这样做:
但这仍然没有让我得到想要的 SFrame。我应该如何将唯一列转换为具有相应值的 SFrame 标头?即达到:
必须有一种更简单的方法来做到这一点。想象一下,唯一的没有。列元素的数量可以达到 1,000,000,并且生成的 SFrame 的大小可能为 1,000,000 X 1,000,000,因此需要类似 SFrame 或 HDF 的数据结构,而不是 numpy 数组或原生 python 列表列表。
python - GraphLab 和 SFrame
我是 python 新手,我正在学习机器学习课程。我对 GraphLab 和 SFrames 的经验很少。我想知道在将数据存储为 SFrame 的情况下如何应用条件和逻辑操作。以下代码和输出可能有助于理解问题:
它有一个名为“sqft_living”的整数列。我想在这个特定的列中找到介于 2000 到 4000 平方英尺之间的所有值。
谁能建议如何实施它?
python - 添加新列后,SFrame 操作速度减慢
我正在使用 graphlab 和 sframes 在 ipython 笔记本中构建重复订单报告。我有一个 csv 文件,其中包含大约 100k 行数据,其中包含user_id
, user_email
, user_phone
. 我添加了一个名为唯一标识符的新列。对于每一行,我都遍历所有其他行以查看是否或user_id
匹配当前记录。如果唯一标识符不为空并且有匹配项,我从当前记录分配到每个匹配记录的 unique_identifier 槽。user_email
user_phone
user_id
最后,我得到一个有 4 列的 SFrame,其中unique_identifier
包含user_id
所有匹配订单的最旧订单。我通过.apply
带有 lambda 函数的方法来做到这一点。整个过程在我的笔记本电脑上需要几秒钟。但是,在该过程完成后,SFframe 变得非常缓慢且难以管理,以至于 SFrame.save 似乎永远需要花费。
似乎我添加内存的过程会unique_identifier
阻塞内存或类似的东西。但是,该问题与帧大小无关。如果我将其限制为 10 行,问题仍然存在。我究竟做错了什么?
这是我的方法
dataframe - SFrame 列类型:字典
当我运行时:
我得到一个空白列,这就是我想要的。
但是,当我运行时:
我收到一个错误,指出意外的数据类型。
SFrame API 没有解决这个问题,如下所示:
https://turi.com/products/create/docs/generated/graphlab.SFrame.html
在这一点上,我的理解是 SFrame 列不能是字典。
但是,出于好奇,我尝试了这个:
这个结果确实与我之前的理解相反。
我想要的是一个字典列,每一行都有自己的字典,就像.count_words
我使用从头开始制作的 word_count 字典一样,通过import string
.
这是一条双向的街道,还是.count_words
一个例外,我不应该期望能够重现这种数据转换?
请指教,
谢谢
更新
这里似乎是 GitHub 上的一些相关信息:
https://github.com/turi-code/how-to/blob/master/sframe_pack.py
我不确定这种技术是否可以创造出我所追求的东西,我仍在尝试。让我知道是否有人对此有任何想法。
python-2.7 - 为什么不解码为 UTF8 就无法清理文本功能?
我在 python 2.7 中编写了以下函数来清理文本,但如果不将推文变量解码为 utf8,它就无法工作
任何人都可以解释为什么吗?因为我不想使用解码,因为它使graphlab中Sframe中文本的操作太慢了。