问题标签 [sframe]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 在 SFrame 中分组,无需安装 graphlab
如何在 SFrame 中使用 groupby 操作,无需安装 graphlab。
我很想做一些聚合,但在互联网上的所有示例中,我都看到聚合函数来自 Graphlab。
喜欢:
在上面的示例中,我如何使用,说,numpy.mean
而不是agg.MEAN
?
python - SFrame 的描述和信息
很高兴看到SFrame的摘要,类似于 pandas DataFrame 为您提供的方法.info()
和.describe()
sf.to_dataframe().info()
除了 , 之外,最简单的方法是什么sf.to_dataframe().describe()
?
UPD:其中 SFrame 是 Turi 的 DataFrame 实现,它的功能比 pandas 少,但速度要快得多。https://github.com/turi-code/SFrame
python - 来自 numpy 数组的 SFrame
我想SFrame
从NumPy
数组创建一个。
我特别想要的是:
=>
如果我做:
我得到:
NumPy
如果我将数组转换为 aPandas
DataFrame
并从 the转换为 a ,我可以得到我想要Pandas
DataFrame
的SFrame
:
我的问题是:
如何以读取数组的方式SFame
从数组创建一个(数组=>具有行和列),但不用作中间步骤?NumPy
Pandas
DataFrame
NxM
DataFrame
N
M
Pandas
python - 从数据框中的 2 列或更多列中获取唯一值的有效方法
给定一个来自 的矩阵SFrame
:
我想获得x
andy
列的唯一值,我可以这样做:
这样我得到 x 的唯一值和 y 的唯一值,然后附加它们并获得附加列表的唯一值。
我也可以这样做:
但是那样的话,如果我的 x 和 y 列很大并且有很多重复,我会在获得唯一的之前将它附加到一个非常大的容器中。
是否有更有效的方法来获取从 SFrame 中的 2 个或更多列创建的组合列的唯一值?
从 2 列或更多列中获取唯一值的有效方法在 pandas 中的等效性是什么pandas
?
python - 在将文件加载到 SFrame 或任何其他 python 数据结构后从硬盘中删除文件
如果data
通过执行上面的行创建变量,然后移动或删除文件mongodump.json
,变量是否data
仍然存在?
python - 在 SFrame 问题上使用 apply() 方法
背景:我有一个 SFrame,其中包含指示狗图像与其他图像的接近程度的数字。通常狗图像应该最接近另一个狗图像但重点是测试评估方法
我的 SFrame 称为 dog_distances(1000 行 x 4 列):
我想编写一个函数来检查 dog-dog 是否是最小的数字并将这个函数应用于整个 SFrame
访问 SFrame 的一行通常会输出一个字典... sframe_name[row#]['column_name']
将 .values() 添加到该行的末尾只会输出列表中的值。这允许您应用诸如 min() 或 max() 之类的数学方法,这对于创建函数 is_dog_correct 很有用。
因此我的功能是:
我的函数将 row 作为输入,如果该行的 dog-dog 值等于该行中的最小值,则返回 1。如果不是这样,则返回 0。
运行 is_dog_correct(0) 输出 1。我们期望这是因为,正如您在上面看到的,第 0 行的 dog-dog 中的值是该行中的最小值。
运行 is_dog_correct(4) 输出 0。我们期望这是因为 dog-dog 中第零行的值不是该行中的最小数字。
所以函数 is_dog_correct 可以在一行一行的基础上完美运行!
当我在整个 sFrame 上按照建议运行时: dog_distances.apply(is_dog_correct)
我收到一个属性错误:
请有人解释为什么该函数逐行工作而不是在整个 SFrame 上工作?
machine-learning - graphlab.SFrame('home_data.gl/') 中的错误
我正在华盛顿大学的Coursera上学习机器学习课程。我在其中使用 iPython 的 graphlab。在实践中,当我执行以下命令时:
我收到错误消息:
(注意 ipython 笔记本和 home_data.gl 在同一个文件夹中。)
python - 适用于 Python 3.4 的 SFrame
在项目的网站上,它告诉我有 Python 3.4 支持(Readme.md,在该页面上显示为文本)。但是,我看不到从哪里可以获得与 Python 3.4 兼容的 SFrame 版本。它不在 anaconda 上,也不在 PyPI 上,我只看到 Python 2.7 版本。
所以我想知道,如果他们只是没有更新他们的 Readme.md 以说明 SFrame 不再可用于 Python 3.4 的事实,或者它是否在某个地方,我没有找到它。如果他们没有支持 Python 3.4.x,那么他们为什么要注意毕竟不支持 Python 3.5.x。
我之前确实为 Python 3.4.5 anaconda 环境安装了它,如果我没记错的话,那是来自 PyPI,所以我认为他们出于某种原因从那里删除了它。
有谁知道今天如何将 Python 3.4 兼容版本的 SFrame 放入 anaconda 环境中?
machine-learning - 加载 graphlab.SFrame('home_data.gl/') 时出错
我正在华盛顿大学的 Coursera 上学习机器学习课程。我在其中使用 iPython 的 graphlab。在实践中,当我执行以下命令时:
sales = graphlab.SFrame('home_data.gl/')
我收到错误。
我可以在我的电脑中找到 home_data.gl 或者问题是别的什么..
machine-learning - graphlab不显示列图像
我在 SFrame 中有一个 image 列和一个 image_array 列。
当我做
它不是显示实际图像,而是显示图像列的摘要以及值、计数和百分比。调用 show 方法时应该如何显示实际图像?