问题标签 [graphlab]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
182 浏览

pandas - 是否有相当于 df.irow 的 graphlab?

我需要按索引在我的 sframe 中挑选几行。是否有与 pandas df.irow() 等效的 graphlab 命令?

0 投票
2 回答
4371 浏览

python - 熊猫计数多列

我有一个看起来像这样的数据框

我想计算要产生的列上值的出现次数:

我只得到第一列(实际上使用的是graphlab包,但我更喜欢熊猫)

有人可以帮助我吗?

0 投票
1 回答
661 浏览

python - Graphlab:在不同的现有列上添加总和列

我有一个包含多个列的 SFrame,例如 'measure1'、'measure2'、'measure3'、..

我想添加一个新列“total_measure”,其中包含 measure1 + measure2 + measure3 等的总数。

我认为这对工作很重要: cdss_analysis.unstack(column=['measure1','measure2'],new_column_name='total_measure')

但这似乎并不正确。

0 投票
2 回答
2716 浏览

python - 矩阵乘法与 SFrame 和 SArray 与 Graphlab 和/或 Numpy

给定一个graphlab.SArray命名coef

还有一个graphlab.SFrame(如下所示的前 10 个)名为x

如何操作 SArray 和 SFrame 使得乘法将返回一个向量 SArray,其第一行计算如下?

我目前正在做一些愚蠢的事情,将 SFrame / SArray 转换为列表,然后将其转换为 numpy 数组来执行np.multiply. 即使在转换为 numpy 数组之后,它也没有给出正确的矩阵向量乘法。我目前的尝试:

(错误)[出]:

我尝试的输出也是错误的,它应该返回一个向量标量值。必须有一种更简单的方法来做到这一点。

如何操作 SArray 和 SFrame 使得乘法将返回一个向量 SArray,其第一行计算如下?

使用numpyDataframes,应该如何执行矩阵向量乘法?

0 投票
1 回答
924 浏览

python - 在 Graphlab.SFrame 中用单双引号解析列行

我从这个数据集中有这样的行(https://raw.githubusercontent.com/alvations/stasis/master/sts.csv):

我已将其读入graphlab.SFrame使用read_csv()函数:

并且有些行未解析。回溯如下:

Sent1看看这些行,如果我的或Sent2列中的任何一个包含奇数双引号,似乎就有问题了。

使用error_bad_lines来跟踪有问题的行:

它抛出回溯:

如果我的行包含奇数个双引号,有没有办法解决这个问题?

有没有办法在不清理数据的情况下做到这一点(例如,识别有问题的行,然后清理/更正它们,但保留另一个 SFrame 来跟踪清理/更正?


作为健全性检查,如果我们\t在原始 csv 文件中进行搜索,行中有一个选项卡会出现问题,但在graphlab解析它时,它会消失:

在此处输入图像描述


作为另一个完整性检查,逐行读取文件并将其拆分\t为整个文件返回 5 列:


更理智地检查它是不是。列中,@papayawarrior 4 列行的示例在我的版本中被正确解析graphlab

在此处输入图像描述


我已经手动检查了有问题的行,它们是:

PROGRESS: ...不是通过从详细消息中反复清除这些行来手动查找这些行,有没有办法在将这些行加载到 Graphlab SFrame 时将其转储出来?

0 投票
1 回答
212 浏览

python - 保存 Graphlab LDA 模型会将主题变成胡言乱语?

好吧,这很古怪。我认为这个问题可能是由最近的 graphlab 更新引入的,因为我以前从未见过这个问题,但我不确定)。不管怎样,看看这个:

好吧,即使对我的语料库一无所知,这些主题至少是可以理解的,因为每个主题的热门术语或多或少是相关的。

但是现在,如果只是保存并重新加载模型,主题就会完全改变(就胡说八道):

知道这里可能发生什么吗?save应该只是腌制模型,所以我看不到奇怪之处发生在哪里,但不知何故,主题分布正在以某种不明显的方式完全改变。我已经在两台不同的机器(Linux 和 Mac)上验证了这一点。有类似的奇怪结果。

编辑

将 Graphlab 从 1.7.1 降级到 1.6.1 似乎可以解决这个问题,但这并不是真正的解决方案。我在 1.7.1 发行说明中没有看到任何明显的东西来解释发生了什么,如果可能的话,我希望它能够在 1.7.1 中工作......

0 投票
1 回答
845 浏览

python - 从 Graphlab SFrame 的特定列中查找具有“不适用”值的行

给定一个Graphlab.SFrame具有以下列名称的对象:

可以轻松地删除特定列中具有“不适用”(NA)/无值的行,例如删除“分数”列的具有 NA 值的行,我可以这样做:

或者用某个值(比如说-1)替换 None 值,我可以这样做:

https://dato.com/products/create/docs/generated/graphlab.SFrame.html检查 SFrame 文档后,没有内置函数来查找包含 None 对于某一列的行,一些喜欢sf.findna('Score')。或者我可能错过了它。

如果有这样的功能,它叫什么?

如果没有,我应该如何提取该行中有指定列的行具有 NA 值?

0 投票
1 回答
758 浏览

python - 种子选项:在 Python 中使用不同的包进行机器学习

我想知道以下代码是否会给出相同的结果。更具体地说,如果random_state=0与 相同seed = 0

- 使用sklearn

- 使用graphlab

据我所知graphlab,在 3.4 版中不可用(如果我错了,请纠正我),所以我无法检查自己。谢谢

0 投票
1 回答
204 浏览

python - 在 Python 中导入模块不起作用(Graphlab)

我正在尝试使用 graphlab.evaluation.log_loss函数,尽管我无法导入它。我尝试使用 log_loss 函数:

但我收到以下错误:“ AttributeError: 'module' object has no attribute 'log_loss'” 尽管其他指标如混淆矩阵、rmse 和其他指标都在工作。有任何想法吗?

0 投票
2 回答
2114 浏览

python-2.7 - 如何在 Ubuntu 上安装 Graphlab Create?

当我尝试安装 Graphlab Create 时,它​​只是在重试连接。我家有健康的宽带 wifi 连接(没有代理)。

错误:(graphlab)ankit@ankit21:~$ pip install graphlab-create==0.9.1 Collecting graphlab-create==0.9.1 Retrying (Retry(total=4, connect=None, read=None, redirect=None)) after connection broken by 'ConnectTimeoutError(<pip._vendor.requests.packages.urllib3.connection.VerifiedHTTPSConnection object at 0x7fd6a16ae850>, 'Connection to 192.168.16.253 timed out. (connect timeout=15)')': /simple/graphlab-create/ 代理 192.168.16.253 是我大学互联网的代理。但我已将网络设置中的设置更改为自动代理。终端中的其他安装工作正常,只有这有问题。