问题标签 [graphlab]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
pandas - 是否有相当于 df.irow 的 graphlab?
我需要按索引在我的 sframe 中挑选几行。是否有与 pandas df.irow() 等效的 graphlab 命令?
python - 熊猫计数多列
我有一个看起来像这样的数据框
我想计算要产生的列上值的出现次数:
和
我只得到第一列(实际上使用的是graphlab包,但我更喜欢熊猫)
有人可以帮助我吗?
python - Graphlab:在不同的现有列上添加总和列
我有一个包含多个列的 SFrame,例如 'measure1'、'measure2'、'measure3'、..
我想添加一个新列“total_measure”,其中包含 measure1 + measure2 + measure3 等的总数。
我认为这对工作很重要: cdss_analysis.unstack(column=['measure1','measure2'],new_column_name='total_measure')
但这似乎并不正确。
python - 矩阵乘法与 SFrame 和 SArray 与 Graphlab 和/或 Numpy
给定一个graphlab.SArray
命名coef
:
还有一个graphlab.SFrame
(如下所示的前 10 个)名为x
:
如何操作 SArray 和 SFrame 使得乘法将返回一个向量 SArray,其第一行计算如下?:
我目前正在做一些愚蠢的事情,将 SFrame / SArray 转换为列表,然后将其转换为 numpy 数组来执行np.multiply
. 即使在转换为 numpy 数组之后,它也没有给出正确的矩阵向量乘法。我目前的尝试:
(错误)[出]:
我尝试的输出也是错误的,它应该返回一个向量标量值。必须有一种更简单的方法来做到这一点。
如何操作 SArray 和 SFrame 使得乘法将返回一个向量 SArray,其第一行计算如下?
使用numpy
Dataframes,应该如何执行矩阵向量乘法?
python - 在 Graphlab.SFrame 中用单双引号解析列行
我从这个数据集中有这样的行(https://raw.githubusercontent.com/alvations/stasis/master/sts.csv):
我已将其读入graphlab.SFrame
使用read_csv()
函数:
并且有些行未解析。回溯如下:
Sent1
看看这些行,如果我的或Sent2
列中的任何一个包含奇数双引号,似乎就有问题了。
使用error_bad_lines
来跟踪有问题的行:
它抛出回溯:
如果我的行包含奇数个双引号,有没有办法解决这个问题?
有没有办法在不清理数据的情况下做到这一点(例如,识别有问题的行,然后清理/更正它们,但保留另一个 SFrame 来跟踪清理/更正?
作为健全性检查,如果我们\t
在原始 csv 文件中进行搜索,行中有一个选项卡会出现问题,但在graphlab
解析它时,它会消失:
作为另一个完整性检查,逐行读取文件并将其拆分\t
为整个文件返回 5 列:
更理智地检查它是不是。列中,@papayawarrior 4 列行的示例在我的版本中被正确解析graphlab
:
我已经手动检查了有问题的行,它们是:
PROGRESS: ...
不是通过从详细消息中反复清除这些行来手动查找这些行,有没有办法在将这些行加载到 Graphlab SFrame 时将其转储出来?
python - 保存 Graphlab LDA 模型会将主题变成胡言乱语?
好吧,这很古怪。我认为这个问题可能是由最近的 graphlab 更新引入的,因为我以前从未见过这个问题,但我不确定)。不管怎样,看看这个:
好吧,即使对我的语料库一无所知,这些主题至少是可以理解的,因为每个主题的热门术语或多或少是相关的。
但是现在,如果只是保存并重新加载模型,主题就会完全改变(就胡说八道):
知道这里可能发生什么吗?save
应该只是腌制模型,所以我看不到奇怪之处发生在哪里,但不知何故,主题分布正在以某种不明显的方式完全改变。我已经在两台不同的机器(Linux 和 Mac)上验证了这一点。有类似的奇怪结果。
编辑
将 Graphlab 从 1.7.1 降级到 1.6.1 似乎可以解决这个问题,但这并不是真正的解决方案。我在 1.7.1 发行说明中没有看到任何明显的东西来解释发生了什么,如果可能的话,我希望它能够在 1.7.1 中工作......
python - 从 Graphlab SFrame 的特定列中查找具有“不适用”值的行
给定一个Graphlab.SFrame
具有以下列名称的对象:
可以轻松地删除特定列中具有“不适用”(NA)/无值的行,例如删除“分数”列的具有 NA 值的行,我可以这样做:
或者用某个值(比如说-1)替换 None 值,我可以这样做:
从https://dato.com/products/create/docs/generated/graphlab.SFrame.html检查 SFrame 文档后,没有内置函数来查找包含 None 对于某一列的行,一些喜欢sf.findna('Score')
。或者我可能错过了它。
如果有这样的功能,它叫什么?
如果没有,我应该如何提取该行中有指定列的行具有 NA 值?
python - 种子选项:在 Python 中使用不同的包进行机器学习
我想知道以下代码是否会给出相同的结果。更具体地说,如果random_state=0
与 相同seed = 0
:
- 使用sklearn
:
- 使用graphlab
:
据我所知graphlab
,在 3.4 版中不可用(如果我错了,请纠正我),所以我无法检查自己。谢谢
python - 在 Python 中导入模块不起作用(Graphlab)
我正在尝试使用 graphlab.evaluation.log_loss函数,尽管我无法导入它。我尝试使用 log_loss 函数:
但我收到以下错误:“ AttributeError: 'module' object has no attribute 'log_loss'” 尽管其他指标如混淆矩阵、rmse 和其他指标都在工作。有任何想法吗?
python-2.7 - 如何在 Ubuntu 上安装 Graphlab Create?
当我尝试安装 Graphlab Create 时,它只是在重试连接。我家有健康的宽带 wifi 连接(没有代理)。
错误:(graphlab)ankit@ankit21:~$ pip install graphlab-create==0.9.1
Collecting graphlab-create==0.9.1
Retrying (Retry(total=4, connect=None, read=None, redirect=None)) after connection broken by 'ConnectTimeoutError(<pip._vendor.requests.packages.urllib3.connection.VerifiedHTTPSConnection object at 0x7fd6a16ae850>, 'Connection to 192.168.16.253 timed out. (connect timeout=15)')': /simple/graphlab-create/
代理 192.168.16.253 是我大学互联网的代理。但我已将网络设置中的设置更改为自动代理。终端中的其他安装工作正常,只有这有问题。