问题标签 [graphlab]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
152 浏览

python - NetworkX 到 GraphLab 连接组件的转换

GraphLab 等价于以下 NetworkX 代码是什么?
for nodeset in nx.connected_components(G):

在 GraphLab 中,我想为每个连接的组件获取一组顶点 ID。

0 投票
2 回答
25 浏览

python - Importgraph实验室你好世界错误

在运行 Ubuntu 14.04 的 PC 上安装 GraphLab 后,我刚刚在我的第一个 hello world 程序中遇到以下错误:

错误:

这是什么原因以及如何解决该错误?

0 投票
2 回答
364 浏览

python - 关于 Graphlab 库导入

在 Ubuntu 14.04 中,我已经安装了基于https://dato.com/download/install-graphlab-create-command-line.html的 Graphlab ,它似乎工作正常。

但是,我在尝试使用推荐模块时收到此错误:

在第一行中,graphlab 被导入,没有任何错误。但是,第二行会导致此错误:

如何解决问题?谢谢

0 投票
4 回答
1893 浏览

python - Dato:pandas 中 graphlab.random_split() 的等效函数是什么?

我正在 Coursera 上学习机器学习课程。在课程中,强调我们使用来自Dato的 GraphLab 。在其中一个练习中,讲师使用 graphlab.random_split() 来拆分 SFrame,如下所示:

我已经完成了第一周的课程,测验要求我们使用 GraphLab 和 SFrame 解决问题。我尝试安装 GraphLab,但是它需要 64 位 PC,而我的 PC 是 32 位。如果我们愿意,教练已经让我们选择使用 Pandas,所以我开始使用 Pandas。

我的问题是这个,教练使用sales.random_split(.8,seed=0),这会给他train_data, test_data。他将使用它们进行进一步分析,并为此得出答案。

现在,如果我不使用会以完全相同的方式拆分数据的 pandas 函数,我的答案将永远不会匹配他的答案,我也永远无法通过这个测验。我有兴趣使用的熊猫功能是:

我的问题是:将pandas.DataFrame.sample(frac=0.8, random_state=0)产生与sales.random_split(.8,seed=0).

我已经写信给导师,我正在等待他的回复,同时如果有人可以帮助我,请帮忙。谢谢你。

0 投票
1 回答
117 浏览

macos - 安装 graphlab 时出错

我尝试使用 pip 命令安装 graphlab,我们在命令中输入电子邮件地址和产品密钥。我尝试升级它。我正在使用 sudo pip 命令,并且正在使用 Mac。我每次都遇到这个异常,但它失败了。我可以安装 dmg,但这很容易。我想知道如何解决这个异常。例外情况如下:

0 投票
1 回答
408 浏览

python - 创建 sframe 逻辑分类器

我正在使用 graphlab-create 来构建一个逻辑分类器。我的数据在 sframe 中(我已经使用 .dtype 进行了检查)这是针对使用亚马逊评论 zip 文件进行机器学习的 Coursera 课程:

但是,当我运行此代码时:

有什么我想念的吗?

0 投票
1 回答
963 浏览

python-2.7 - python中的日期时间-计算速度-大数据

我想找到数据框中两列之间的差异(以天为单位)(更具体地说,在 graphlab SFrame 数据结构中)。

我试图编写几个函数来做到这一点,但我似乎无法创建一个足够快的函数。速度是我现在的问题,因为我有大约 8000 万行要处理。

我尝试了两种不同的功能,但都太慢了:

t2_colname_str 和 t1_colname_str 参数是我要使用的列名,并且两列都包含 datetime.datetime 对象。

循环

列表理解

我知道这不是列表推导的预期目的,但我只是尝试了一下,看看它是否更快。

补充说明

我一直在使用 Dato 的 GraphLab-Create 和他们的 SFrame 数据结构,主要是因为它并行化了所有计算,这使得我的分析速度非常快,并且它有一个很棒的机器学习应用程序库。如果您还没有检查过,这是一个很棒的产品。

GraphLab 用户指南可以在这里找到:https ://dato.com/learn/userguide/index.html

0 投票
0 回答
270 浏览

python - 导入graphlab时Spyder-Python崩溃

这是我在这里的第一个问题。我已阅读有关如何提出好问题的文章,我希望遵守这些准则。

每当我运行import graphlab时,Spyder2 都会冻结然后崩溃。我多次尝试安装该软件包,并且所有软件包都没有显示错误消息。实际上,有时我什至不必运行脚本,只需键入import graphlab它就会崩溃。

所以,我的意思是我在控制台上没有收到错误消息,Spyder 只是崩溃了。我正在使用 Windows 10。

我在 Coursera 上华盛顿大学的机器学习课程。我宁愿使用 scikit learn 而不是 graphlab,但他们没有产品推荐的方法。

关于我可以做些什么来解决这个问题的任何建议?

谢谢!

0 投票
1 回答
459 浏览

python - 在 Graphlab 或 Python 中查找特定行

在 Graphlab 中,

我正在处理较大列表中的一小部分电影。

movieIds_5K_np是一个包含我的movieIds 的数组。`ratings_33K_np' 是一个包含四列的数组,其第二列包含所有电影的电影 ID。

我只需要选择ratings_33K_npid 存在于“movieIds_5K_np”中的行。

我尝试了这种方法,但它似乎不起作用:

我如何在 Graphlab 中或使用一些 Python 库来做到这一点?我应该说最初是作为ratings_33KSFramemovieIds_5K导入的。

谢谢

0 投票
1 回答
781 浏览

python - 如何将数组更改为 GraphLab ItemSimilarityRecommend 的 SFrame

我已经在 python 中编写了我的自定义成对相似度函数,它给出了一个特征矩阵 X(包含特征行),找到并返回输出作为给定相似度度量的每个项目的 k 最近邻:

我这样称呼它:

在哪里

输出如下所示

在 Graphlab 中,我想将输出用作graphlab.recommender.item_similarity_recommender.create.

我使用它如下:

我收到以下错误:

我认为错误的主要原因是我nn_SCD_min需要作为 SFrame 导入(这里看起来像一个数组)。nn_SCD_min有四列。我相信这些列应该有如下标题:

如何将数组 'nn_SCD_min' 更改为SFrame具有上述四个标题的数组?任何关于我采购这样做的想法都非常感谢。