问题标签 [graphlab]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
4194 浏览

python - 将 sframe 列转换为列表

我需要将 SFrame 列转换为列表。

输入 :

输出:

0 投票
1 回答
604 浏览

python - Grpahlab SFrames:将 SFrames 与数据集一起使用时出错

在 Graphlab 中,我正在处理少量的健身数据,以使用可以提供推荐的推荐功能。该数据集具有用户 ID 的列,但没有项目 ID,而是按列排列的不同项目以及与每个用户 ID 对应的行中的各自评级。为了使用任何 graphlab 推荐方法,我需要有用户 ID 和项目 ID。这是我所做的:

基本上,我从 Data 中提取了 user_id col,并尝试使用从相同数据中提取的 x、y、z 等列为 ItemId 创建一个列,以便仅使用这 2 个列制作另一个 sframe。此代码按预期生成具有 2 列的表格格式 sframe,但排列顺序与我在 SFrame 中传递参数的顺序不同。因此,输出将 ItemId 作为第一列,然后是 UserId。即使我尝试更改在 sframe 中传递这 2 个的顺序,它仍然给出相同的输出。有谁知道原因?当使用任何推荐方法时,这会进一步产生问题,因为它会给出错误:列名 user_id 不存在。

0 投票
1 回答
92 浏览

python - 计算电影数据库 python/graphab 上标签的 TF

给定许多电影及其相关标签(标签是关键字),我如何计算每部电影的TFTF-IDF向量?他们是使用GraphlabPython中的库自动执行此操作的吗?这是我的输入:

事实上,我认为sklearn.feature_extraction.text.TfidfVectorizer这是这个问题的答案,但我还没有弄清楚如何将它用于我的问题?谢谢

参考:链接到 sklearn.feature_extraction.text.TfidfVectorizer

0 投票
1 回答
413 浏览

python - 如何使用 Graphlab 推荐()为新用户提供推荐?

在 Graphlab 中,我正在尝试使用推荐()方法,以查看它如何为新用户(user_id)提供推荐,而新用户(user_id)在从给定数据集准备的训练模型中不存在。由于目标是通过所使用的推荐模型确定相似的用户,所以我计划在推荐()中传递 new_user_data,但与现有用户的项目评分完全相同,以检查它是否应该返回相同的评分。这是我正在做的事情:

(数据是包含 UserIds、ItemIds 和 Rating 列的数据集)(比如 104 是不在数据集中的新 UserId)

我收到一个错误:

任何人都可以帮助如何为新用户使用推荐()方法吗?

0 投票
1 回答
138 浏览

python - Graphlab 最近邻法,输出不正确

我试图从训练模型中找到新用户和现有用户之间的相似性(从 graphlab 的推荐方法生成训练模型)。因此,尝试在 graphalb 中使用最近邻相似性方法(查询选项)以这种方式进行。//data 是包含 100 个用户及其项目评分的数据集

基本上,我在查询方法中传递了新的 userId(101)数据,这些活动的 itemIds 和相应的评级。这些 itemId 和评级实际上只是我传递给新用户的现有用户的项目评级,以便检查新用户是否与现有用户相似。

使用 query() 的预期输出是它应该返回一个包含四列的 SFrame:查询标签、参考标签、距离和参考点在查询点最近邻中的排名(根据 Graphlab 文档)。但是我得到了这样的东西-

| 查询点 | # 对 | % 完全的。| 已用时间 |

| 0 | 11 | 0.0909091 | 624us | | 完成 | | 100 | 3.68ms |

任何人都可以帮助解释为什么这不能产生正确的输出吗?

0 投票
1 回答
1020 浏览

python - 运行时异常。无法评估 lambda。Lambda 工作人员无法启动

我是graphlab和python的新手,试图完成一项任务,问题是对选定的单词进行情感分析,我应该为产品矩阵中的每个选定单词创建一个新列,条目是这样的单词出现的次数,所以我为单词“wordCount_select”创建了一个函数

功能

但我收到这个错误

任何想法我做错了什么以及为什么 lambda 工作人员无法启动

0 投票
1 回答
160 浏览

python-2.7 - 对于我的 dato-env 中的 jupyter 笔记本,关键字没有突出显示,代码似乎没有运行。鉴于我看到的错误,为什么会这样?

以下是我在 Dato Launcher 启动的终端上遇到的错误。Jupyter notebook 确实出现了,但没有突出显示关键字,并且执行单元格似乎没有做任何事情(例如,打印实际上不会打印任何内容)。

0 投票
1 回答
120 浏览

python-2.7 - GraphLab .apply 到 sframe

我试图在图形实验室创建一个非常简单的 .apply 到 sarray,但我对它为什么不起作用感到困惑。

我的输出是

为什么不是 [-1, -1, -1, 1, 1] 我该如何解决?

0 投票
4 回答
2523 浏览

python - 如何在存在联合条件和两个单独条件的 sframe 中提取行?

我有一个sframe这样的:

我需要提取所有行,lang == 'de' or lang == 'en'但我提取的行lang == 'en'需要有一个对应的lang == 'de',以便它们共享相同的term_id.

graphlab我一直在用and这样做sframe

de.print_rows(10)

接着:

[出去]:

我努力了:

但是我弄错了语法,给了我这个错误:

我应该如何过滤 sframe 以便获得带有enandde和对应的行term_id

生成的数据框应如下所示:

我该如何做同样的事情pandas

0 投票
1 回答
1311 浏览

python - Python:为graphlab.SFrame的所有行迭代一行的不同列的操作

有一个带有dict元素的列的 SFrame。

我想为cosineSFrame 的每一行计算这两列之间的距离。下面是使用for loop.

这是非常低效的,如果行数很大,则需要数小时。有人可以建议一个更好的方法。