问题标签 [graphlab]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 将 sframe 列转换为列表
我需要将 SFrame 列转换为列表。
输入 :
输出:
python - Grpahlab SFrames:将 SFrames 与数据集一起使用时出错
在 Graphlab 中,我正在处理少量的健身数据,以使用可以提供推荐的推荐功能。该数据集具有用户 ID 的列,但没有项目 ID,而是按列排列的不同项目以及与每个用户 ID 对应的行中的各自评级。为了使用任何 graphlab 推荐方法,我需要有用户 ID 和项目 ID。这是我所做的:
基本上,我从 Data 中提取了 user_id col,并尝试使用从相同数据中提取的 x、y、z 等列为 ItemId 创建一个列,以便仅使用这 2 个列制作另一个 sframe。此代码按预期生成具有 2 列的表格格式 sframe,但排列顺序与我在 SFrame 中传递参数的顺序不同。因此,输出将 ItemId 作为第一列,然后是 UserId。即使我尝试更改在 sframe 中传递这 2 个的顺序,它仍然给出相同的输出。有谁知道原因?当使用任何推荐方法时,这会进一步产生问题,因为它会给出错误:列名 user_id 不存在。
python - 计算电影数据库 python/graphab 上标签的 TF
给定许多电影及其相关标签(标签是关键字),我如何计算每部电影的TF或TF-IDF向量?他们是使用Graphlab或Python中的库自动执行此操作的吗?这是我的输入:
事实上,我认为sklearn.feature_extraction.text.TfidfVectorizer
这是这个问题的答案,但我还没有弄清楚如何将它用于我的问题?谢谢
python - 如何使用 Graphlab 推荐()为新用户提供推荐?
在 Graphlab 中,我正在尝试使用推荐()方法,以查看它如何为新用户(user_id)提供推荐,而新用户(user_id)在从给定数据集准备的训练模型中不存在。由于目标是通过所使用的推荐模型确定相似的用户,所以我计划在推荐()中传递 new_user_data,但与现有用户的项目评分完全相同,以检查它是否应该返回相同的评分。这是我正在做的事情:
(数据是包含 UserIds、ItemIds 和 Rating 列的数据集)(比如 104 是不在数据集中的新 UserId)
我收到一个错误:
任何人都可以帮助如何为新用户使用推荐()方法吗?
python - Graphlab 最近邻法,输出不正确
我试图从训练模型中找到新用户和现有用户之间的相似性(从 graphlab 的推荐方法生成训练模型)。因此,尝试在 graphalb 中使用最近邻相似性方法(查询选项)以这种方式进行。//data 是包含 100 个用户及其项目评分的数据集
基本上,我在查询方法中传递了新的 userId(101)数据,这些活动的 itemIds 和相应的评级。这些 itemId 和评级实际上只是我传递给新用户的现有用户的项目评级,以便检查新用户是否与现有用户相似。
使用 query() 的预期输出是它应该返回一个包含四列的 SFrame:查询标签、参考标签、距离和参考点在查询点最近邻中的排名(根据 Graphlab 文档)。但是我得到了这样的东西-
| 查询点 | # 对 | % 完全的。| 已用时间 |
| 0 | 11 | 0.0909091 | 624us | | 完成 | | 100 | 3.68ms |
任何人都可以帮助解释为什么这不能产生正确的输出吗?
python - 运行时异常。无法评估 lambda。Lambda 工作人员无法启动
我是graphlab和python的新手,试图完成一项任务,问题是对选定的单词进行情感分析,我应该为产品矩阵中的每个选定单词创建一个新列,条目是这样的单词出现的次数,所以我为单词“wordCount_select”创建了一个函数
功能
但我收到这个错误
任何想法我做错了什么以及为什么 lambda 工作人员无法启动
python-2.7 - 对于我的 dato-env 中的 jupyter 笔记本,关键字没有突出显示,代码似乎没有运行。鉴于我看到的错误,为什么会这样?
以下是我在 Dato Launcher 启动的终端上遇到的错误。Jupyter notebook 确实出现了,但没有突出显示关键字,并且执行单元格似乎没有做任何事情(例如,打印实际上不会打印任何内容)。
python-2.7 - GraphLab .apply 到 sframe
我试图在图形实验室创建一个非常简单的 .apply 到 sarray,但我对它为什么不起作用感到困惑。
我的输出是
为什么不是 [-1, -1, -1, 1, 1] 我该如何解决?
python - 如何在存在联合条件和两个单独条件的 sframe 中提取行?
我有一个sframe
这样的:
我需要提取所有行,lang == 'de' or lang == 'en'
但我提取的行lang == 'en'
需要有一个对应的lang == 'de'
,以便它们共享相同的term_id
.
graphlab
我一直在用and这样做sframe
:
和de.print_rows(10)
:
接着:
[出去]:
我努力了:
但是我弄错了语法,给了我这个错误:
我应该如何过滤 sframe 以便获得带有en
andde
和对应的行term_id
?
生成的数据框应如下所示:
我该如何做同样的事情pandas
?
python - Python:为graphlab.SFrame的所有行迭代一行的不同列的操作
有一个带有dict
元素的列的 SFrame。
我想为cosine
SFrame 的每一行计算这两列之间的距离。下面是使用for loop
.
这是非常低效的,如果行数很大,则需要数小时。有人可以建议一个更好的方法。