问题标签 [graphlab]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
5 回答
1572 浏览

python - Python:来自另一个列表的dict中出现的计数

我正在尝试根据感兴趣的单词的子集来计算单词在 dict 列中存在的次数。

首先我导入我的数据

数据可以在这里找到:https ://drive.google.com/open?id=0BzbhZp-qIglxM3VSVWRsVFRhTWc

然后我创建我感兴趣的单词列表:

我想计算“单词”中每个单词在产品中出现的次数['word_count']。

我不喜欢使用graphlab。只是同事向我推荐的。

0 投票
1 回答
469 浏览

python - 将选定行从一个 Sframe 插入到另一个 Sframe

我知道 append() 函数将一个 SFrame 的所有行附加到另一个。但我想将一个特定的行从一个 SFrame 插入到另一个。有没有办法从 Sframe1 中只选择第二行并将其附加到 SFrame2?

我想从 tc 中选择单行并将其附加到 pc

0 投票
1 回答
109 浏览

performance - 将 SFrame 转换为输入数据集

我有一个非常糟糕的方法来将我的输入日志转换为输入数据集。我有一个具有以下格式的 SFrame sf:

action列占用从 1 到 9 的 9 个值。

因此,每个 user_id 可以多次执行多个操作。

我正在尝试从 sf 获取所有唯一的 user_id 并以下列方式创建 op_sf:

我想知道这是否是最快的方法。特别是如果可以在不生成 zero1 到 zero9 SFrame 的情况下做同样的事情。

一个例子SF:

l1对应上面的sf:

0 投票
1 回答
89 浏览

python - SFrame Kmeans - 转换为 Int、Float、Dict

我正在准备数据以从 Graphlab 运行 KMEAMS,并且遇到以下错误:

以下是每列的当前数据类型:

如果我可以将数据类型从 str 获取到 int,我认为它应该可以工作。然而,使用 SFrames 比标准的 python 库更棘手。任何帮助到达那里表示赞赏。

0 投票
4 回答
4808 浏览

machine-learning - 在 GraphLab Sframe 中过滤和显示值?

因此,一周前我开始使用 Graphlab 来参加我的机器学习课程。我对 Graphlab 还是很陌生,我通读了 API,但无法完全得到我正在寻找的解决方案。所以,这就是问题所在。我的数据包含多列,例如卧室、浴室、平方英尺、邮政编码等。这些基本上是特征,我的目标是使用各种 ML 算法来预测房屋价格。现在,我应该找到邮政编码为 93038 的房屋的平均价格。所以,我把这个问题分解成更小的部分,因为我很天真,决定使用我的直觉。这是我到目前为止所尝试的。首先,我试图找到一种方法来创建一个过滤器,这样我就可以只提取带有邮政编码 - 93038 的房子的价格。

这些向我展示了邮政编码为 93038 的所有列,但我只想显示价值为 93038 的价格和邮政编码列。我尝试了很多不同的方法,但就是想不通。

另外,假设我想找到邮政编码值为 93038 的价格平均值。我该怎么做?

提前致谢。

0 投票
1 回答
4905 浏览

python - 在 SFrame 中选择特定行

我对如何在 SFrame 数组中选择特定行感到困惑。我可以在这里选择第一行:

在这里,我试图只获得第 2 行

如何选择数据框中的任何行?

0 投票
2 回答
574 浏览

python - Python 与 SFrame 崩溃

我正在 Coursera 上学习机器学习课程。我在本课程中使用 graphlab

当我执行以下行时,我的 python 崩溃了。请帮我解决这个问题。我不知道为什么它每次都崩溃

python崩溃图片

0 投票
1 回答
131 浏览

python - 使用 sklearn 编写相对于 graphlab 创建的相应代码时遇到问题,主要无法正确绘制

绘制犯罪率与房价的图表非常麻烦。使用graphlab lib很容易做到,但使用sklearn我无法做到。这是我的代码 wrt sklearn

使用 sklearn 环境得到的输出(不正确)

我正在寻找的输出是 它可以使用 Graphlab 创建环境来完成

这是使用 graphlab create 正确运行的完整代码

希望有人能指出我的错误。谢谢。

这是数据集

0 投票
2 回答
1253 浏览

python - graphlab 创建 sframe 如何获取 SArray 中位数

我正在研究graphlab create with

我试图获得其中一列的中位数

但我得到了错误

data.show() 将显示该列的中位数,但有人知道如何解决这个问题吗?

0 投票
0 回答
134 浏览

python-2.7 - GraphLab - FactorizationRecommender.predict 如何精确工作?

我对 FactorizationRecommender 的预测功能有疑问。

在我的支配下,我有一个包含用户项目对的大型数据集(以及每对的二进制评级)。需要注意的重要一点是,用户并没有与所有项目进行交互(评分矩阵非常稀疏)。

随后,我从数据集中删除了一个用户的所有评分(我选择他/她作为冷用户)。在所有剩余的用户项目对上,我训练了一个矩阵分解模型 ( factorization_recommender.create(...,binary_target=True))。

现在,当我向模型展示冷用户评分的一小部分时,我想对冷用户的剩余评分进行预测(例如,我显示冷用户评分的模型 10 并希望计算所有其他用户的预测评分项目)。接下来,我只想为冷用户计算预测的 RMSE。

我的问题有两个。首先,我并不完全清楚将哪些参数传递给FactorizationRecommender.predict函数。我想向模型显示的用户项目对(和二元评级)的分数(例如,10 个评级),这些应该是new_observation_data?我的输入应该是dataset什么?初始训练数据集?

其次,我的问题是该FactorizationRecommender.predict功能如何精确工作(后台发生了什么)?您如何对未包含在初始训练数据集中的用户进行预测?由于分解的潜在因素不是为这个用户构建的,他/她的预测是如何做出的?

我当前的 GraphLab Create 版本是 v1.10.1。

谢谢你的帮助!