“graphlab”的相关标签问题_Stack Overflow中文网

0 投票

5 回答

1572 浏览

python - Python：来自另一个列表的dict中出现的计数

我正在尝试根据感兴趣的单词的子集来计算单词在 dict 列中存在的次数。

首先我导入我的数据

数据可以在这里找到：https ://drive.google.com/open?id=0BzbhZp-qIglxM3VSVWRsVFRhTWc

然后我创建我感兴趣的单词列表：

我想计算“单词”中每个单词在产品中出现的次数['word_count']。

我不喜欢使用graphlab。只是同事向我推荐的。

2016-06-04T12:57:30.850

0 投票

1 回答

469 浏览

python - 将选定行从一个 Sframe 插入到另一个 Sframe

我知道 append() 函数将一个 SFrame 的所有行附加到另一个。但我想将一个特定的行从一个 SFrame 插入到另一个。有没有办法从 Sframe1 中只选择第二行并将其附加到 SFrame2？

我想从 tc 中选择单行并将其附加到 pc

python graphlab sframe

2016-06-11T06:45:50.573

0 投票

1 回答

109 浏览

performance - 将 SFrame 转换为输入数据集

我有一个非常糟糕的方法来将我的输入日志转换为输入数据集。我有一个具有以下格式的 SFrame sf：

action列占用从 1 到 9 的 9 个值。

因此，每个 user_id 可以多次执行多个操作。

我正在尝试从 sf 获取所有唯一的 user_id 并以下列方式创建 op_sf：

我想知道这是否是最快的方法。特别是如果可以在不生成 zero1 到 zero9 SFrame 的情况下做同样的事情。

一个例子SF：

l1对应上面的sf：

performance graphlab sframe

2016-06-15T14:39:43.207

0 投票

1 回答

89 浏览

python - SFrame Kmeans - 转换为 Int、Float、Dict

我正在准备数据以从 Graphlab 运行 KMEAMS，并且遇到以下错误：

以下是每列的当前数据类型：

如果我可以将数据类型从 str 获取到 int，我认为它应该可以工作。然而，使用 SFrames 比标准的 python 库更棘手。任何帮助到达那里表示赞赏。

python graphlab sframe

2016-06-21T18:45:28.797

0 投票

4 回答

4808 浏览

machine-learning - 在 GraphLab Sframe 中过滤和显示值？

因此，一周前我开始使用 Graphlab 来参加我的机器学习课程。我对 Graphlab 还是很陌生，我通读了 API，但无法完全得到我正在寻找的解决方案。所以，这就是问题所在。我的数据包含多列，例如卧室、浴室、平方英尺、邮政编码等。这些基本上是特征，我的目标是使用各种 ML 算法来预测房屋价格。现在，我应该找到邮政编码为 93038 的房屋的平均价格。所以，我把这个问题分解成更小的部分，因为我很天真，决定使用我的直觉。这是我到目前为止所尝试的。首先，我试图找到一种方法来创建一个过滤器，这样我就可以只提取带有邮政编码 - 93038 的房子的价格。

这些向我展示了邮政编码为 93038 的所有列，但我只想显示价值为 93038 的价格和邮政编码列。我尝试了很多不同的方法，但就是想不通。

另外，假设我想找到邮政编码值为 93038 的价格平均值。我该怎么做？

提前致谢。

machine-learning graphlab sframe

2016-06-23T22:14:40.053

0 投票

1 回答

4905 浏览

python - 在 SFrame 中选择特定行

我对如何在 SFrame 数组中选择特定行感到困惑。我可以在这里选择第一行：

在这里，我试图只获得第 2 行

如何选择数据框中的任何行？

python graphlab sframe

2016-06-27T00:50:47.923

0 投票

2 回答

574 浏览

python - Python 与 SFrame 崩溃

我正在 Coursera 上学习机器学习课程。我在本课程中使用 graphlab

当我执行以下行时，我的 python 崩溃了。请帮我解决这个问题。我不知道为什么它每次都崩溃

python graphlab sframe

2016-07-05T09:20:59.480

0 投票

1 回答

131 浏览

python - 使用 sklearn 编写相对于 graphlab 创建的相应代码时遇到问题，主要无法正确绘制

绘制犯罪率与房价的图表非常麻烦。使用graphlab lib很容易做到，但使用sklearn我无法做到。这是我的代码 wrt sklearn

我使用 sklearn 环境得到的输出（不正确）

我正在寻找的输出是它可以使用 Graphlab 创建环境来完成

这是使用 graphlab create 正确运行的完整代码

希望有人能指出我的错误。谢谢。

这是数据集

python scikit-learn graphlab sklearn-pandas

2016-07-15T03:07:28.017

0 投票

2 回答

1253 浏览

python - graphlab 创建 sframe 如何获取 SArray 中位数

我正在研究graphlab create with

我试图获得其中一列的中位数

但我得到了错误

data.show() 将显示该列的中位数，但有人知道如何解决这个问题吗？

python pandas machine-learning data-analysis graphlab

2016-07-15T11:47:18.863

0 投票

0 回答

134 浏览

python-2.7 - GraphLab - FactorizationRecommender.predict 如何精确工作？

我对 FactorizationRecommender 的预测功能有疑问。

在我的支配下，我有一个包含用户项目对的大型数据集（以及每对的二进制评级）。需要注意的重要一点是，用户并没有与所有项目进行交互（评分矩阵非常稀疏）。

随后，我从数据集中删除了一个用户的所有评分（我选择他/她作为冷用户）。在所有剩余的用户项目对上，我训练了一个矩阵分解模型 ( factorization_recommender.create(...,binary_target=True))。

现在，当我向模型展示冷用户评分的一小部分时，我想对冷用户的剩余评分进行预测（例如，我显示冷用户评分的模型 10 并希望计算所有其他用户的预测评分项目）。接下来，我只想为冷用户计算预测的 RMSE。

我的问题有两个。首先，我并不完全清楚将哪些参数传递给FactorizationRecommender.predict函数。我想向模型显示的用户项目对（和二元评级）的分数（例如，10 个评级），这些应该是new_observation_data？我的输入应该是dataset什么？初始训练数据集？

其次，我的问题是该FactorizationRecommender.predict功能如何精确工作（后台发生了什么）？您如何对未包含在初始训练数据集中的用户进行预测？由于分解的潜在因素不是为这个用户构建的，他/她的预测是如何做出的？

我当前的 GraphLab Create 版本是 v1.10.1。

谢谢你的帮助！

python-2.7 collaborative-filtering graphlab

2016-07-20T09:22:42.017

问题标签 [graphlab]

Reference