问题标签 [graphlab]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python:来自另一个列表的dict中出现的计数
我正在尝试根据感兴趣的单词的子集来计算单词在 dict 列中存在的次数。
首先我导入我的数据
数据可以在这里找到:https ://drive.google.com/open?id=0BzbhZp-qIglxM3VSVWRsVFRhTWc
然后我创建我感兴趣的单词列表:
我想计算“单词”中每个单词在产品中出现的次数['word_count']。
我不喜欢使用graphlab。只是同事向我推荐的。
python - 将选定行从一个 Sframe 插入到另一个 Sframe
我知道 append() 函数将一个 SFrame 的所有行附加到另一个。但我想将一个特定的行从一个 SFrame 插入到另一个。有没有办法从 Sframe1 中只选择第二行并将其附加到 SFrame2?
我想从 tc 中选择单行并将其附加到 pc
performance - 将 SFrame 转换为输入数据集
我有一个非常糟糕的方法来将我的输入日志转换为输入数据集。我有一个具有以下格式的 SFrame sf:
action列占用从 1 到 9 的 9 个值。
因此,每个 user_id 可以多次执行多个操作。
我正在尝试从 sf 获取所有唯一的 user_id 并以下列方式创建 op_sf:
我想知道这是否是最快的方法。特别是如果可以在不生成 zero1 到 zero9 SFrame 的情况下做同样的事情。
一个例子SF:
l1对应上面的sf:
python - SFrame Kmeans - 转换为 Int、Float、Dict
我正在准备数据以从 Graphlab 运行 KMEAMS,并且遇到以下错误:
以下是每列的当前数据类型:
如果我可以将数据类型从 str 获取到 int,我认为它应该可以工作。然而,使用 SFrames 比标准的 python 库更棘手。任何帮助到达那里表示赞赏。
machine-learning - 在 GraphLab Sframe 中过滤和显示值?
因此,一周前我开始使用 Graphlab 来参加我的机器学习课程。我对 Graphlab 还是很陌生,我通读了 API,但无法完全得到我正在寻找的解决方案。所以,这就是问题所在。我的数据包含多列,例如卧室、浴室、平方英尺、邮政编码等。这些基本上是特征,我的目标是使用各种 ML 算法来预测房屋价格。现在,我应该找到邮政编码为 93038 的房屋的平均价格。所以,我把这个问题分解成更小的部分,因为我很天真,决定使用我的直觉。这是我到目前为止所尝试的。首先,我试图找到一种方法来创建一个过滤器,这样我就可以只提取带有邮政编码 - 93038 的房子的价格。
这些向我展示了邮政编码为 93038 的所有列,但我只想显示价值为 93038 的价格和邮政编码列。我尝试了很多不同的方法,但就是想不通。
另外,假设我想找到邮政编码值为 93038 的价格平均值。我该怎么做?
提前致谢。
python - 在 SFrame 中选择特定行
我对如何在 SFrame 数组中选择特定行感到困惑。我可以在这里选择第一行:
在这里,我试图只获得第 2 行
如何选择数据框中的任何行?
python - 使用 sklearn 编写相对于 graphlab 创建的相应代码时遇到问题,主要无法正确绘制
绘制犯罪率与房价的图表非常麻烦。使用graphlab lib很容易做到,但使用sklearn我无法做到。这是我的代码 wrt sklearn
我正在寻找的输出是 它可以使用 Graphlab 创建环境来完成
这是使用 graphlab create 正确运行的完整代码
希望有人能指出我的错误。谢谢。
这是数据集
python - graphlab 创建 sframe 如何获取 SArray 中位数
我正在研究graphlab create with
我试图获得其中一列的中位数
但我得到了错误
data.show() 将显示该列的中位数,但有人知道如何解决这个问题吗?
python-2.7 - GraphLab - FactorizationRecommender.predict 如何精确工作?
我对 FactorizationRecommender 的预测功能有疑问。
在我的支配下,我有一个包含用户项目对的大型数据集(以及每对的二进制评级)。需要注意的重要一点是,用户并没有与所有项目进行交互(评分矩阵非常稀疏)。
随后,我从数据集中删除了一个用户的所有评分(我选择他/她作为冷用户)。在所有剩余的用户项目对上,我训练了一个矩阵分解模型 ( factorization_recommender.create(...,binary_target=True)
)。
现在,当我向模型展示冷用户评分的一小部分时,我想对冷用户的剩余评分进行预测(例如,我显示冷用户评分的模型 10 并希望计算所有其他用户的预测评分项目)。接下来,我只想为冷用户计算预测的 RMSE。
我的问题有两个。首先,我并不完全清楚将哪些参数传递给FactorizationRecommender.predict
函数。我想向模型显示的用户项目对(和二元评级)的分数(例如,10 个评级),这些应该是new_observation_data
?我的输入应该是dataset
什么?初始训练数据集?
其次,我的问题是该FactorizationRecommender.predict
功能如何精确工作(后台发生了什么)?您如何对未包含在初始训练数据集中的用户进行预测?由于分解的潜在因素不是为这个用户构建的,他/她的预测是如何做出的?
我当前的 GraphLab Create 版本是 v1.10.1。
谢谢你的帮助!