问题标签 [graphlab]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-2.7 - Graphlab 日期操作
我有一个dataset
我试图在 GraphLab 中操作的。我想将输入文件(转换为 SFrame)中的 UNIX Epoch 时间戳转换为人类可读的格式,以便我可以根据一天中的小时和一周中的一天进行分析。
time_array 是SFrame sf
表示时间戳的列/特征,我已经打破了 EPOCH 时间以简化事情。我知道如何转换一行的时间,但我想要一个向量运算。这是我的一排。
python - 在 ubuntu 中使用 graphlab 安装错误
我已正确关注https://dato.com并安装了 graphlab,但是当尝试在 ipython 中导入 graphlab 时,它仍然无法正常工作
有什么问题。
python - 尝试安装 graphlab 时出错
当我尝试导入 graphlab 时,我得到 ImportError。我在使用 OSX Yosemite 10.10.4 的 macbook 上。我确实有 anaconda,但我的 envs 文件夹是空的。根据一些研究,我尝试使用 conda config --add create_default_packages graphlab-create。但这并没有做任何事情。所以,我尝试了
这是命令 python setup.py egg_info 的完整输出:
它似乎可以正常下载并 100% 下载,但随后出现上述错误。
python - 使用 apply() 为新列赋值
word_count
我有一个SFrame
名为 sf的 SArray 。word_count
SArray中的每一行都由一个字典组成。我有一个名为的数组,selected_words
我试图遍历每一列,以查看“selected_words”中的哪些单词出现在该列中。如果出现,我将取值并将其写入新列。这是一个仅包含一个词(“很棒”)的示例:
据我了解,相同的值(1)应用于每一行,但我只需要在实际找到“伟大”一词的那一行中使用它。我怎样才能做到这一点?
python - 将数据列从一个 SFrame 附加到另一个 SFrame
我的训练数据train
SFrame
看起来像这样,有 4 列(“Store”列在此 SFrame中不唯一):
给定第二个store
SFrame
(“Store”列在此 SFrame 中是唯一的):
我可以通过遍历中的每一行并找到适当的 from然后保留列和 ise来将适当的附加StoreType
到我的:train
SFrame
train
StoreType
store
SFrame.add_column()
要得到:
但我确信有一种更简单、更快捷的方法可以使用Graphlab
. 当前方法具有O(n*m)
n = no的最坏情况。中的行数train
,m = 否。中的行数m
。
想象一下,我store
SFrame
有 8 列要附加到train
. 上面的代码效率非常低。
我还能如何将数据列从一个 SFrame 附加到另一个 SFrame?(也欢迎 Pandas 解决方案)
python - 将 Graphlab SFrame 日期列拆分为三列(年月日)
给定一个graphlab
SFrame
带有日期的列,例如:
在graphlab /其他python函数中是否有一种简单的方法可以将日期列转换为年|月|日?
在pandas
中,我可以这样做:从给定日期提取日、月和年的最快方法是什么?
但是将 SFrame 转换为 Panda 以拆分日期并转换回 SFrame 是一件很麻烦的事。
python - 如何通过在 Graphlab SFrame 中划分两列来创建新列?
给定一个 Graphlab SFrame:
如何通过将每行的销售额除以客户来添加“每位客户的销售额”列?
我尝试了以下方法,但它们不起作用(sf
是我的SFrame
:
有趣的是,我得到了一个 SArray 的输出:
但这并不能真正帮助将列添加回sf
,所以这不起作用 =( :
c++ - 无法使用 booster、C++、graphlab 解析 pm 格式的日期时间
我试图将日期时间字符串转换为 SArray 的日期时间(使用 C++ 助推器库),但它似乎不理解%p
格式说明符。http://www.boost.org/doc/libs/1_43_0/doc/html/date_time/date_time_io.html
该文档说用!
do not currently work for input
. 这是否意味着您无法使用pm
or解析任何内容PM
?
python - 通过关键列合并一列的中位数 - SFrame / Pandas
在graphlab
,我有以下SFrame
电话train
:
[出去]:
要获得每家商店的销售额中位数,我可以执行以下操作以使用以下方法为每家商店的销售额中位数附加一个新列graphlab
:
该代码的工作原理graphlab
是添加了一个新行mediansales
。但是当我尝试使用pandas
DataFrame
代码时:
这会根据 graphlab 代码提取每家商店的销售额中值,但是当我尝试将其合并回训练矩阵时:
它失败并抛出错误:
如何使用“Store”作为键合并“Sales”列的中位数pandas
?graphlab
代码虽然有效。
python - 字符串对象到 SFrame 中的 dateTime 对象
我有一个大约 20GB 的巨大数据集。我已经使用 graphlab.SFrame.read_csv() 读取了数据。我有一个日期列,它以 yyyy-dd-mm 格式读取为字符串。但我希望将该列作为日期时间对象读取。我该怎么做?
我知道一种方法是遍历每一行并使用 python 代码更改它。还有其他方法吗?可能更快?