“sframe”的相关标签问题_Stack Overflow中文网

0 投票

3 回答

7738 浏览

graphlab - 如何将`apply`与需要多个输入的函数一起使用

我有一个有多个输入的函数，并想SFrame.apply用来创建一个新列。我找不到将两个参数传递给SFrame.apply.

理想情况下，它将列中的条目作为第一个参数，我将传入第二个参数。直觉上像...

graphlab sframe

2015-10-09T01:16:38.943

0 投票

3 回答

11210 浏览

python - 根据给定分布对数据帧进行采样

如何根据给定的类\标签分布值对 pandas 数据框或 graphlab sframe 进行采样，例如：我想对具有标签\类列的数据框进行采样以选择行，以便平等地获取每个类标签，从而具有相似的频率为每个类标签对应一个均匀分布的类标签。或者最好是根据我们想要的类分布来获取样本。

以上应根据第二帧中的给定频率分布从第一个数据帧中提取行，其中频率计数值在 nostoextract 列中给出，以给出每个类最多出现 2 次的采样帧。如果找不到足够的类来满足所需的计数，则应忽略并继续。生成的数据帧将用于基于决策树的分类器。

正如评论员所说，采样数据帧必须包含 nostoextract 相应类的不同实例？除非给定类没有足够的示例，在这种情况下，您只需获取所有可用的示例。

2015-10-13T07:58:18.880

0 投票

0 回答

543 浏览

python - GraphLab 使用 SFrame 创建：内存错误

我正在尝试制作一个 SFrame 来分析带有产品评论信息的文件夹“amazon_baby.gl”以进行情绪分析。该文件夹只有大约 40MB 大，我有大约 1GB 的内存。然而我得到一个错误：

/home/anshudwibhashi/Coursera/lib/python2.7/site-packages/graphlab/cython/cy_sframe.so 在graphlab.cython.cy_sframe.UnitySFrameProxy.head()

/home/anshudwibhashi/Coursera/lib/python2.7/site-packages/graphlab/cython/cy_sframe.so 在graphlab.cython.cy_sframe.UnitySFrameProxy.head()

内存错误：std::bad_alloc

我已经阅读了其他一些帖子，他们建议从 graphlab 文件夹中注释掉 CMakeLists.txt 中的某一行，但我首先找不到这样的文件夹......

另一件事是，SFrame 应该是一个可以工作的框架，尽管内存较少（与 pandas 等相比），但我收到了这个错误。请帮忙！

谢谢！

编辑：我刚刚检查过我已经有大约 800 MB 可用空间了！

python graphlab sframe

2015-10-13T11:59:21.623

0 投票

7 回答

8174 浏览

python - 在python中调用函数使用.apply

我有一个简码如下。尝试使用.apply来调用一个函数。但它总是给我一个错误，说该函数不可调用。

有人可以帮帮我吗？

python sframe

2015-11-03T18:50:11.610

0 投票

1 回答

811 浏览

python - 将数据列从一个 SFrame 附加到另一个 SFrame

我的训练数据train SFrame看起来像这样，有 4 列（“Store”列在此 SFrame中不唯一）：

给定第二个store SFrame（“Store”列在此 SFrame 中是唯一的）：

我可以通过遍历中的每一行并找到适当的 from然后保留列和 ise来将适当的附加StoreType到我的：train SFrametrainStoreTypestoreSFrame.add_column()

要得到：

但我确信有一种更简单、更快捷的方法可以使用Graphlab. 当前方法具有O(n*m)n = no的最坏情况。中的行数train，m = 否。中的行数m。

想象一下，我store SFrame有 8 列要附加到train. 上面的代码效率非常低。

我还能如何将数据列从一个 SFrame 附加到另一个 SFrame？（也欢迎 Pandas 解决方案）

python pandas dataframe graphlab sframe

2015-11-17T22:45:31.050

0 投票

1 回答

133 浏览

c++ - 无法使用 booster、C++、graphlab 解析 pm 格式的日期时间

我试图将日期时间字符串转换为 SArray 的日期时间（使用 C++ 助推器库），但它似乎不理解%p格式说明符。http://www.boost.org/doc/libs/1_43_0/doc/html/date_time/date_time_io.html 该文档说用! do not currently work for input. 这是否意味着您无法使用pmor解析任何内容PM？