问题标签 [graphlab]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - graphlab 停用词有哪些可用的语言?
在graphlab
中,可以使用以下命令检索停用词列表:
但是从文档中,并不清楚graphlab支持哪些其他语言:https ://dato.com/products/create/docs/generated/graphlab.text_analytics.stopwords.html#graphlab.text_analytics.stopwords
graphlab 停用词有哪些可用的语言?
python - 如何找到在 Graphlab SFrame 中保存时引发错误的特定行?
我有一个SFrame
看起来像这样的sf.print_rows(10)
:
但是当我尝试将其保存到 csv 中时sf.save('trainers.csv', format='csv')
,它会引发错误:
我打印 n 号。sf.print_rows(10)
一次一行的行,例如sf.print_rows(100)
和 at sf.print_rows(129)
,它会引发错误:
所以我做了一个sf.fillna(c, 0)
:
它引发了另一个错误:
如何找到在 Graphlab SFrame 中保存时引发错误的特定行?
我该如何修复这一行?我可以用 替换行中有问题的列fillna()
吗?我真的不能把这些行扔掉,dropna()
因为我需要跟踪有问题的行。
但即使有dropna()
,我最终还是:
如何找到这些给我错误或 ZeroDivisionErrors 的行?以及如何更正它们或用零填充这些列?
奇怪的是,当我尝试通过以下方式遍历 SFrame 时,我无法遍历 SFrame:
它抛出这个错误:
它变得更奇怪了,我无法检索特定的行,sf[num]
但我可以做一个子 SFrame,然后检索该特定的num
行。所以这:
休息和投掷:
但是当我尝试提取一个子集然后打印时,它可以工作。下面的代码检索之前使用上面的代码抛出错误的第 25 个元素:
前面的代码sf[25]
抛出 a 有什么原因NoneType
吗? sf[0]
可以sf[24]
工作,但 25 岁以上的任何东西都没有。
显然,以这种方式迭代 SFrame 并将其转储为 str sorta 工作:
这很奇怪。为什么以块进行迭代并转储到字符串有效?
python - 将 graphlab sframe 转换为 {key: values} 的字典
给定一个这样的 SFrame:
如何将 SFrame 转换为字典,使得X1
列是键X2
并X7
作为np.array()
?
我尝试逐行遍历原始 SFrame 并执行以下操作:
还有另一种方法可以做到这一点吗?
已编辑
在尝试了@papayawarrior 解决方案之后,如果我可以将整个数据帧加载到内存中,它就可以工作,但是有一些古怪的东西让它变得很奇怪。
假设我对 SFrame 的原始输入如上所示(有 501 列)但在.csv
文件中,我有代码将它们读入所需的字典:
但奇怪的是它给出了这个错误:
因此,当我在转换为字典之前检查列名时,我发现我的列名不是 'X1' 和 'X2' 而是list(df)
prints ['X501', 'X3']
。
我的转换方式有问题graphlab.SFrame -> pandas.DataFrame -> dict
吗?
我知道我可以通过这样做来解决问题,但问题仍然存在,“列名如何变得如此奇怪?”:
python - 在 SFrame 行上使用 row.values() 时如何对值进行排序?
当我连续使用 row.values() 时,值是如何排序的graphlab.SFrame
?
例如:
[出去]:
所以看起来它们是按键/列名排序的,但这总是真的吗?任何指向 python 字典或 SFrame 文档的指针都将不胜感激。
python - GraphLab 安装失败并出现未知错误
我尝试通过 pip 安装 GraphLab Create。穿过台阶,直到最后一步让我停下了脚步。最后的命令:
这给出了以下输出:
出了什么问题,我该如何解决?
python-2.7 - graphlab.label_propagation.create 中支持多个标签值
下面的代码尝试添加 2 个顶点,这两个顶点都具有多个标签值。然后尝试将标签“labelx”上的 label_propagation 应用于创建的图形。
但是,抛出错误为 TypeError: TypeErro...typed.',)
在 Labelpropagation 的文档中,我在任何地方都找不到多标签支持信息。欢迎提供有关如何解决问题的任何提示。如果 graphlab.label_propagation 不支持顶点上的多标签,那么提供此功能的其他包上的任何方向都将非常有帮助。
谢谢!
sentiment-analysis - Graphlab:如何避免手动复制只有不同字符串变量的函数?
我用 SFrame 导入了我的数据集:
我想对如下所示的一组单词进行情绪分析:
然后我想为 products 矩阵中每个选定的单词创建一个新列,条目是这样的单词出现的次数,所以我为单词“awesome”创建了一个函数:
到目前为止一切都很好,但是我需要以这种方式为每个选定的单词手动创建其他函数,例如,great_count 等。如何避免这种手动工作并编写更清晰的代码?
python-2.7 - 如何在graphlab(python 2.7)中将日期从unix时间戳转换为人类可读格式
我正在处理 34gb 的大文本文件。我已经使用 graphlab create 成功解析了文件。数据集中有一列关于日期。日期以 unix 时间戳显示。如何将输入文件(转换为 SFrame)中的 UNIX 时间戳转换为人类可读的格式?
python - AttributeError:“模块”对象没有属性“Sframe”
我首先直接从其可执行文件安装了 Dato ,然后通过(此处的说明GraphLab Create
)手动运行以进行故障排除。python 27
pip
代码:
输出:
现在,尝试将 .csv 文件加载为 Sframe:
抱怨:
任何想法如何确定问题?非常感谢。
注意:卸载已经存在的python 34
版本
python - Dato-Graphlab 检查边缘是否存在
我刚刚安装了 Graphlab,并正在尝试将 NetworkX 代码转换为 Graphlab。我在 Graphlab 文档中找不到 NetworkX 等效的G.has_edge()
. 如果不存在类似的功能,如何检查 Graphlab Edge 是否已存在于图中?