问题标签 [castra]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Dask DataFrame:对具有多行的 groupby 对象重新采样
我有以下从 Castra 创建的 dask 数据框:
产量:
我想做的是:
user_id
按和分组ts
- 在 3 小时内重新采样
- 在重采样步骤中,任何合并的行都应该连接文本
示例输出:
我尝试了以下方法:
并得到以下错误:
我尝试传入set_index('ts')
管道,但它似乎不是Series
.
关于如何实现这一目标的任何想法?
TL;博士
如果它使问题变得更容易,我还可以更改我创建的 Castra DB 的格式。我目前的实现很大程度上取自这篇很棒的帖子。
我将索引(在to_df()
函数中)设置如下:
并且有:
以下是生成的 dtypes:
python - dask 计算未并行执行
我有一个 json 文件目录,我试图将其转换为 dask DataFrame 并将其保存到 castra。它们之间有 200 个包含 O(10**7) json 记录的文件。代码非常简单,主要遵循教程示例。
我在 32 核机器上运行它,但代码仅 100% 使用一个核。我对文档的理解是这段代码是并行执行的。为什么不是?我是不是误会了什么?
python-2.7 - 无法使用 dask 的 from_castra() 函数加载 castra 文件
我正在尝试复制此页面关于 castra、dask 和 reddit 评论的示例,当我运行
dd.from_castra(数据,列)
我的 castra 文件需要几个小时才能创建,但它很干净并且与教程中提到的完全一样。
在亚马逊 AWS 上使用了我的 macbook 和 Ubuntu 实例,并且遇到了同样的问题。
相同的代码和文件在 Windows PC 中运行良好。
任何信息都可能会有所帮助!
ValueError:预期的(名称,dtype)元组的可迭代,得到['存档','作者',....]
clojurescript - 如何将数组从 Castra 后端传递到 Hoplon
如果我试图将数组放入 index.cljs.hl 页面,我该如何在 Clojurescript 中使用该数组。我发现我可以使用:
在 hLisp 部分,但如果我想使用上面的 html 标记所在的数组,我似乎遇到了问题。rpc.cljs页面中的数组如下
我试过使用没有数据的地图,只有一个数组,它可以工作:
但是,如果我尝试使用该数组,它就不再起作用了,我也不知道为什么。
干杯
python - ImportError:无法导入名称“msgpack”
我正在关注使用 castra 和 dask 阅读 reddit 评论的教程。
我已经使用 anaconda 和 castra 使用 pip 安装了最新版本的 dask 和 pandas。我的 pandas 版本是“0.22.0”,我pip install pandas-msgpack -U
使用 Python 3.6 安装了 msgpack。
尝试导入 castra 会给我以下错误: