问题标签 [julia-dataframe]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

25 问题

0 投票

1 回答

61 浏览

julia - 在 Julia DataFrame 中查找一行

在 DataFrames.jl 的 DataFrame 中查找行的规范方法是什么？

例如，给定这个 DataFrame：

给定名称“CitableImage”，检索 uuid 的最佳方法是什么？

julia julia-dataframe

2021-07-06T15:36:29.110

0 投票

1 回答

63 浏览

julia - 无法在 Julia DataFrame 中添加变量

我正在尝试从文件夹中读取所有文件并尝试根据文件名创建文件名变量

我正在使用下面的代码来做到这一点。但我无法添加让我知道文件名的变量 -

我收到以下错误 -

创建文件名没有问题，但是将其添加到数据框时有问题。下面的代码工作正常并提供文件名，但无法将其添加为变量

你能帮忙吗？

julia julia-dataframe

2021-08-29T04:00:13.153

0 投票

1 回答

62 浏览

dataframe - Julia - 遍历数据框并执行条件操作

还没有找到任何类似的东西，对朱莉娅来说是新的。

试图看看这是否可以在一个过程中完成，或者应该分开，或者我没有想到的其他事情。基本上如下面的 df 所示 - 试图看看我如何向这个 df 添加一个条件逻辑列，锚定在 Year 列上（为 int64 道歉 - 实际数据实际上是 Date df 格式）。

具体来说，为样本添加尾随 2 年列的最佳方法是什么（在显示整体增长正在进行的列旁边 - 在示例 df 中，它是 ProValue 列），类似于：
“ProValue2YrTrailing = cumprod(:Growth . +1) 当年数为每组 2 时"

无法完全弄清楚如何在此处使用@linq 和 Dataframes 通过转换创建条件列。

谢谢！

编辑：我能想到的一种方法是通过下面，但似乎不是很优雅，尤其是当周期帧从 2 增长到 30 时：

dataframe julia julia-dataframe

2021-09-03T00:17:04.743

0 投票

1 回答

108 浏览

amazon-s3 - Julia 从 s3 csv 文件加载数据帧

对于这个简单的用例，我很难找到一个在线遵循的示例：

将 CSV 文件从 s3 对象位置加载到 julia DataFrame。

这是我尝试但没有用的方法：

我还可以将文件读入本地的字符串对象：

我的 AWS 配置是有序的，我可以在本地从 julia 访问该对象。

如何将其放入数据框中？

amazon-s3 julia julia-dataframe

2021-09-10T03:44:36.340

0 投票

2 回答

57 浏览

dataframe - 尝试使用 Arrow.jl 保存 DataFrame 会给出： ArgumentError：类型没有确定数量的字段。整数元组的元组

我有一个数据框，我想使用Arrow.write().

我可以通过省略一列来保存它的子帧。但是，如果我将列留在其中，我会收到此错误：

ArgumentError：类型没有确定数量的字段

此列中的对象都是 4-Tuples，它们的元素要么是空的 Tuples，要么是 Int64 的 1-或 2-Tuples。典型的例子是((1), (), (2), ())和((1, 2), (), (), ())。如果我使用 Arrays of Arrays 而不是 Tuples of Tuples，它工作得很好。我更喜欢使用元组，并且我不希望在写入之前和读取之后不必处理数据（请注意，这也排除了使用四个单独的列之类的事情——另外我怀疑有 2-tuples 和 1-tuples 并且为空同一列中的元组会产生相同的错误）。

我不太明白这里错误的含义，所以我不确定如何修复它。有简单的解决方法吗？还是我需要改用数组？

这是一个最小的工作示例，它给了我这个错误：

如果我使用col=[x]or col=[y]，它可以工作，所以问题源于在同一个向量中具有两个元组形状。也许这是Arrow的一个基本限制？

有关错误消息的更多详细信息：错误消息来自reflection.jl第 764 行，位于fieldcount(@nospecialize t). 此函数由 Arrow 调用arrowvector（在 `arraytypes/struct.jl' 中）。这是完整的函数定义：

fieldcount在第 5 行调用，但我不知道T我的用例会是什么。

dataframe tuples julia apache-arrow julia-dataframe

2022-01-22T00:50:02.890

1 2 3 4 5 6 7 8 9 10

问题标签 [julia-dataframe]

julia - 在 Julia DataFrame 中查找一行

julia - 无法在 Julia DataFrame 中添加变量

dataframe - Julia - 遍历数据框并执行条件操作

amazon-s3 - Julia 从 s3 csv 文件加载数据帧

dataframe - 尝试使用 Arrow.jl 保存 DataFrame 会给出： ArgumentError：类型没有确定数量的字段。整数元组的元组

Reference