1

我正在学习 Julia,将其用作 R 和 Python 的替代品。

我有一个 Python 语句:

df = pd.read_csv('{0}/{1:03.0f}.csv'.format(directory, int(id)))

并且正在使用

filename = length(string(id)) == 1 ? "00"*string(id) : 
           length(string(id)) == 2 ? "0"*string(id) : string(id)
df = readtable(directory*"/"*filename*".csv")

我很喜欢这个,但有更简单的方法吗?

与 Python 类似,我可以使用 df.describe() 获得数据帧统计信息的摘要 (R)。Julia 中是否有等价物?

4

2 回答 2

3

sprintf是最紧凑的,但仅供参考,还有lpadand rpad

于 2013-10-10T06:47:56.593 回答
2

您可以@sprintf像这样使用宏:

julia> @sprintf("%s/%03d.csv","foo",1)
"foo/001.csv"

describe您可以使用以下函数获取 DataFrame 的摘要:

julia> using RDatasets

julia> iris = data("datasets","iris");

julia> describe(iris)

Min      1.0
1st Qu.  38.25
Median   75.5
Mean     75.5
3rd Qu.  112.75
Max      150.0
NAs      0
NA%      0.0%

Sepal.Length
Min      4.3
1st Qu.  5.1
Median   5.8
Mean     5.843333333333332
3rd Qu.  6.4
Max      7.9
NAs      0
NA%      0.0%

Sepal.Width
Min      2.0
1st Qu.  2.8
Median   3.0
Mean     3.0573333333333337
3rd Qu.  3.3
Max      4.4
NAs      0
NA%      0.0%

Petal.Length
Min      1.0
1st Qu.  1.6
Median   4.35
Mean     3.758000000000001
3rd Qu.  5.1
Max      6.9
NAs      0
NA%      0.0%

Petal.Width
Min      0.1
1st Qu.  0.3
Median   1.3
Mean     1.1993333333333331
3rd Qu.  1.8
Max      2.5
NAs      0
NA%      0.0%

Species
Length  150
Type    UTF8String
NAs     0
NA%     0.0%
Unique  3
于 2013-10-10T00:11:31.633 回答