readxlsb
包可以将 Excel 二进制 (.xlsb) 文件读入 R。以下是从包小插图中获取的一些信息:
read_xlsb(path, sheet, range, col_names, col_types, na, trim_ws, skip, ...)
床单:
要读取的工作表的名称或索引。第一个工作表的索引为 1。如果工作表名称嵌入在范围参数中,或者如果范围是命名范围则隐含,则忽略此参数
范围:
范围可以指定为
- 一个命名范围。命名范围不区分大小写
- 在 Sheet!A1 表示法中
- 在 Sheet!R1C1 表示法中
- 作为一个 cellranger::cell_limits 对象
col_names
- TRUE:第一行用于列名。空单元格会生成“column.i”形式的列名</li>
- FALSE:列名将是 'column.i'</li>
- 字符向量:包含列名的向量。
col_types
可以从电子表格中隐含或在高级中指定。指定类型时,选项是
- “逻辑”(或“布尔”)、“数字”(或“双精度”)、“整数”、“日期”和“字符串”(或“字符”)
- 使用“skip”(或“ignore”)跳过一列
呐
解释为 NA 的字符串。这不会影响列的隐含数据类型。
修剪_ws
是否应该从字符串中修剪前导和尾随空格?
跳过
读取数据前要跳过的行数。
library(readxlsb)
res = read_xlsb(path = system.file("extdata", "TestBook.xlsb", package = "readxlsb"),
range = "PORTFOLIO",
debug = TRUE)
ls(res$env)
#> [1] "content" "named_ranges" "sheets" "stream"
res$env$named_ranges
#> name range sheet_idx first_column first_row
#> 1 INFO_RELEASE FirstSheet!$A$11 0 1 11
#> 2 OUTLOOK 'My SecondTab'!$A$1:$C$13 1 1 1
#> 3 PORTFOLIO FirstSheet!$A$3:$C$9 0 1 3
#> 4 SAVED_DATETIME FirstSheet!$C$13 0 3 13
#> 5 TITLE FirstSheet!$A$1 0 1 1
#> last_column last_row
#> 1 1 11
#> 2 3 13
#> 3 3 9
#> 4 3 13
#> 5 1 1
由reprex 包(v0.3.0)于 2020 年 7 月 7 日创建