我正在尝试使用 R 的 gridExtra 包中的 grid.table 将大约 40 行和 5 列的数据框输出到 .pdf 文件。
但是,40 行对于一个页面来说太长了,所以 .pdf 文件只显示数据框的一部分。我想知道是否可以在一页上打印两列,以便所有行都显示在一页上。或者,我需要知道如何在多页上打印数据框。谢谢,约翰
尝试使用 gridExtra 包在跨越多个页面的 pdf 文件上绘制表格:
调整 pdf 设备纵横比
pdf(file = myfile.pdf, height = 12, width = 26)
将大数据框拆分为块并在绘制表格之前调用 grid.newpage。
require(gridExtra)
pdf(file = myfile.pdf, height = 12, width = 26)
grid.newpage()
grid.table(sga_hits[1:38, ], show.rownames = FALSE)
grid.newpage()
grid.table(sga_hits[39:75, ], show.rownames = FALSE)
dev.off()
将上述内容自动化如下:
require(gridExtra)
pdf(file = myfile.pdf, height = 12, width = 26)
total_rows_per_page = 38
start_row = 1
if(total_rows_per_page > nrow(sga_hits)){
end_row = nrow(sga_hits)
}else {
end_row = total_rows_per_page
}
for(i in 1:ceiling(nrow(sga_hits)/total_rows_per_page)){
grid.newpage()
grid.table(sga_hits[start_row:end_row, ], show.rownames = FALSE)
start_row = end_row + 1
if((total_rows_per_page + end_row) < nrow(sga_hits)){
end_row = total_rows_per_page + end_row
}else {
end_row = nrow(sga_hits)
}
}
dev.off()
我建议采用以下策略:创建 tableGrob,查询其高度,拆分行以适合每个页面,
library(gridExtra)
library(grid)
d <- iris[sample(nrow(iris), 187, TRUE),]
tg <- tableGrob(d, rows = seq_len(nrow(d)))
fullheight <- convertHeight(sum(tg$heights), "cm", valueOnly = TRUE)
margin <- unit(0.51,"in")
margin_cm <- convertHeight(margin, "cm", valueOnly = TRUE)
a4height <- 29.7 - margin_cm
nrows <- nrow(tg)
npages <- ceiling(fullheight / a4height)
heights <- convertHeight(tg$heights, "cm", valueOnly = TRUE)
rows <- cut(cumsum(heights), include.lowest = FALSE,
breaks = c(0, cumsum(rep(a4height, npages))))
groups <- split(seq_len(nrows), rows)
gl <- lapply(groups, function(id) tg[id,])
pdf("multipage.pdf", paper = "a4", width = 0, height = 0)
for(page in seq_len(npages)){
grid.newpage()
grid.rect(width=unit(21,"cm") - margin,
height=unit(29.7,"cm")- margin)
grid.draw(gl[[page]])
}
## alternative to explicit loop:
## print(marrangeGrob(grobs=gl, ncol=1, nrow=1, top=NULL))
dev.off()
一种方法是缩小字体大小和水平/垂直填充。
grid.table(mtcars, gpar.coretext = gpar(fontsize=6), gpar.coltext = gpar(fontsize=6), padding.h=unit(2, "mm"), padding.v=unit(2, "mm"), show.rownames = TRUE)
实现视口grid
是一种潜在的解决方案。
视口定义了图形设备中的一个区域。定义视口,然后将其推入并在其中绘制有时很有用。然后可以在其中推送和绘制不同的视口;这种方法相当于一种在页面上排列对象的简单方法。
首先,定义页面和边距大小。
# Assume total page size is 8.5in x 11in
vp.page <- viewport(x = 0.5, y = 0.5,
width = unit(x = 8.5, units = "inches"),
height = unit(x = 11, units = "inches"))
# Assume 0.5in margins (i.e., 0.5 left, right, bottom, top)
# This totals 1in for each dimension
vp.marg <- viewport(x = 0.5, y = 0.5,
width = (7.5 / 8.5), height = (10 / 11))
接下来,为每列定义视口。
要在视口内水平排列列,它们的 x 位置将在间隔 (0,1) 中等距分布。
在 2 列的情况下,x1 = 0.25 和 x2 = 0.75:
# Define the viewport for column 1
vp.col1 <- viewport(x = 0.25, y = 0.5, width = 0.5, height = 1)
# Define the viewport for column 2
vp.col2 <- viewport(x = 0.75, y = 0.5, width = 0.5, height = 1)
现在,定义了实际数据。这些数据也需要“grob'd”才能绘制到视口中。
# Assume data is stored as `dat` and has 40 rows
# Grob the data for column 1
col1 <- tableGrob(dat[1:20,], rows = NULL)
# Grob the data for column 2
col2 <- tableGrob(dat[21:40,], rows = NULL)
现在,绘制pdf:
# Initiate the pdf
pdf("results.pdf", height = 11, width = 8.5)
# Push the viewports for page and margin
pushViewport(vp.page); pushViewport(vp.marg)
# Push column 1
pushViewport(vp.col1)
# Draw column 1
grid.draw(col1)
# Return to the previous viewport
upViewport()
# Push the viewport for column 2
pushViewport(vp.col2)
# Draw column 2
grid.draw(col2)
# End the pdf and save it
dev.off()
pdf()
有一个width
和一个height
论点。
您最好的选择是扩大尺寸,然后如果您要打印到纸上,那么您使用的任何程序都可能更适合。
或者,如果您想在一页上打印两列,只需遍历这些列:
# assuming `myDF` is your data.frame
pdf("filename.pdf")
for (cl in seq(from=1, to=ncol(myDF)-1, by=2)) {
plot.new()
grid.table(myDF[, cl+(0:1)])
}
dev.off()
我只是用了一个黑客。我使用 R2HTML 将表格打印为 html,然后使用 wkhtmltopdf 将 html 转换为 pdf。
在 R 中:
library(R2HTML)
HTML(table, file="table.html")
在壳里
wkhtmltopdf table.html table.pdf