12

我正在尝试使用 R 的 gridExtra 包中的 grid.table 将大约 40 行和 5 列的数据框输出到 .pdf 文件。

但是,40 行对于一个页面来说太长了,所以 .pdf 文件只显示数据框的一部分。我想知道是否可以在一页上打印两列,以便所有行都显示在一页上。或者,我需要知道如何在多页上打印数据框。谢谢,约翰

4

6 回答 6

4

尝试使用 gridExtra 包在跨越多个页面的 pdf 文件上绘制表格:

  1. 调整 pdf 设备纵横比

    pdf(file = myfile.pdf, height = 12, width = 26)
    
  2. 将大数据框拆分为块并在绘制表格之前调用 grid.newpage。

    require(gridExtra)
    pdf(file = myfile.pdf, height = 12, width = 26)
    grid.newpage()
    grid.table(sga_hits[1:38, ], show.rownames = FALSE)
    grid.newpage()
    grid.table(sga_hits[39:75, ], show.rownames = FALSE)
    dev.off()
    

将上述内容自动化如下:

    require(gridExtra)
    pdf(file = myfile.pdf, height = 12, width = 26)
    total_rows_per_page = 38 
    start_row = 1 

    if(total_rows_per_page > nrow(sga_hits)){
         end_row = nrow(sga_hits)
    }else {
         end_row = total_rows_per_page 
    }    

    for(i in 1:ceiling(nrow(sga_hits)/total_rows_per_page)){

       grid.newpage()   

       grid.table(sga_hits[start_row:end_row, ], show.rownames = FALSE)

       start_row = end_row + 1

       if((total_rows_per_page + end_row) < nrow(sga_hits)){

            end_row = total_rows_per_page + end_row

       }else {

            end_row = nrow(sga_hits)
       }    
    }

    dev.off()
于 2015-03-12T22:44:35.177 回答
4

我建议采用以下策略:创建 tableGrob,查询其高度,拆分行以适合每个页面,

library(gridExtra)
library(grid)
d <- iris[sample(nrow(iris), 187, TRUE),]
tg <- tableGrob(d, rows = seq_len(nrow(d))) 

fullheight <- convertHeight(sum(tg$heights), "cm", valueOnly = TRUE)
margin <- unit(0.51,"in")
margin_cm <- convertHeight(margin, "cm", valueOnly = TRUE)
a4height <- 29.7 - margin_cm
nrows <- nrow(tg)
npages <- ceiling(fullheight / a4height)

heights <- convertHeight(tg$heights, "cm", valueOnly = TRUE) 
rows <- cut(cumsum(heights), include.lowest = FALSE,
            breaks = c(0, cumsum(rep(a4height, npages))))

groups <- split(seq_len(nrows), rows)

gl <- lapply(groups, function(id) tg[id,])

pdf("multipage.pdf", paper = "a4", width = 0, height = 0)
for(page in seq_len(npages)){
  grid.newpage()
  grid.rect(width=unit(21,"cm") - margin,
            height=unit(29.7,"cm")- margin)
  grid.draw(gl[[page]])
}
## alternative to explicit loop:
## print(marrangeGrob(grobs=gl, ncol=1, nrow=1, top=NULL))
dev.off()

在此处输入图像描述

于 2015-08-02T01:00:56.223 回答
2

一种方法是缩小字体大小和水平/垂直填充。

grid.table(mtcars, gpar.coretext = gpar(fontsize=6), gpar.coltext = gpar(fontsize=6), padding.h=unit(2, "mm"), padding.v=unit(2, "mm"), show.rownames = TRUE)

于 2013-08-24T01:34:18.770 回答
2

实现视口grid是一种潜在的解决方案。

视口定义了图形设备中的一个区域。定义视口,然后将其推入并在其中绘制有时很有用。然后可以在其中推送和绘制不同的视口;这种方法相当于一种在页面上排列对象的简单方法。

首先,定义页面和边距大小。

# Assume total page size is 8.5in x 11in
vp.page <- viewport(x = 0.5, y = 0.5,
                   width = unit(x = 8.5, units = "inches"),
                   height = unit(x = 11, units = "inches"))

# Assume 0.5in margins (i.e., 0.5 left, right, bottom, top)
# This totals 1in for each dimension
vp.marg <- viewport(x = 0.5, y = 0.5,
                    width = (7.5 / 8.5), height = (10 / 11))

接下来,为每列定义视口。

要在视口内水平排列列,它们的 x 位置将在间隔 (0,1) 中等距分布。

在 2 列的情况下,x1 = 0.25 和 x2 = 0.75:

# Define the viewport for column 1
vp.col1 <- viewport(x = 0.25, y = 0.5, width = 0.5, height = 1)

# Define the viewport for column 2
vp.col2 <- viewport(x = 0.75, y = 0.5, width = 0.5, height = 1)

现在,定义了实际数据。这些数据也需要“grob'd”才能绘制到视口中。

# Assume data is stored as `dat` and has 40 rows
# Grob the data for column 1
col1 <- tableGrob(dat[1:20,], rows = NULL)

# Grob the data for column 2
col2 <- tableGrob(dat[21:40,], rows = NULL)

现在,绘制pdf:

# Initiate the pdf
pdf("results.pdf", height = 11, width = 8.5)
# Push the viewports for page and margin
pushViewport(vp.page); pushViewport(vp.marg)

# Push column 1
pushViewport(vp.col1)
# Draw column 1
grid.draw(col1)

# Return to the previous viewport
upViewport()

# Push the viewport for column 2
pushViewport(vp.col2)
# Draw column 2
grid.draw(col2)

# End the pdf and save it
dev.off()
于 2015-07-30T00:36:06.820 回答
1

pdf()有一个width和一个height论点。

您最好的选择是扩大尺寸,然后如果您要打印到纸上,那么您使用的任何程序都可能更适合。

或者,如果您想在一页上打印两列,只需遍历这些列:

# assuming `myDF` is your data.frame

pdf("filename.pdf")
for (cl in seq(from=1, to=ncol(myDF)-1, by=2)) {
      plot.new()
      grid.table(myDF[, cl+(0:1)])
    }
dev.off()
于 2013-04-11T00:12:30.410 回答
1

我只是用了一个黑客。我使用 R2HTML 将表格打印为 html,然后使用 wkhtmltopdf 将 html 转换为 pdf。

在 R 中:

library(R2HTML)
HTML(table, file="table.html")

在壳里

wkhtmltopdf table.html table.pdf
于 2015-03-12T10:43:19.890 回答