有没有办法用R从excel文件中读出单元格的颜色索引?
虽然我可以使用XLConnect
or之类的包设置单元格颜色XLSX
,但我发现无法从现有工作簿中提取颜色信息。
R-Bloggers 提供了一个可以为您完成这项工作的功能。我在这里包括答案以供将来参考。
xlsx
使用包读取excel文件:
library(xlsx)
wb <- loadWorkbook("test.xlsx")
sheet1 <- getSheets(wb)[[1]]
# get all rows
rows <- getRows(sheet1)
cells <- getCells(rows)
这部分提取稍后将用于获取单元格的背景颜色(或其他样式信息)的信息:
styles <- sapply(cells, getCellStyle) #This will get the styles
这是function
识别/提取单元格背景颜色的:
cellColor <- function(style)
{
fg <- style$getFillForegroundXSSFColor()
rgb <- tryCatch(fg$getRgb(), error = function(e) NULL)
rgb <- paste(rgb, collapse = "")
return(rgb)
}
error
将处理没有背景颜色的单元格。
使用sapply
您可以获得所有单元格的背景颜色:
sapply(styles, cellColor)
您还可以通过了解 RGb 代码对它们进行分类/识别:
mycolor <- list(green = "00ff00", red = "ff0000")
m <- match(sapply(styles, cellColor), mycolor)
labs <-names(mycolor)[m]
您可以在R-bloggers阅读更多内容并了解如何应用它
老问题,但也许它可以在未来帮助某人。
POI (java) 库中有一个奇怪的行为(至少在我的计算机上)。它没有正确获取颜色。@M--答案中提供的代码在颜色是基本颜色(索引颜色)时效果很好,但在颜色为例如灰度时不起作用。要解决此问题,您可以使用以下代码使用该getTint ()
函数。色调是介于 -1(深)和 1(浅)之间的数字,将其与 RGB ( getRgb ()
) 函数结合使用,可以完全恢复颜色。
cell_color <- function(style){
fg <- style$getFillForegroundXSSFColor()
hex <- tryCatch(fg$getRgb(), error = function(e) NULL)
hex <- paste0("#", paste(hex, collapse = ""))
tint <- tryCatch(fg$getTint(), error = function(e) NULL)
if(!is.null(tint) & !is.null(hex)){ # Tint varies between -1 (dark) and 1 (light)
rgb_col <- col2rgb(col = hex)
if(tint < 0) rgb_col <- (1-abs(tint))*rgb_col
if(tint > 0) rgb_col <- rgb_col + (255-rgb_col)*tint
hex <- rgb(red = rgb_col[1, 1],
green = rgb_col[2, 1],
blue = rgb_col[3, 1],
maxColorValue = 255)
}
return(hex)
}
一些帮助参考:
https://poi.apache.org/apidocs/dev/org/apache/poi/hssf/usermodel/HSSFExtendedColor.html#getTint--