4

我正在使用 ROracle 从 R 连接到 Oracle 数据库。问题是对于每个特殊的 utf-8 字符,它都会返回一个问号。一些中文值返回一串实心问号。我相信这是相关的,因为我在这个站点(或其他站点)上没有找到任何其他问题来回答这个包 ROracle。一些最有希望的问题包括 MySQL 的答案:Fetching UTF-8 text from MySQL in R 返回“????” 但我无法为 ROracle 完成这项工作。该站点还提供了一些有用的信息https://docs.oracle.com/cd/E17952_01/mysql-5.5-en/charset-connection.html在我使用 RODBC 并且能够轻松配置 uft-8 编码之前。

这是一些示例代码...很抱歉,除非您有一个带有 utf-8 字符的 Oracle 数据库,否则可能无法复制...出于数据隐私的原因,我还更改了主机号和 sid...

library(ROracle)
drv <- dbDriver("Oracle")
# Create the connection string
host <- "10.00.000.86"
port <- 1521
sid <- "f110"
connect.string <- paste(
  "(DESCRIPTION=",
  "(ADDRESS=(PROTOCOL=tcp)(HOST=", host, ")(PORT=", port, "))",
  "(CONNECT_DATA=(SID=", sid, ")))", sep = "")

con <- dbConnect(drv, username = "XXXXXXXXX",
                 password = "xxxxxxxxx",dbname=connect.string)

my.table <- dbReadTable(con, "DASH_D_PROJECT_INFO")

my.table[40, 1:3]  

   PROJECT_ID DATE_INPUT PROJECT_NAME
    211625   2012-07-01  ??????, ?????????????????? ????? ??????, 1869?1917 [????? 3]

任何帮助表示赞赏。我已经阅读了 ROracle 包的整个文档,它似乎有一个用于编写 utf-8 字符的解决方案,但没有用于阅读它们。

4

1 回答 1

5

好的,几周后我找到了自己的答案。我希望它对其他人有价值。

我的问题很大程度上由 Oracle 如何存储数据来回答。如果您想要 UTF-8 特性保留,您需要表中的列是 NVARCHAR 而不仅仅是 varchar。届时,常规数据提取和编码将按预期在 R 中工作。我在错误的地方寻找错误。

我还想提一个关于如何使用 utf-8 将 utf-8 数据从 R 写入 Oracle 的问题

在编写文件时,我有一些不会以下列方式转换为 UTF-8 的文件。所以我做了太多的步骤,并分两步将它们写到一个 oracle 表中。结果完美无缺。

Encoding(my.data1$Project.Name) <- "UTF-8"

my.data1.1 <- my.data1[Encoding(my.data1$Project.Name) == "UTF-8", ]
my.data1.2 <- my.data1[Encoding(my.data1$Project.Name) != "UTF-8", ]
attr(my.data1.1$Project.Name, "ora.encoding") <- "UTF-8"

如果您发现这个有见地的给它投赞成票,以便更多人可以找到它。

于 2017-04-21T17:31:46.130 回答