我正在尝试从 R 中的 HANA 数据库导入一个非常大的数据集。RJDBC 包的问题之一是所有带有字符的列都作为字符列类型加载。在我们的例子中,将列作为因子加载会更有效,因为只有几个唯一值。是否可以在 RJDBC 调用中的某个地方定义 col 类以及在哪里进行 col 类转换?如果在 HANA 中执行转换为因子会很好,因为它会减少必须传输到 R 的 GB 数。示例代码:
dbFetch(dbSendQuery(conn = hana_connection, statement = 'select CHAR_COL FROM TABLE_NAME'))
在文档https://www.rforge.net/RJDBC/上,他们正在谈论所需的 DBML 语句。