0

当我尝试使用 pygrametl 中的以下代码在 PostgreSQL 的数据仓库中导入泰语数据时:

inputdata = CSVSource(open(file_name, 'r', encoding="utf8"), delimiter=',')

for row in inputdata:

    row['text'] = pygrametl.getstr(row['text']).encode("utf-8")

    facttbl.insert(row)

它有效,但它在文本中添加了“b”。如果我删除了 encode("utf-8") 部分,那么它会给我错误:

“列文本的缺失值”

如果我将文本更改为英文,则无需添加 encode("utf-8") 即可。仅当我正在读取的 csv 文件中有一些 unicode 字符时,才会显示该错误。

4

0 回答 0