我有一个小问题。我在 Python 中有这段代码(取自一个更大的脚本):
for line in open(trainFile):
for token,tag in [x.rsplit('/',1) for x in line.split()]:
tokenTagCount[(token,tag)] += 1
tags[tag] += 1
listOfTags.append(tag)
trainFile 包含丹麦语的单词和标签,但这不是问题。问题是这样的:因为文件是丹麦语,我必须# -*- coding: cp1252 -*-
在第一行包含才能正确显示 Python 中的字符。但是,我的 for 循环(“for line in open...”)应该忽略关于编码的第一行,并从 trainFile 的第二行开始运行,实际数据从这里开始。我该怎么做呢?
谢谢!