使用 for 循环处理 pandas.df 时。我通常会遇到错误。删除错误后,我将不得不从数据帧的开头重新启动 for 循环。如何从错误位置开始 for 循环,摆脱重复运行它。例如:
senti = []
for i in dfs['ssentence']:
senti.append(get_baidu_senti(i))
在上面的代码中,我试图通过 api 进行情感分析并将它们存储到一个列表中。但是,api 只输入 GBK 格式,而我的数据是用 utf-8 编码的。所以它通常会遇到这样的错误:
UnicodeEncodeError: 'gbk' codec can't encode character '\u30fb' in position 14: illegal multibyte sequence
所以我必须手动删除像'\u30fb'这样的特定项目并重新启动for循环。此时,列表“senti”已经包含了很多数据,所以我不想放弃它们。我能做些什么来改进 for 循环?