我正在尝试导入具有以下结构的文件(推文转储,带有 unicode 字符串)。目标是使用 pandas 模块将其转换为 DataFrame。我假设第一步是加载到一个 json 对象,然后转换为一个 DataFrame(根据 McKinney 的 Python for Data Analysis 书的第 166 页),但我不确定并且可以使用一些指针来管理它。
import sys, tailer
tweet_sample = tailer.head(open(r'<MyFilePath>\usTweets0.json'), 3)
tweet_sample # returns
['{u\'contributors\': None, u\'truncated\': False, u\'text\': u\'@KREAYSHAWN is...