1

我正在测试 Personality Insights,我很好奇在将 Twitter 个人资料的时间线字符串发送给 IBM 之前是否需要进行任何数据清理。

例如,我是否应该删除推文中包含的 url 以及单个推文中包含的主题标签或个人资料名称等其他推特功能。

我目前没有删除任何数据。但是,我目前正在使用句号和空格连接推文text+=". "+tweetfulltext

4

1 回答 1

2

您不需要,但由于它们不计入个性,因此如果您已经有一个清理模块,它将有助于字数统计。您将需要过滤以删除转推。

于 2017-07-10T09:47:10.713 回答