我迫切需要以下方面的帮助。
对于我的硕士论文,我必须对一些 Amazon、Twitter 和 Facebook 数据进行情绪分析。我已将这些数据保存在 csv 文档中。现在我想使用 SentiWordNet 来获取极性分数。但是我无法使用 python 运行他们网站上提供的脚本。
首先,我必须说我对 Java 完全陌生。所以请不要怪我不知道这一切。我花了很多时间在互联网上搜索一些信息或教程,但没有运气。这个网站上有一个主题来自一个有类似问题的人(如何使用 SentiWordNet),虽然我遇到了一个不同的问题。每当我运行下面的脚本时,我都会收到以下消息:ImportError: No module named java.io.BufferedReader。我试图在互联网上搜索解决方案,但我找不到任何解决方案。有人可以帮我解决如何运行这个脚本。对于初学者,我已经删除了 sentiwordnet.txt 文件中的垃圾。SentiWordNet.txt 文件的路径是 \Users\Mo\Documents\etc。这也是 csv 文件的路径。顺便说一句,我正在使用 python 2.7.5 在 OSX 上运行这个脚本。
非常感谢您的帮助!!!
import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.util.HashMap;
import java.util.Iterator;
import java.util.Set;
import java.util.Vector;
public class SWN3 {
private String pathToSWN = "data"+File.separator+"SentiWordNet_3.0.0.txt";
private HashMap<String, String> _dict;
public SWN3(){
_dict = new HashMap<String, String>();
HashMap<String, Vector<Double>> _temp = new HashMap<String, Vector<Double>>();
try{
BufferedReader csv = new BufferedReader(new FileReader(pathToSWN));
String line = "";
while((line = csv.readLine()) != null)
{
String[] data = line.split("\t");
Double score = Double.parseDouble(data[2])-Double.parseDouble(data[3]);
String[] words = data[4].split(" ");
for(String w:words)
{
String[] w_n = w.split("#");
w_n[0] += "#"+data[0];
int index = Integer.parseInt(w_n[1])-1;
if(_temp.containsKey(w_n[0]))
{
Vector<Double> v = _temp.get(w_n[0]);
if(index>v.size())
for(int i = v.size();i<index; i++)
v.add(0.0);
v.add(index, score);
_temp.put(w_n[0], v);
}
else
{
Vector<Double> v = new Vector<Double>();
for(int i = 0;i<index; i++)
v.add(0.0);
v.add(index, score);
_temp.put(w_n[0], v);
}
}
}
Set<String> temp = _temp.keySet();
for (Iterator<String> iterator = temp.iterator(); iterator.hasNext();) {
String word = (String) iterator.next();
Vector<Double> v = _temp.get(word);
double score = 0.0;
double sum = 0.0;
for(int i = 0; i < v.size(); i++)
score += ((double)1/(double)(i+1))*v.get(i);
for(int i = 1; i<=v.size(); i++)
sum += (double)1/(double)i;
score /= sum;
String sent = "";
if(score>=0.75)
sent = "strong_positive";
else
if(score > 0.25 && score<=0.5)
sent = "positive";
else
if(score > 0 && score>=0.25)
sent = "weak_positive";
else
if(score < 0 && score>=-0.25)
sent = "weak_negative";
else
if(score < -0.25 && score>=-0.5)
sent = "negative";
else
if(score<=-0.75)
sent = "strong_negative";
_dict.put(word, sent);
}
}
catch(Exception e){e.printStackTrace();}
}
public String extract(String word, String pos)
{
return _dict.get(word+"#"+pos);
}
}