-3

我正在尝试开发一个 C# 程序来检索用户的 Facebook 帖子并根据他的帖子分析该人的个性。这将意味着分析他的单词和语言/句子结构以确定他是什么类型的人。例如:过度自信、胆怯、愤怒等。

但是,我不知道我应该如何使用这些词来分析他的个性。似乎很难,因为我可以在帖子中同时使用正面和负面的词。有任何想法吗?

4

1 回答 1

2

您打算完成的工作非常复杂(主要是提供可接受的准确性)并且没有简单的解决方案。

我将在您的职位上采取的方法的基本想法:

  1. 它可以专门用于给定语言(例如英语),即您在执行开发时考虑的语言。依靠翻译来考虑其他语言会极大地影响其可靠性。您要考虑的每种新语言都需要新的“开始分析”。
  2. 此开发中最重要的部分将是数据库,因此您必须重点关注其设计、连接性、数据存储/检索等。
  3. 数据库的最小内容:单词列表、它们相关的“值”(胆小、愤怒等)、它们在给定值中的重要性(f 词得到 8 分(满分 10 表示“好斗”)、可能性有多大这个词有不同的含义(如上面的评论中所建议的,“sick”可能会得到一个警告标志来检查确切的上下文),进一步的考虑(例如,重复次数如何影响它的值)等等。此外,你必须包括不同级别的存储(每个帖子、每个用户、每个时间等)。
  4. 您必须创建一个具有足够适应性和可扩展性的算法(这里预计会有很多更改、改进、添加等)来提供您想要的。我想出的基本想法是:根据数据库中定义的每个单词的值来评估每个帖子(通过单独考虑每个单词、给定单词的重复次数、给定单词的上下文等) .),即检查哪些词是值得分析的,哪些不是;解析系统不仅能够提取单个单词,还能够分析上下文(同一句子/段落中目标单词之前和之后的单词或不同的单词);制定一些规则以避免“误解”(例如,认为行为具有攻击性的最少帖子数量,否则就忽略(也许只是幽默);考虑因不同类型的帖子而形成的复杂情绪(例如,3 个帖子中的愤怒 + 9 个帖子中的胆怯 = *);ETC。); 总之,它必须能够尽可能准确地将“离散职位现实”转换为所需的输出(对职位/用户的评估)。

如前所述,这并不容易。但是,如果您一步一步地做事,并确保结构具有足够的适应性以允许任何修改/扩展,您可能会得到一个非常可靠的软件(通过了解您可以期望的理想结果是什么,即排名所使用的语言类型;将其推断为真实的人格分析听起来可能过于雄心勃勃),这可能会引起很多人的兴趣。

于 2013-07-18T09:20:22.447 回答