鉴于最近发生的投票欺诈事件,我想知道是否有人熟悉构建系统以防止或检测不良投票行为。我想这项技术被广泛用于搜索引擎、在线广告(例如点击欺诈)和社区网站(例如 Digg、reddit),但令人惊讶的是,由于显而易见的原因很少公开。
所以这是我的问题:考虑到复杂性和用户体验,你将如何设计这样一个系统?是否有一些学术研究领域对此进行了研究?
PS:这不是关于欺诈检测机制的问题,也不是您最近的个人经历;为此,请参阅另一个问题。
关于投票系统的文献有很多,可以应用一些博弈论。困难的问题是它本质上是概率性的。您选择某些模式作为可能的欺诈行为,并检测或排除它们;通过这样做,您还排除了某人出于无辜或至少是非欺诈性的原因以这种方式投票的可能性。
考虑一下,例如,有人读了我不死的散文,立即对我产生了好感,并通过我所有的答案投票赞成。我有 30 多个答案,所以需要几天时间。现在,根据假设,这不是我的名誉嫖客,这是一个出于自己的原因,无论多么不明智,一次将所有投票都献给我的人。
这是欺诈吗?不,但它会被检测为并可能被视为欺诈。
问题是你可以创建的几乎任何系统都可以被玩弄,祝你好运,试着提前弄清楚如何玩弄它。当然,另一个问题是我们“A 型”人格对本质上毫无意义的事情过于重视,所以你让人们花费大量时间和精力来最大化他们的代表或最小化别人的代表。
(而且因为我是一个大伪君子,但我尽量不成为,我会做这个 CW)
我在 2020 年美国大选中看到了很多选票欺诈的证据,这现在是联邦和州诉讼的主题(参见:Hammer / Scorecard / Dominion)[纽约邮报][1]
[更多链接][2]
我想知道如何建立一个像样的投票系统。看起来真的没那么难。
我提出了这样一个系统的以下框架大纲。
中央政府可以发布一个人的 Dob + 姓名加上随机的 4 位数字的哈希值。(或其他识别信息)
该数据库由政府集中保存,(可能是区块链)
该信息的哈希值通过邮寄、电子邮件或短信发送给选民。
选民然后把这个带到投票站,
如果呈现的哈希与中央记录的哈希匹配,#您的投票选择将针对您的中央持有的哈希进行记录。
这样的系统可以构成相当不错的投票机制的基础。
如果 Hash 的长度为 100 个字符,并且有 3000 万选民(在英国),这意味着一个大约 3Gb 的数据库。
整个事情可以在一个非常小的平台上运行。
几乎不需要人工参与,整个事情可以在公开(只读)的情况下运行以提高透明度。选民 ID 受到保护,因为只有哈希和选择是公开可用的,因此观察者可以检查人口数量、计票等。可能整个事情都可以自动化,因此几乎不需要人工参与。
可以编写代码,因此您只能投票一次,例如,如果 Vote = False,则 Vote Allowed = True
投票可以记录为 2 个(或更多)字节,允许 4 个半字节用于 4 个选择等等等等。
你不能投票两次,因为一旦你的投票被登记在你的个人哈希上,一旦你投票,它就不能改变不能改变。
您的识别哈希必须与中央持有的哈希匹配才能被允许投票。
我只是展示了一个看起来相当健壮的系统如何组合在一起的基本骨架轮廓。