3

我想编写一个脚本来存储和分析我的互联网使用情况,但除了访问过的页面的简单列表之外,我想为每个页面包含一个“来自”和“去往”,这样我就可以将数据显示为加权有向图。但我不知道该用什么。

自从我第一次尝试从浏览器外部使用互联网以来,我不知道要查找哪些关键字。我遇到的大多数事情都非常复杂,只对网络管理员有用,但我不关心所有低级数据,我只需要 URL。此外,仅监视传输的数据不会告诉我为了传输数据我做了什么(我猜)。

这个问题听起来像是 Firefox 插件的工作,但显然他们不允许将数据写入磁盘,我宁愿避免只为一个项目接触 JavaScript。

理想情况下,它应该处理可点击的链接以及书签和手动地址条目,以及多个选项卡或窗口。让我举个例子:

  • 打开 Firefox,起始页是 google.com
  • 在另一个选项卡中打开 Stackexchange
  • 去stackoverflow,搜索和浏览问题
  • 切换到谷歌标签,搜索lolcats,点击第一个结果(icanhas.cheezburger.com)并阅读几页
  • 去脸书
  • 去谷歌,关闭火狐

这应该会产生以下结果:

  • add_node('google')
  • add_node('stackexchange')
  • add_node('stackoverflow'); add_edge('stackexchange', 'stackoverlow')
  • add_node('cheezburger'); add_edge('google', 'cheezburger')
  • add_node('facebook'); add_edge('芝士汉堡', 'facebook')
  • add_edge(“脸书”,“谷歌”)

或至少按加载顺序列出页面,然后我可以为每个唯一条目添加一个节点并遍历对以添加边缘,但如果我使用多个选项卡,此结果将是错误的

摘要:
使用 Python 或 Java 我想监控我的互联网流量(至少)或网络浏览器(最好?),这样每当点击链接时,手动输入地址或加载书签,目标位置以及来源(当前活动选项卡的 URL)被返回。如果这是可能的,请向正确的方向轻推我。

4

0 回答 0