0

我在meta上询问了这个Q格式,他们说措辞正确,这应该是合适的。话虽这么说,很抱歉,如果我仍然扼杀了措辞,以防万一我想表达这个意思(如建议的那样):我不是在寻找对某些事情或它们如何工作的意见,而只是寻找可能的方式. 我并不是要听起来无知,如果我这样做了,我真的很抱歉,只是有人建议我在 Meta 上说。

现在是Q;究竟是什么通用语言能够从公共在线网站收集信息,然后将其放入程序中,在那里它可以作为任何旧变量进行进一步处理?我是编码新手,想把它作为一个小的“介绍性”程序来教自己一些新东西。问题是,按照我的想法,我什至不知道从哪里开始。再说一次,我不是在要求具体的方法来做到这一点,我只是好奇什么语言能够做到这一点?如果可能的话,我更喜欢用 Visual Studio 的语言来做(不喜欢哪种语言)。

简而言之:Visual C#/C++ 是否能够在线收集信息以在程序中进一步处理?如果不是,那是什么语言?

4

1 回答 1

0

我同意这是一项复杂的第一个编程任务的评论。然而,你无疑会学到一些尝试它的东西。

如果你已经有一些 Python 编程经验,我建议你看看http://scrapy.org/doc/这是一个框架(即一堆类和其他有用的工具),它可以让你编写从网页中提取信息的程序。Scrapy 通过处理解析网页时涉及的一些令人讨厌的细节,确实让您专注于编程。

另一种选择是使用 javascript 框架,可能是 node.js 之类的。

我已经完成了相当多的网络抓取工作,并且我通常最终会使用清理网页的实用程序和各种 XSLT 处理器的组合。我个人认为技术组合更容易处理;在我基本上将数据整理好之前,我不会尝试使用 C 系列语言。但是每个人都有自己的风格。

祝你好运!

于 2013-10-08T05:19:25.187 回答