我希望在我正在为 Twitter 时间线开发的网站上实现时间线功能。我拥有的一个选项是可抓取的,并且可以直接在 Twitter 设置下的“小部件:
<a class="twitter-timeline" href="https://twitter.com/hyttetomter" data-widget-id="289297710840954880">Tweets by @hyttetomter</a>
<script>!function(d,s,id){var js,fjs=d.getElementsByTagName(s)[0];if(!d.getElementById(id)){js=d.createElement(s);js.id=id;js.src="//platform.twitter.com/widgets.js";fjs.parentNode.insertBefore(js,fjs);}}(document,"script","twitter-wjs");</script>
该代码首先不是 XHTML 的有效脚本,因此我寻找了一个插件或脚本,并找到了这个插件,并找到了一个名为 Tweet for jQuery 的插件,因为它可以为 CSS 定制,但是这个爬虫友好吗?将可抓取的脚本与不可抓取的脚本分开的技术是什么?我应该打开 JavaScript 自己看看吗?jQuery 内容是否可以抓取?我必须采取哪些措施(假设有)才能使我自己的任何 jQuery 生成的内容可抓取?我在网上找到了关于这个的混合参考,所以如果你觉得它可以帮助我,请引导我到一个值得信赖的资源。