1

首先,我想说的是,我对 HTML 和所有编程知识的了解很少,但我的工作涉及找出源代码的某些方面,例如链接 URL,以改进我的工作流程。

几天以来,我一直面临一个问题,尽管其中一个网站试图从中检索某个链接,但我认为该链接是用与 HTML 不同的语言编写的。它的链接以 .aspx 结尾,即使我浏览它的页面也不会改变。

我试图检查页面的源代码,我需要从中找到这个特定的 URL,但它是用 javascript 编写的,我不知道要阅读它。我尝试用谷歌搜索找到解决方案,但没有找到任何有用的东西,或者我只是无法理解,因为就像我说的那样,我几乎没有任何编程知识。

无论如何,我已经知道链接在页面上的位置,但我希望有人告诉我如何去找出它背后的 URL。在源代码中看起来像这样:

</div> -->
    <input type="submit" name="ctl00$ContentPlaceHolder1$ValidateButton" value="View Image" onclick="javascript:WebForm_DoPostBackWithOptions(new WebForm_PostBackOptions(&quot;ctl00$ContentPlaceHolder1$ValidateButton&quot;, &quot;&quot;, true, &quot;&quot;, &quot;&quot;, false, false))" id="ctl00_ContentPlaceHolder1_ValidateButton" /><br />
</div>

从我在页面上的兴趣点开始的整个事情看起来像这样,但没有涉及验证码输入。您只需单击按钮即可下载文件:

<a id="ctl00_ContentPlaceHolder1_ImageLink"><h4>[Image]</h4></a> </DIV>
                        <DIV align="center"><span id="ctl00_ContentPlaceHolder1_ImageInfo">- File Size: 582KB | Pages: 1 -</span> </DIV><BR />
                        <DIV align="left"><span id="ctl00_ContentPlaceHolder1_ErrorMessage"></span> </DIV>
                        <DIV align="left"><span id="ctl00_ContentPlaceHolder1_documentError"></span> </DIV>

                                <div align=center>
                                    <!-- <div id="CaptchaDiv">
                                    <script type="text/javascript">
        var RecaptchaOptions = {
            theme : 'clean',
            tabindex : 0
        };

</script><script type="text/javascript" src="http://www.google.com/recaptcha/api/challenge?k=6LfZzsMSAAAAAD2h79x90-FvI0AtkBatVFqydtgE">

</script><noscript>
        <iframe src="http://www.google.com/recaptcha/api/noscript?k=6LfZzsMSAAAAAD2h79x90-FvI0AtkBatVFqydtgE" width="500" height="300" frameborder="0">

        </iframe><br /><textarea name="recaptcha_challenge_field" rows="3" cols="40"></textarea><input name="recaptcha_response_field" value="manual_challenge" type="hidden" />
</noscript>
                                    </div> -->
                                    <input type="submit" name="ctl00$ContentPlaceHolder1$ValidateButton" value="View Image" onclick="javascript:WebForm_DoPostBackWithOptions(new WebForm_PostBackOptions(&quot;ctl00$ContentPlaceHolder1$ValidateButton&quot;, &quot;&quot;, true, &quot;&quot;, &quot;&quot;, false, false))" id="ctl00_ContentPlaceHolder1_ValidateButton" /><br />
                                </div>
4

1 回答 1

1

也许这些代码会对你有所帮助:

var urlexp = new RegExp('(http|ftp|https)://[a-z0-9\-_]+(\.[a-z0-9\-_]+)+([a-z0-9\-\.,@\?^=%&;:/~\+#]*[a-z0-9\-@\?^=%&;/~\+#])?', 'i');
var result = urlexp.exec(document.body.innerHTML);

is 数组,result包括匹配的 url。

于 2013-10-24T09:08:06.983 回答