1

我在 UIWebView 中加载了以下 html 源代码
我想提取
text1
text2 text2
text3 text3 text3

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
    <title>1322170516271</title>
    <meta name="viewport" content="initial-scale=1.0, user-scalable=1, minimum-scale=1.0, maximum-scale=4.0">                   

    <style type="text/css">
    body
    {
        padding: 5px;
        margin: 0px;
        font-family: Helvetica, Arial;
        font-size: 12pt;
        background-color: #efefef;
        background-image: url(ArticleBackground.jpg);
        background-position: cover;
        color: #000000;
    }
    h1
    {
        text-align: center;
        border-bottom: 1px dotted #805050;
        font-size: 28px;
        line-height: 38px;
        margin-bottom: 30px;
        text-shadow: 0 2px 1px white;
        color: #803030;
    }
    </style>

</head>

<body>

    <script type="text/javascript">
    function printMe()
    {
        print();
    }
    </script>

    <div style='align:center; padding: 20px;'>

        <div>

    <b>text1</b><br><br>

    <h2>
      text2 text2
    </h2>
    <br>
    text3 text3 text3

        </div>

    </div>

</body>
</html>

但这是我使用时得到的

[webView stringByEvaluatingJavaScriptFromString:@"document.documentElement.textContent"]

我不需要身体和h1。我只想要用户面对的实际文本。

234534546



    body
{
    padding: 5px;
    margin: 0px;
    font-family: Helvetica, Arial;
    font-size: 12pt;
    background-color: #efefef;
    background-image: url(ArticleBackground.jpg);
    background-position: cover;
    color: #000000;
}
h1
{
    text-align: center;
    border-bottom: 1px dotted #805050;
    font-size: 28px;
    line-height: 38px;
    margin-bottom: 30px;
    text-shadow: 0 2px 1px white;
    color: #803030;
}







    function printMe()
    {
        print();
    }






text1


  text2 text2


text3 text3 text3

感谢您的任何见解。

更新

[webView stringByEvaluatingJavaScriptFromString:@"document.body.innerHTML"] 对我的目标也不起作用

<script type="text/javascript">
    function printMe()
    {
        print();
    }
    </script>

    <div style="align:center; padding: 20px;">

        <div>

    <b>text1</b><br><br>

    <h2>
       text2 text2
    </h2>
    <br>
    text3 text3 text3

        </div>

    </div>

更新:这是现有项目所需要的。如果我有机会重新设计它,将很容易找到解决方案。但是考虑到这个 HTML 源代码,它可能会有点困难。

4

2 回答 2

1

为什么不将所有文本放入不同的标签中,例如 div、p 等。给他们每个人的id,然后通过语法获取其中的文本

var text1 = document.getElementById("your ID").innerHTML

希望这适用于您的问题。

于 2012-06-13T07:21:58.023 回答
1

尝试使用:

document.body.innerHTML

或者看一下解析HTML:在iPhone上解析HTML SO上有很多其他的链接。

于 2012-06-13T06:35:56.983 回答