9

我使用以下函数来检索 Web 服务响应:

private String getSoapResponse (String url, String host, String encoding, String soapAction, String soapRequest) throws MalformedURLException, IOException, Exception {         
    URL wsUrl = new URL(url);     
    URLConnection connection = wsUrl.openConnection();     
    HttpURLConnection httpConn = (HttpURLConnection)connection;     
    ByteArrayOutputStream bout = new ByteArrayOutputStream(); 

    byte[] buffer = new byte[soapRequest.length()];     
    buffer = soapRequest.getBytes();     
    bout.write(buffer);     
    byte[] b = bout.toByteArray();          

    httpConn.setRequestMethod("POST");
    httpConn.setRequestProperty("Host", host);

    if (encoding == null || encoding == "")
        encoding = UTF8;

    httpConn.setRequestProperty("Content-Type", "text/xml; charset=" + encoding);
    httpConn.setRequestProperty("Content-Length", String.valueOf(b.length));
    httpConn.setRequestProperty("SOAPAction", soapAction);

    httpConn.setDoOutput(true);
    httpConn.setDoInput(true);

    OutputStream out = httpConn.getOutputStream();
    out.write(b); 
    out.close();

    InputStreamReader is = new InputStreamReader(httpConn.getInputStream());
    StringBuilder sb = new StringBuilder();
    BufferedReader br = new BufferedReader(is);
    String read = br.readLine();

    while(read != null) {
        sb.append(read);
        read = br.readLine();
    }

    String response = decodeHtmlEntityCharacters(sb.toString());    

    return response = decodeHtmlEntityCharacters(response);
}

但是我对这段代码的问题是它返回了很多特殊字符并使 XML 的结构无效。
示例响应:

<PLANT>A565</PLANT>
          <PLANT>A567</PLANT>
          <PLANT>A585</PLANT>
          <PLANT>A921</PLANT>
          <PLANT>A938</PLANT>
        </PLANT_GROUP>
      </KPI_PLANT_GROUP_KEYWORD>
      <MSU_CUSTOMERS/>
    </DU>
    <DU> 

所以为了解决这个问题,我使用下面的方法并传递整个响应以用相应的标点符号替换所有特殊字符。

private final static Hashtable htmlEntitiesTable = new Hashtable();
static {
    htmlEntitiesTable.put("&","&");
    htmlEntitiesTable.put(""","\"");
    htmlEntitiesTable.put("&lt;","<");
    htmlEntitiesTable.put("&gt;",">");  
}

private String decodeHtmlEntityCharacters(String inputString) throws Exception {
    Enumeration en = htmlEntitiesTable.keys();

    while(en.hasMoreElements()){
        String key = (String)en.nextElement();
        String val = (String)htmlEntitiesTable.get(key);

        inputString = inputString.replaceAll(key, val);
    }

    return inputString;
}

但又出现了一个问题。如果响应包含此段&lt;VALUE&gt;&lt; 0.5 &lt;/VALUE&lt;并且将由该方法评估,则输出将是:

<VALUE>< 0.5</VALUE>

这使得 XML 的结构再次无效。数据正确且有效“< 0.5”,但将其包含在 VALUE 元素中会导致 XML 结构出现问题。

你能帮忙解决这个问题吗?也许我获得或建立响应的方式可以改进。有没有更好的方法来调用并从 Web 服务获取响应?

如何处理包含“<”或“>”的元素?

4

6 回答 6

3

你知道如何使用第三方开源库吗?

您应该尝试使用 apache commons-lang:

StringEscapeUtils.unescapeXml(xml)

以下堆栈溢出帖子提供了更多详细信息:

如何在java中取消转义XML

文档:

http://commons.apache.org/proper/commons-lang/javadocs/api-release/index.html http://commons.apache.org/proper/commons-lang/userguide.html#lang3

于 2013-10-28T19:53:57.573 回答
3

您使用 SOAP 错误。

特别是,您不需要以下代码行:

     String response = decodeHtmlEntityCharacters(sb.toString());    

刚回来sb.toString()。并且为了 $DEITY 的缘故,不要使用字符串方法来解析检索到的字符串,使用 XML 解析器或成熟的 SOAP 堆栈......

于 2013-10-29T17:46:42.620 回答
1

> 或 < 字符是否总是出现在值的开头?然后你可以使用正则表达式来处理 > 的情况。或 < 后跟一个数字(或点,就此而言)。

示例代码,假设其中使用的替换字符串不出现在 XML 的其他任何地方:

private String decodeHtmlEntityCharacters(String inputString) throws Exception {
    Enumeration en = htmlEntitiesTable.keys();

    // Replaces &gt; or &lt; followed by dot or digit (while keeping the dot/digit)
    inputString = inputString.replaceAll("&gt;(\\.?\\d)", "Valuegreaterthan$1");
    inputString = inputString.replaceAll("&lt;(\\.?\\d)", "Valuelesserthan$1");

    while(en.hasMoreElements()){
        String key = (String)en.nextElement();
        String val = (String)htmlEntitiesTable.get(key);

        inputString = inputString.replaceAll(key, val);
    }

    inputString = inputString.replaceAll("Valuelesserthan", "&lt;");
    inputString = inputString.replaceAll("Valuegreaterthan", "&gt;");

    return inputString;
}

请注意,最合适的答案(对每个人来说都更容易)是在发送方正确编码 XML(这也会使我的解决方案无法正常工作)。

于 2013-10-28T18:52:51.293 回答
0

'>' 不会在 XML 中转义。所以你不应该有这个问题。关于'<',这是我能想到的选项。

  1. 在 Web 响应中对包含特殊字符的文本使用 CDATA。
  2. 通过颠倒顺序重写文本。例如。如果是 x < 2,则将其更改为 2 > x。'>' 不会被转义,除非它是 CDATA 的一部分。
  3. 在 XML 响应中使用另一个属性或元素来指示“<”或“>”。
  4. 使用正则表达式查找以“<”开头,后跟一个字符串,然后是结束标签的“<”的序列。并将其替换为您可以稍后解释和替换的一些代码或一些值。

此外,您不需要这样做:

String response = decodeHtmlEntityCharacters(sb.toString()); 

处理完文本中的“<”符号后,您应该能够解析 XML。

您可以使用站点来测试正则表达式。

于 2013-10-29T19:16:31.837 回答
0

为什么不序列化您的 xml?,它比您正在做的要容易得多。

例如:

var ser = new XmlSerializer(typeof(MyXMLObject));
using (var reader = XmlReader.Create("http.....xml"))
{
     MyXMLObject _myobj = (response)ser.Deserialize(reader);
}
于 2013-10-30T01:18:01.993 回答
0

很难应对所有情况,但您可以通过添加更多规则来涵盖最常见的情况,假设任何小于后面的空格都是数据,大于前面的空格是数据,需要再次编码。

private final static Hashtable htmlEntitiesTable = new Hashtable();
static {
    htmlEntitiesTable.put("&amp;","&");
    htmlEntitiesTable.put("&quot;","\"");
    htmlEntitiesTable.put("&lt;","<");
    htmlEntitiesTable.put("&gt;",">");  
}

private String decodeHtmlEntityCharacters(String inputString) throws Exception {
    Enumeration en = htmlEntitiesTable.keys();

    while(en.hasMoreElements()){
        String key = (String)en.nextElement();
        String val = (String)htmlEntitiesTable.get(key);

        inputString = inputString.replaceAll(key, val);
    }

    inputString = inputString.replaceAll("< ","&lt; ");       
    inputString = inputString.replaceAll(" >"," &gt;");       

    return inputString;
}
于 2013-10-24T22:00:46.657 回答