2

我正在使用以下代码解析以下 html:

 var exroom = (from roomItem in
           doc.DocumentNode.SelectNodes("//div[@class='dias']//h2")

       from s  in roomItem.NextSibling.NextSibling.SelectNodes(".//label")

       let rName = roomItem.InnerText.CleanInnerText()

       select new
       {
           roomID = rName,
           Pers = 2,
           Currency = "EUR",
           rateName = s.InnerText.CleanInnerText(),
           roomName = rName,
           Price = PriceHelper.Convert(PriceRegEx.Match(s.Attributes["precio"].Value.CleanInnerText()).Groups["price"].Value)
       }
).ToArray();

但是当我解析没有上述标签的 html 内容时,它会引发异常,如何防止在解析时引发异常并为 exroom 数组返回 0 ?比如我在类 dias 中没有任何元素。

4

2 回答 2

1

分三步处理。

  • 选择“dias”类的元素
  • 检查所选变量,仅当它不同于 null 时才继续处理
  • 其余的处理

因为您在 exroom 变量中有匿名类型对象的数组,所以创建空数组可能会很棘手。

我建议将该类型包装在某个类中:

public class RoomItem {
    public string roomID { get; set; }
    public string Pers { get; set; }
    ...
}

然后选择 exroom 变量如下所示:

var diasElements = doc.DocumentNode.SelectNodes("//div[@class='dias']//h2");
var exroom = new RoomItem[] { };
if(null != diasElements) { 
    exroom = (from roomItem in diasElements
    from s in roomItem.NextSibling.NextSibling.SelectNodes(".//label")
    let rName = roomItem.InnerText.CleanInnerText()
    select new RoomItem
    {
         roomID = rName,
         Pers = 2,
         Currency = "EUR",
         rateName = s.InnerText.CleanInnerText(),
         roomName = rName,
         Price =
              PriceHelper.Convert(
                  PriceRegEx.Match(s.Attributes["precio"].Value.CleanInnerText()).Groups["price"].Value)
              }
    ).ToArray()
}

从您的示例代码看来,具有类“dias”的元素的空列表应该会导致某种形式的错误消息(可能是抛出/捕获异常,或调整 BookingEngineResponse 以传递有关空 dias 集合的信息)。

编辑:完整代码示例后澄清答案。

于 2014-04-07T09:44:24.697 回答
1

据我所知,如果.SelectNodes()您的 LINQ 中的两个中的任何一个都没有产生结果,您将不会得到异常。我认为您的查询的其他两个部分可能会引发异常:

  1. NextSibling如果当前roomItem没有下一个兄弟姐妹或下一个下一个兄弟姐妹,则与 部分。您可以将此部分更改为纯 XPath,而不是访问NextSibling属性。使用纯 XPath 更节省,如果没有元素匹配整个查询,它不会返回任何结果。

  2. 部分Attributes["precio"],如果当前s没有属性“precio”。您可以使用 替换此部分GetAttributeValue("attrName", "defaultValue"),如果属性不存在,此方法返回默认值。

演示上述建议的代码:

from roomItem in doc.DocumentNode.SelectNodes("//div[@class='dias']//h2")
from s  in roomItem.SelectNodes("./following-sibling::*[2]//label")
let rName = roomItem.InnerText.CleanInnerText()
select new
{
   roomID = rName,
   Pers = 2,
   Currency = "EUR",
   rateName = s.InnerText.CleanInnerText(),
   roomName = rName,
   Price = PriceHelper.Convert(PriceRegEx.Match(s.GetAttributeValue("precio","").CleanInnerText()).Groups["price"].Value)
}
于 2014-04-07T13:58:15.767 回答