我正在使用 Argotic Syndication Framework 来处理提要。
但问题是,如果我将 URL 传递给 Argotic,它不是有效的提要(例如,http://stackoverflow.com
这是一个 html 页面,而不是提要),程序就会挂起(我的意思是,Argotic 停留在无限循环中)
那么,如何检查一个 URL 是否指向一个有效的提要呢?
在 .NET 3.5 中,您可以在下面执行此操作。如果它不是有效的提要,它将引发异常。
using System.Diagnostics;
using System.ServiceModel.Syndication;
using System.Xml;
public bool TryParseFeed(string url)
{
try
{
SyndicationFeed feed = SyndicationFeed.Load(XmlReader.Create(url));
foreach (SyndicationItem item in feed.Items)
{
Debug.Print(item.Title.Text);
}
return true;
}
catch (Exception)
{
return false;
}
}
或者您可以尝试自己解析文档:
string xml = "<?xml version=\"1.0\" encoding=\"utf-8\" ?>\n<event>This is a Test</event>";
XmlDocument xmlDoc = new XmlDocument();
xmlDoc.LoadXml(xml);
然后尝试检查根元素。它应该是 feed 元素并具有“ http://www.w3.org/2005/Atom ”命名空间:
<feed xmlns="http://www.w3.org/2005/Atom" xmlns:creativeCommons="http://backend.userland.com/creativeCommonsRssModule" xmlns:re="http://purl.org/atompub/rank/1.0">
参考资料:http: //msdn.microsoft.com/en-us/library/system.servicemodel.syndication.syndicationfeed.aspx http://dotnet.dzone.com/articles/systemservicemodelsyndication
您可以使用Feed Validation Service。它有SOAP API。
您可以检查内容类型。它必须是text/xml
。请参阅此问题以查找内容类型。
您可以使用以下代码:
var request = HttpWebRequest.Create("http://www.google.com") as HttpWebRequest;
if (request != null)
{
var response = request.GetResponse() as HttpWebResponse;
string contentType = "";
if (response != null)
contentType = response.ContentType;
}
感谢问题的回答
更新
要检查它是否是提要地址,您可以使用W3C 提要验证服务。
更新2
正如 BurundukXP 所说,它有一个 SOAP API。要使用它,您可以阅读此问题的答案。
如果您只想将其转换为有效的 RSS/ATOM,您可以使用http://feedcleaner.nick.pro/对其进行清理。或者,您可以分叉项目。