问题标签 [syndication]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
427 浏览

c# - 如何以新形式打开RSS提要的文章?

您知道要在代码中添加什么内容以从 RSS 提要中打开所需的文章吗?以新的形式。

在一个新的表单中,我应该得到文章的标题和内容,图片是可选的

这是我的代码,其中文章列表是:


我编写了一个代码,可以完成大部分工作:

内容无法识别,并且我一直得到 NullReference,当我在 TextBlock 上链接摘要时,文章的日期显示得很好。此外,每次当我返回列出所有文章的列表时,我都会收到错误消息“您只能在 OnNavigatedTo 和“OnNavigatedFrom”之间使用状态。当我按下主页按钮时,调试器出现(应用程序崩溃)。

这就是我得到的: Microsoft.Phone.dll 中出现“System.InvalidOperationException”类型的第一次机会异常 System.Runtime.Serialization.dll 中发生“System.Security.SecurityException”类型的第一次机会异常 第一次机会异常在 mscorlib.dll 中发生了“System.Reflection.TargetInvocationException”类型的第一次机会异常 System.Runtime.Serialization.dll 中发生了“System.Security.SecurityException”类型的线程“”(0xfc2037a)已退出,代码为 0(0x0 )。线程 '' (0xe880366) 以代码 0 (0x0) 退出。线程 '' (0xe310372) 已退出,代码为 0 (0x0)。线程 '' (0xf970392) 以代码 0 (0x0) 退出。线程 '' (0xe470392) 已退出,代码为 0 (0x0)。

这是我正在处理的提要:http : //www.zimo.co/feed/ 我的主要问题是如何通过 nullref。异常并获取内容。

0 投票
1 回答
416 浏览

sql-server - 如何有效地检查结果集是否更改并将其提供给 Web 应用程序以进行联合

这是场景:

我正在处理带有存储过程的 SQL Server 数据库,该存储过程负责返回 Web 提要项目 (RSS/Atom) 的标头,我通过 Web 应用程序作为提要。

此存储过程应在由以给定间隔运行的服务代理任务调用时验证基础数据是否发生重大变化 - 在这种情况下,它将触发资源密集型活动,通过调用将获取/检索数据、格式化数据并返回 SQL 数据库的 Web 应用程序。

那里将存储标头以准备好从客户端请求 RSS 提要更新。

现在,试图将其设计为尽可能高效,我仍然有几个转折点希望得到您的建议。

我对存储过程的暂定方法是:

  1. 在内存表中收集数据,
  2. 创建一个带有随信息变化的签名列的子查询,
  3. 使用 FOR XML AUTO 将它们转换为 XML
  4. 使用 MD5 对结果进行散列(使用 HASHBYTES 或 fn_repl_hash_binary,具体取决于结果的大小)
  5. 验证哈希是否与存储在我正在存储等待提要请求的 HTML 的表中的哈希匹配。
  6. 如果哈希匹配不执行任何操作,否则继续进行更新。

第一个疑问是检查基础数据是否已更改的最佳方法

转换为 XML 会显着增加数据 - 这会减慢散列速度 - 并且可能除了散列之外我没有使用结果:有没有更好的方法来执行检查或将所有数据打包在一起以进行散列(类似于 csv 的东西)?

该查询正在合并和聚合来自多个表的数据,因此不会依赖表时间戳,因为它们的更改不一定与结果集中的更改有关

第二点是:将数据提供给 webapp 进行重新格式化的最佳方式是什么? - 我可能会通过 CLR 函数将数据推送到 Web 应用程序以格式化数据(但这是同步的,并且对于多个提要项会产生不可持续的延迟)

或者

我可能会改为保存结果集并通过服务代理触发多个异步调用。Web 应用程序可能会检索以某种方式存储的数据,而不是再次运行获取它们的昂贵查询。

由于根据提要项目类别我有不同的格式,我不能使用相同的表格格式 - 所以存储到表格中会很困难。

我可能会序列化为 XML。

但是,与重新运行查询相比,这会提供任何显着的收益吗?

0 投票
1 回答
724 浏览

asp.net-mvc-3 - 如何清除嵌入在 Web 提要项中的客户端缓存图像正在更新

我正在发布包含以图片形式嵌入在提要项中的图表的 Web 提要,并使用 MVC 操作返回到客户端轮询网络提要,/RSS_Img/filename.

一些图表与提要项目一起更新,我想让客户端在服务器端修改图像后重新加载图像(我可以控制图表何时更新,因为这是由另一个控制器的操作执行的)。

同时,我不想避免在客户端进行缓存,因为这会以显着增加的带宽打击我。

我最好的选择是什么?我考虑了以下几点:

  • 显然更改图像名称 - 但这是不可接受的,因为它会破坏可能作为邮件转发的提要项目 - 或者在我保留旧版本的情况下大大增加存储大小
  • 映射可能会更新的联合项目是什么,并在检索图像的操作中,Response.Cache.SetCacheability(HttpCacheability.Server);仅为这些项目设置[实际上我认为我应该将可缓存性设置为无,因为我猜缓存RSS_Img操作的结果几乎没有优势:它基本上只是加载并返回文件本身。]
    这将要求我从 SQL 服务器检索要刷新(或冻结)的图像的 ID(我正在处理大量图表图像),这将给 WebApp 增加相当大的负担。
    此外,我不能总是确定哪些项目可能会被更新,所以这种方法不能满足 100% 的要求。

我正在寻找的解决方案是在更改图像文件时找到一种使缓存无效的简单方法-我可以轻松使用类似的东西HttpResponse.RemoveOutputCacheItem("/RSS_Img/" + fileName.Value):但这似乎只影响服务器缓存。

我没有其他选择,还有其他实用的方法吗?

0 投票
1 回答
646 浏览

c# - 如何在 C# 中从 html 中提取信息?

谁能教我从 C# 中的 html 中提取信息?我正在使用 C# 中的 WinRT 类库。

我想从http://lifehacker.com/5923026/remains-of-the-day-google-image-search-gets-knowledge-graph-integration中提取主要内容和图像。

这是部分网站代码,

我可以使用 SyndicationFeed.Title.Text (使用 Windows.Web.Syndication;)来提取当天的遗骸:Google Image Search Gets Knowledge Graph Integration

请帮我提取

我还需要提取里面的主要内容

内容:“通过图像结果查找更智能、更全面的搜索”“Google 更新了它的图像搜索,增加了一些新功能。一个是扩展视图,让搜索者可以看到匹配图像周围的文本,另一个是添加对知识图谱的支持图片搜索结果,这意味着 Google 将尝试识别您上传或链接到的任何照片,并提供有关该主题的更多信息。[Google 博客]”

非常感谢!!

[7/4/12]
抱歉,我正在尝试通过直接从 html 解析或通过先将其转换为 xml 来解析从 html 中提取文本(作为字符串)和图像(链接或 BitmapImage)。

我使用来自 htmlagilitypack.codeplex.com 的 HtmlAgilityPack 和来自 4guysfromrolla.com/articles/011211-1.aspx 的教程。虽然我仍然想知道 Metro 风格的应用程序是否有更好的解决方案,因为 HtmlAgilityPack 缺乏对它的一些支持。例如,它具有将 html 转换为 xml 的方法,但 WinRT 不再支持来自 .NET 的 XmlTextReader。

再次感谢

0 投票
1 回答
85 浏览

google-app-engine - GAE MapReduce 大查询

摘要:在处理来自数据库的数据集合时,MapReduce 是一个好主意,而不是为一个有点复杂(或只是大)问题找到一些答案?

我想同步一组联合源(例如http://xkcd.com/rss.xml之类的 url ),它们作为集合/表存储在 GAE 的数据存储中。我看到两种选择,一种是直截了当的。制作您放入队列中的简单任务,其中每个任务句柄的 100 或 1000 或任何自然数似乎适合每个任务。另一个选项是 MapReduce。

在后一种情况下,Map 做所有事情,而 Reduce 什么都不做。此外,地图没有结果,它只是改变了(数据存储的)“状态”。

如您所见,一个来源可以映射到许多帖子,所以我的地图还不如称为“爆炸”。

所以没有排放,也没有什么可以减少的。我喜欢这种地图方法的原因是我告诉谷歌:在这里,拿我的收藏/表格,按照你认为适合不同的映射器的方式将其拆分,然后将帖子存储在你喜欢的任何地方。数据存储使用“高复制”。因此,数据的可用性很高,并且是“计算单元”做什么实体并没有真正减少网络通信的最佳选择。保存帖子也是如此,因为它们需要转到所有数据存储单元。我喜欢的是,mapreduce 对卡住的地图计算有某种故障恢复方式,并且它知道有多少任务要发送到哪个节点,而不是在某处排队一些实体,希望它有意义。

可能我这里的思路不对,请指正。无论如何,由于缺少 reduce 和 map 是“爆炸”,这种方法是否“错误”?

0 投票
2 回答
1128 浏览

c# - SyndicationFeed RSS 阅读器 pubDate:解析日期时间值时遇到错误

我正在开发简单的 C# 应用程序,它将呈现 rss 提要。我在阅读某些网页的 rss 提要时遇到问题。解析 pubDate 时出现问题:第 1 行位置 829 出错。解析 XML 中的 DateTime 值时遇到错误。

0 投票
1 回答
293 浏览

.net - 使用 SyndicationItem 根据帖子 ID 检索 Blogger 帖子的链接

我正在尝试使用 Windows.Web.Syndication 和 Blogger ATOM 提要检索帖子的链接。我从另一个提要阅读器(虽然没有使用 Blogger)看到的示例使用 SyndicationItem id 来查找博客文章链接。

但是,使用这种方法,我得到了这种格式的 Id:

/tag:blogger.com,1999:blog-5388280093621795916.post-2321273013867491101

如何使用此访问原始 BlogPost URL?

0 投票
1 回答
1048 浏览

rss - 请求 RSS 文档中的非默认项目数

是否有一种标准方法来请求将其他/超过默认数量(例如,通常 10 个)项目包含在从 Web 提要/服务器返回的RSS文档中。例如,一些/大多数网络提要是否理解 URL 参数以达到这种效果,语法是什么?

我正在考虑一个具有以下类型 URL 的通用方案:

http://some.web.feed?count=20

0 投票
2 回答
265 浏览

xml - 联合分类网站内容的最佳方式是什么:XML、Javascript 等?

我正在一个中央分类网站上工作,经销商将在其中输入他们的广告。该服务器将运行 PHP/MySQL。我希望经销商也能够检索他们的广告以显示在他们自己的网站上。在经销商网站上,我们应该能够做我们通常在分类网站上所做的事情,例如按类别浏览广告和搜索广告。我正在寻找实现这一目标的最佳方法。经销商的最大广告数量约为 200 个。

  1. 我想避免 iframe。

  2. 我正在考虑 XML,但这意味着我必须为每种语言创建一个脚本来解析它。如果我升级我的脚本,经销商也必须更新他们的网站才能获得最新版本。

  3. JavaScript 使用 src 调用中央网站上的文件似乎是另一种选择,但我不确定它是否能够完成我想做的所有事情,比如搜索广告。它是否可以在任何平台上运行(如果客户端在其浏览器中禁用了 JavaScript,则不确定它是否会起作用)

我想听听你的想法,所以我在这个项目中走的是正确的道路。或者如果你有这方面的文章,请告诉我。

0 投票
1 回答
134 浏览

c# - 如何使用 C# 中的 SyndicationFeed 类识别非发布订阅源

我有很多 RSS 和 atom feed url。我正在使用 SyndicationFeed 类来阅读这些提要的内容。查看页面源后我们可以识别,因为每个具有 pubsubhub 功能的提要总是具有 rel="hub" 属性。例如。假设我有两个提要 [非 pubsubhub 提要] http://timesofindia.feedsportal.com/c/33039/f/533929/index.rss 和 [pubsubhub 提要] http://allthingsd.com/feed/

现在我的问题是使用 SyndicationFeed 类识别 pubsubhub 提要。请帮我。