鉴于此管道,我试图从 -div class="post-text"- 中删除所有 HTML 标记并返回纯文本。
换句话说,对于这个 stackoverflow question,第一项应该返回:
“背景:在接下来的一个月里,我将进行三场演讲......
{...}
复杂的通用签名(例如 Enumerable.Join)”
有人可以帮忙吗?
从表面上看,在 YQL 选择子句中获取无 HTML 文本内容会很方便,但如果这是唯一的方法,我会选择后续的 Regex 模块。
鉴于此管道,我试图从 -div class="post-text"- 中删除所有 HTML 标记并返回纯文本。
换句话说,对于这个 stackoverflow question,第一项应该返回:
“背景:在接下来的一个月里,我将进行三场演讲......
{...}
复杂的通用签名(例如 Enumerable.Join)”
有人可以帮忙吗?
从表面上看,在 YQL 选择子句中获取无 HTML 文本内容会很方便,但如果这是唯一的方法,我会选择后续的 Regex 模块。