5

标题没有什么可补充的。这就是我想要做的。有什么建议么?

我查看了 github 上的文档并在 Google 上进行了广泛搜索。

我得到的最好的是:

value.parseHtml().select('p[contains('xyz')]')

它会导致语法错误。

4

2 回答 2

3

“选择”语法基于 Beautiful Soup ( http://jsoup.org/cookbook/extracting-data/selector-syntax )中的选择语法

在这种情况下,我相信您需要的语法是:

value.parseHtml().select("p:contains(xyz)")

欧文

于 2015-06-13T09:44:11.537 回答
2

也许你错过了我在 wiki 上的文章(和警告):) 在这里?

https://github.com/OpenRefine/OpenRefine/wiki/StrippingHTML#extract-html-attributes-text-links-with-integrated-grel-jsoup-commands

警告:在使用内置 HTML GREL 命令(默认输出为 org.jsoup.nodes 对象)时,确保在需要将字符串输出到 Refine 单元格时使用 .toString() 后缀。否则,您将在表达式编辑器中获得很好的预览,但在应用它时,优化单元格中不会显示任何数据!

顺便说一句,我们怎样才能使文档更好,在哪里,以便将来有人不会错过这个?

我什至在我们的文档中给人们一个很好的例子,显示使用 .toString() : https ://github.com/OpenRefine/OpenRefine/wiki/GREL-Other-Functions#selectelement-e-string-s

于 2015-06-15T01:58:53.793 回答