1

这是代码:

<div>23 Anywhere Ave<br />Someplace<br />Somewhere 1234</div>

我想刮掉产生的三行

23 Anywhere Ave<br />Someplace<br />Somewhere 1234</div>

分成不同的列。<div>我可以通过设置为前标记和后标记来刮掉第一个字符串(23 Anywhere Ave)<br />。之后就卡住了。我尝试将前面的标记设置为<div>(?=)<br />), /<div>(?=)<br />)/(Outwit 显然需要 / / 在进行正则表达式语句时),并<div>/(?=)/<br />)获得第二个值但没有运气。

我意识到正则表达式不适合解析 HTML,但这篇文章表明它在 Outwit 架构中的某些上下文中是可以的。

4

1 回答 1

0

在 automators/scrapers 中放置这个分隔符:br 然后在标签列表中:Street,City,ZipCode

兄弟,尤西比奥。

于 2013-12-20T12:56:05.900 回答