1

如何在 HIVE 中使用 regexp_replace 函数,我可以从这个字符串中删除标记:

Abc abc ","<a href="http://,557244.html" id=" ">abc abc abc .</a> 

我想得到: Abc abc abc abc abc 有人知道吗?

4

1 回答 1

0

假设列 WTF 包含

Abc abc ","<a href="http://,557244.html" id=" ">abc abc abc .</a>

然后regexp_replace(regexp_replace(WTF,'<[^>]*>',''), '[",.]','')删除所有 XML 标记内容,然后是标点符号,返回

abc abc abc abc

那是普通的旧正则表达式语法,没有特定于 Hive。

于 2015-11-20T17:21:22.377 回答