1

我的 postgres 表中有以下格式的数据:

 create table t (col1 character varying, col2 character varying, col3 character varying);

  col1   col2    col3
  <a>    <b>     <c> .
  <d>    owl:g   <h> .
  dbp:h1  <k>     <l> .

我需要用http://yago-knowledge.org/resource/VARIABLE

  owl: <http://www.w3.org/2002/07/owl#VARIABLE>
  dbp: <http://dbpedia.org/ontology/VARIABLE>

我知道可以在 python 中使用 re.sub(r"<(.*?)>", r"http://yago-knowledge.org/resource/\1", col)

我转换后的数据如下所示:

<http://yago-knowledge.org/resource/a>    <http://yago-knowledge.org/resource/b>    <http://yago-knowledge.org/resource/c>
<http://yago-knowledge.org/resource/d>    <http://www.w3.org/2002/07/g>      <http://yago-knowledge.org/resource/h> 
<http://dbpedia.org/ontology/h1>          <http://yago-knowledge.org/resource/k>    <http://yago-knowledge.org/resource/l>

是否可以在 postgres 中使用 SQL 来实现相同的目标?在 col3 中,每个值后面都有一个点,是否可以使用 SQL 消除该点

编辑:我使用正则表达式尝试了以下操作:

regexp_replace('<a>', '.[<a]a.', '<http://yago-knowledge.org/resource/')

但是,它似乎不起作用。谁能指出我哪里出错了。

4

1 回答 1

1

将它打包成一个函数可能会更容易。这应该让你开始:

Create Function squirrel(col varchar) returns varchar as $$
begin
  col = regexp_replace(col, ' \.$', '');
  col = regexp_replace(col, '<(.)>', '<http://yago-knowledge.org/resource/\1>');
  col = regexp_replace(col, 'owl:(.*)', '<http://www.w3.org/2002/07/owl#\1>');
  col = regexp_replace(col, 'dbp:(.*)', '<http://dbpedia.org/ontology/#\1>');

  return col;
end;
$$ Language plpgsql;

Select 
  squirrel(col1) col1,
  squirrel(col2) col2,
  squirrel(col3) col3
from
  t

Example Fiddle

于 2013-10-11T20:34:49.840 回答