-3

我有一个包含一些数据记录的文件,如下所示:

<http://www.mylab.org/mydata/resource/1234502851114AA> <http://www.w3.org/2003/01/geo/wgs84_pos#long> "10.983007809025084" .
<http://www.mylab.org/mydata/resource/1234502851114AA> <http://www.w3.org/2003/01/geo/wgs84_pos#lat> "43.721979606737897" .
<http://www.mylab.org/mydata/resource/1234502851114AA> <http://purl.org/dc/terms/identifier> "1234502851114AA" .
<http://www.mylab.org/mydata/resource/1234502851114AA> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://www.mylab.org/mydata/schema#Node> .
<http://www.mylab.org/mydata/resource/1234502851114AA> <http://www.disit.org/km4city/schema#nodeType> "STRING_STRING_STRING" .

在每个条目中,我必须用脚本(java/python 或其他)替换这样的行:

<http://www.mylab.org/mydata/resource/1234502851114AA> <http://www.w3.org/2003/01/geo/wgs84_pos#long> "10.983007809025084" .
<http://www.mylab.org/mydata/resource/1234502851114AA> <http://www.w3.org/2003/01/geo/wgs84_pos#lat> "43.721979606737897" .

^^<http://www.w3.org/2001/XMLSchema#float>在数字末尾添加:

<http://www.mylab.org/mydata/resource/1234502851114AA> <http://www.w3.org/2003/01/geo/wgs84_pos#long> "10.983007809025084"^^<http://www.w3.org/2001/XMLSchema#float> .
<http://www.mylab.org/mydata/resource/1234502851114AA> <http://www.w3.org/2003/01/geo/wgs84_pos#lat> "43.721979606737897"^^<http://www.w3.org/2001/XMLSchema#float> .

你能帮我一个帮助我替换的正则表达式吗?

实际正则表达式:

(pos#long>\s"\d)

它只捕获pos#long> "1

太感谢了

4

2 回答 2

1

好吧,为了匹配你想要替换的行,你想要的正则表达式实际上比你所拥有的要复杂一点:(.+wgs84_pos#(?:long|lat).+) \.. 这将匹配并捕获字符串中的现有文本。

在 Perl 中,您的替换代码看起来像这样(我将 Perl 脚本的其余部分留给您):

$line =~ s/(.+wgs84_pos\#(?:long|lat).+) \./$1^^<http:\/\/www.w3.org\/2001\/XMLSchema#float> ./g

这样做是捕获第一行的全部内容,减去末尾的句点,然后在附加句点之前将其与其他代码段一起转储到新行中。

于 2016-07-23T13:25:13.407 回答
1

(>\s"\d*\.{0,1}\d*"\s\.$)如果它们位于行尾,您可以找到这两个数字。然后你可以追加^^<http://www.w3.org/2001/XMLSchema#float>到该行。

或者,您可以替换搜索(>\s"\d*\.{0,1}\d*"\s\.$)并替换为$1 ^^<http://www.w3.org/2001/XMLSchema#float>(使用记事本++ 测试)。

于 2016-07-23T13:31:02.523 回答