0

我有一个看起来有点像这样的文本文件

356, http://linkgoeshere.com/4445555 title="The Chariot"> <br />
356, http://linkgoeshere.com/4445555 title="fddsfssfd"> <br />
356, http://linkgoeshere.com/4445555 title="T3434534535"> <br />

我只想将所有内容留给链接并删除之后的所有内容,但之后的每个部分都是唯一的,除了 title= 所以我无法查找和替换。

(顺便说一句,大约 800 行)

有什么办法可以使用编程来做到这一点?

谢谢。

4

3 回答 3

1

Notepad++您可以使用正则表达式查找和替换来执行此操作

  • 点击菜单Search --> Replace...
  • Search Mode选择中Regular expression
  • \stitle=".*$输入正则表达式Find what
  • 使Replace with框为空
  • 点击Replace all

在版本中测试6.2.2

这也应该适用于支持使用正则表达式查找和替换的其他编辑器。

于 2012-12-17T10:23:33.147 回答
0
  • 编辑方式(vim):

用vim打开你的文件,输入:%s/ title=.$//g你会看到结果。

事实上,任何支持正则表达式替换的编辑器都可以。

  • 脚本编程:

sed

(注意:下面的命令将进行更改。)

sed -i 's/ title=.$//' file 

awk

棘手的方式,没有正则表达式:

awk '{print $1,$2}' file  

您会在标准输出上看到输出。你可以将它重定向到一个文件awk... >newFile

于 2012-12-17T10:35:40.940 回答
-1

Excel
如果您的编辑器不支持正则表达式,请使用 Excel 将文件导入为 csv 文件(数据 -> 来自文本)并告诉 excel 使用空格作为字段分隔符。然后将前两列导出为新的 csv 文件。

于 2012-12-17T10:40:32.633 回答