replace - 如何删除文本文件每一行的单词后的所有内容？

Question

我有一个看起来有点像这样的文本文件

356, http://linkgoeshere.com/4445555 title="The Chariot"> <br />
356, http://linkgoeshere.com/4445555 title="fddsfssfd"> <br />
356, http://linkgoeshere.com/4445555 title="T3434534535"> <br />

我只想将所有内容留给链接并删除之后的所有内容，但之后的每个部分都是唯一的，除了 title= 所以我无法查找和替换。

（顺便说一句，大约 800 行）

有什么办法可以使用编程来做到这一点？

谢谢。

score 1 · Accepted Answer

在Notepad++您可以使用正则表达式查找和替换来执行此操作

点击菜单Search --> Replace...
在Search Mode选择中Regular expression
\stitle=".*$输入正则表达式Find what
使Replace with框为空
点击Replace all

在版本中测试6.2.2

这也应该适用于支持使用正则表达式查找和替换的其他编辑器。

score 0 · Accepted Answer

编辑方式（vim）：

用vim打开你的文件，输入:%s/ title=.$//g你会看到结果。

事实上，任何支持正则表达式替换的编辑器都可以。

脚本编程：

sed

（注意：下面的命令将进行更改。）

sed -i 's/ title=.$//' file

awk：

棘手的方式，没有正则表达式：

awk '{print $1,$2}' file

您会在标准输出上看到输出。你可以将它重定向到一个文件awk... >newFile

score -1 · Accepted Answer

Excel
如果您的编辑器不支持正则表达式，请使用 Excel 将文件导入为 csv 文件（数据 -> 来自文本）并告诉 excel 使用空格作为字段分隔符。然后将前两列导出为新的 csv 文件。

replace - 如何删除文本文件每一行的单词后的所有内容？

3 回答 3

Related

Reference