0

帮帮我,伙计们,我真的迷路了。我有一个很大的文本文件,里面有很多链接,我试图根据链接所属的网站将它们分开。我试图用 csplit 命令来做,但我不确定我会怎么做,因为它取决于文本内容。

文本示例:

www.unix.com/man-page/opensolaris/1/csplit/&hl=en
www.unix.com/shell-programming-and-scripting/126539-csplit-help.html/RK=0/RS=iGOr1SINnK126qZciYPZtBHpEmg-
www.w3cschool.cc/linux/linux-comm-csplit.html
www.linuxdevcenter.com/cmd/cmd.csp?path=c/csplit+"csplit"&hl=en&ct=clnk

所以在这个例子中,前两个链接将在一个文件中,剩下的 2 个链接将在一个文件中。这将如何工作?我真的不知道这是否可能。(新手程序员)

4

1 回答 1

2

尝试 :

awk 'BEGIN{FS="/"} {print > $1}' [your file name]

输出:

cat www.unix.com 
www.unix.com/man-page/opensolaris/1/csplit/&hl=en
www.unix.com/shell-programming-and-scripting/126539-csplit-help.html/RK=0/RS=iGOr1SINnK126qZciYPZtBHpEmg-
cat www.linuxdevcenter.com 
www.linuxdevcenter.com/cmd/cmd.csp?path=c/csplit+"csplit"&hl=en&ct=clnk
cat www.w3cschool.cc 
www.w3cschool.cc/linux/linux-comm-csplit.html

{print > $1}将输出重定向到基于域名的单独文件$1,在这种情况下,域名。

于 2015-01-26T07:30:30.617 回答