222

我正在寻找一种简单的方法来查找文件中最长行的长度。理想情况下,它将是一个简单的 bash shell 命令而不是脚本。

4

14 回答 14

297

使用 wc (GNU coreutils) 7.4:

wc -L filename

给出:

101 filename
于 2010-07-07T03:33:06.877 回答
119
awk '{print length, $0}' Input_file |sort -nr|head -1

供参考:查找文件中最长的行

于 2009-10-31T20:13:45.690 回答
70
awk '{ if (length($0) > max) {max = length($0); maxline = $0} } END { print maxline }'  YOURFILE 
于 2009-10-31T19:39:24.877 回答
23

Just for fun and educational purpose, the pure POSIX shell solution, without useless use of cat and no forking to external commands. Takes filename as first argument:

#!/bin/sh

MAX=0 IFS=
while read -r line; do
  if [ ${#line} -gt $MAX ]; then MAX=${#line}; fi
done < "$1"
printf "$MAX\n"
于 2011-08-27T07:54:06.963 回答
13
wc -L < filename

101
于 2010-07-22T00:05:25.230 回答
11
perl -ne 'print length()."  line $.  $_"' myfile | sort -nr | head -n 1

打印最长行的长度、行号和内容

perl -ne 'print length()."  line $.  $_"' myfile | sort -n

打印所有行的排序列表,包括行号和长度

.是连接操作符——这里用在length()之后
$.是当前行号
$_是当前行

于 2015-05-04T21:23:16.520 回答
7

看起来所有的答案都没有给出最长行的行号。以下命令可以给出行号和大致长度:

$ cat -n test.txt | awk '{print "longest_line_number: " $1 " length_with_line_number: " length}' | sort -k4 -nr | head -3
longest_line_number: 3 length_with_line_number: 13
longest_line_number: 4 length_with_line_number: 12
longest_line_number: 2 length_with_line_number: 11
于 2015-01-02T05:49:28.257 回答
6

上述示例中被忽略的重要一点。

以下 2 个示例计算扩展选项卡

  wc -L  <"${SourceFile}" 
# or
  expand --tabs=8 "${SourceFile}" | awk '{ if (length($0) > max) {max = length($0)} } END { print max }'

以下 2 个计数未展开的选项卡。

  expand --tabs=1 "${SourceFile}" | wc -L 
# or
  awk '{ if (length($0) > max) {max = length($0)} } END { print max }' "${SourceFile}"

所以

              Expanded    nonexpanded
$'nn\tnn'       10            5
于 2012-05-01T17:10:47.570 回答
3

在 perl 中:

perl -ne 'print ($l = $_) if (length > length($l));' filename | tail -1

这只会打印行,而不是它的长度。

于 2009-10-31T21:38:14.643 回答
3

这是anwser的参考资料

cat filename | awk '{print length, $0}'|sort -nr|head -1

http://wtanaka.com/node/7719

于 2009-10-31T20:56:39.307 回答
3

我在 Unix 环境中,使用大小为几 GB 的 gzip 压缩文件。我使用记录长度为 2052 的 2 GB gzip 压缩文件测试了以下命令。

  1. zcat <gzipped file> | wc -L

  1. zcat <gzipped file> | awk '{print length}' | sort -u

时代平均

  1. 117 秒

  2. 109 秒

这是我运行大约 10 次后的脚本。

START=$(date +%s) ## time of start

zcat $1 |  wc -L

END=$(date +%s) ## time of end
DIFF=$(( $END - $START ))
echo "It took $DIFF seconds"

START=$(date +%s) ## time of start

zcat $1 |  awk '{print length}' | sort -u

END=$(date +%s) ## time of end
DIFF=$(( $END - $START ))
echo "It took $DIFF seconds"
于 2017-04-20T21:51:34.547 回答
2

只是为了好玩,这是 Powershell 版本:

cat filename.txt | sort length | select -last 1

为了得到长度:

(cat filename.txt | sort length | select -last 1).Length
于 2010-02-11T20:31:58.190 回答
1

主题的变化。

这将显示文件中找到的最长行长度的所有行,并保留它们在源中出现的顺序。

FILE=myfile grep `tr -c "\n" "." < $FILE | sort | tail -1` $FILE

所以我的文件

x
mn
xyz
123
abc

会给

xyz
123
abc
于 2009-11-02T00:56:22.387 回答
1

如果您使用的是 MacOS 并收到此错误: wc: illegal option -- L您不需要安装 GNU sipmly 执行此操作。

如果您只想获取文件最长行中的字符数并且您正在使用 OS X 运行:

awk '{print length}' "$file_name" | sort -rn | head -1

像这样的东西;

echo "The longest line in the file $file_name has $(awk '{print length}' "$file_name" | sort -rn | head -1) characters"

输出:

The longest line in the file my_file has 117 characters

于 2019-11-16T16:41:15.307 回答