28

UTF-8 中“行尾”的二进制表示是什么。

4

3 回答 3

46

一堆

  • LF: 换行, U+000A (UTF-8 in hex: 0A)
  • VT:垂直制表符,U+000B(UTF-8 十六进制:0B)
  • FF:换页,U+000C(UTF-8 十六进制:0C)
  • CR: 回车, U+000D (UTF-8 in hex: 0D)
  • CR+LF: CR ( U+000D ) 后跟 LF ( U+000A ) (UTF-8 in hex: 0D0A)
  • NEL:下一行,U+0085(UTF-8 十六进制:C285)
  • LS: 行分隔符, U+2028 (UTF-8 in hex: E280A8)
  • PS: 段落分隔符,U+2029 (UTF-8 in hex: E280A9)

...可能还有更多。

最常用的是LF(*nix)、CR+LF(Windows 和 DOS)和CR(主要是旧的 pre-OSX Mac 系统)。

于 2012-12-12T09:16:57.420 回答
23

来自Unicode 字符 'LINE FEED (LF)'

在 UTF-8 (hex) 中 --> 0x0A (0a)
UTF-8 (binary) --> 00001010

在此处输入图像描述

于 2012-12-12T09:18:57.540 回答
9

UTF-8 与 ASCII 兼容,因此 UTF-8 也使用 ASCII 码 10 (0x0A) 换行和回车 13 (0x0D)。

于 2012-12-12T09:16:10.837 回答