5

当通过 SSH 连接到远程 BASH 会话时(终端类型设置为 vt100),当光标到达第 80 列时,控制台命令行将自动换行。

我想发现的是,<space><carriage return>此时发送的序列是否记录在任何地方?

例如发送以下字符串

    std::string str = "0123456789"  // 1
                        "0123456789"
                        "0123456789"    // 3
                        "0123456789"
                        "0123456789"    // 5
                        "012345678 9"
                        "0123456789_"   // 7
                        "0123456789"
                        "0";

从主机返回以下响应(Linux Mint 发生)

01234567890123456789012345678901234567890123456789012345678<WS><WS><CR>90123456789_01234567890
4

2 回答 2

12

观察到的行为并不是 bash 的一部分。相反,它是readline库行为的一部分。如果您简单地使用echo(它是内置的 bash)输出足够的文本以强制自动换行,则不会发生这种情况,如果 bash 产生比控制台宽的错误消息,也不会发生这种情况。(例如,尝试.使用与任何现有文件不对应的参数超过 80 个字符的命令。)

所以它不是官方的“软包装序列”,也不是任何标准的一部分。相反,它是与控制台显示管理相关的许多恼人问题之一的实用解决方案。

换行的终端实现存在歧义:

  1. 在最右边的位置插入一个字符后,终端换行。

  2. 终端在发送下一个字符之前换行。

因此,不可能在最后一列位置之后可靠地发送换行符。如果终端已经换行(上面的选项 1),那么换行符将创建一个额外的空白行。否则(选项 2),以下换行符将被“吃掉”。

如今,几乎所有终端都遵循选项 2 的一些变体,这是 DEC VT-100 终端的行为。在terminfo终端描述数据库的词汇表中,这被称为xenl:“eat-newline-glitch”。

选项 2 实际上有两种可能的子变体。在 VT-100(和 xterm)实际实现的一个中,光标在行尾处于异常状态;实际上,它是屏幕外的一个字符位置,因此您仍然可以在同一行中退格光标。其他历史终端“吃掉”换行符,但无论如何将光标定位在下一行的开头,因此退格是不可能的。(除非终端有bw能力。)

这给需要准确跟踪光标位置的程序带来了问题,即使对于像回显输入这样看似简单的应用程序也是如此。(显然,回显输入的最简单方法是让终端自己完成,但这排除了实现额外控制字符(如制表符补全)的能力。)假设用户已将文本输入到右边距,然后键入退格字符删除最后输入的字符。cub1通常,您可以通过输出(左移 1)代码然后输出el(清除到行尾)来实现退格删除。(如果删除在一行中间会比较复杂,但原理是一样的。)

但是,如果光标可能位于下一行的开头,这将不起作用。如果您知道光标在 next 的开头,您可以在执行 之前先向上移动,然后向右移动el,但如果光标仍在同一行上,这将不起作用。

从历史上看,被认为是“正确的”是将光标强制返回到下一行。(以下引用来自发行版terminfo.src中的文件ncurses。我不知道是谁写的,什么时候写的):

# Note that the <xenl> glitch in vt100 is not quite the same as on the Concept,
# since the cursor is left in a different position while in the
# weird state (concept at beginning of next line, vt100 at end
# of this line) so all versions of vi before 3.7 don't handle
# <xenl> right on vt100. The correct way to handle <xenl> is when
# you output the char in column 80, immediately output CR LF
# and then assume you are in column 1 of the next line. If <xenl>
# is on, am should be on too.

但是还有另一种方法可以解决这个问题,甚至不需要你知道终端是否有xenl“故障”:输出一个空格字符,之后终端肯定会换行,然后返回到最左边的列。

事实证明,如果终端仿真器是xterm(可能还有其他类似的仿真器),这个技巧还有另一个好处,它允许您通过双击来选择一个“单词”。如果自动换行发生在一个单词的中间,如果您仍然可以选择整个单词,即使它被分成两行,那将是理想的。如果您遵循上述terminfo文件中的建议,那么xterm将(相当合理地)将拆分词视为两个词,因为它们之间有一个明确的换行符。但是,如果您让终端自动换xterm行,则将结果视为一个单词。(尽管输出了空格字符,它还是这样做了,大概是因为空格字符被覆盖了。)

简而言之,SPCR序列绝不是 VT100 终端的标准化特征。相反,它是对终端描述的特定特征与特定(和常见)终端仿真器的观察行为相结合的务实响应。该代码的变体可以在各种代码库中找到,尽管据我所知它不是任何教科书或正式文档的一部分,但它肯定是终端处理民间工艺的一部分 [注 2]。

在 的情况下readline,您会在代码中找到比这个答案更电报的注释:[注 1]

  /* If we're at the right edge of a terminal that supports xn, we're
     ready to wrap around, so do so.  This fixes problems with knowing
     the exact cursor position and cut-and-paste with certain terminal
     emulators.  In this calculation, TEMP is the physical screen
     position of the cursor. */

xn是 的简写形式xenl。)


笔记

  1. 当我键入此答案时,注释位于存储库display.c当前视图的第1326 行。git在未来的版本中,它可能位于不同的行号,因此提供的链接将不起作用。如果您发现它已更改,请随时更正链接。

  2. 在这个答案的原始版本中,我将此过程描述为“终端处理民间传说的一部分”,其中我使用“民间传说”这个词来描述从程序员传给程序员的知识,而不是作为学术经典的一部分和国际标准。虽然“民俗”经常带有负面含义,但我使用它时没有这种偏见。“ lore ”(根据维基词典)指的是“通过教育或经验随着时间的推移积累的关于特定主题的所有事实和传统”,源自古日耳曼语单词,意思是“教”。因此,民俗是“民间”积累的教育和经验,而不是建立:在埃里克·S·雷蒙德,民俗是集市的知识库。

    这种用法至少引起了一位高技能从业者的注意,他建议使用“深奥”一词来描述有关终端处理的这一点信息。“深奥”(再次根据维基词典)适用于“旨在或可能被少数具有专业知识或兴趣或开明的核心圈子的人理解的信息”,源自希腊语 ἐσωτερικός,“内在圆圈”。(换句话说,大教堂的知识。)

    虽然语义讨论至少很有趣,但我通过使用希望不那么情绪化的单词“folkcraft”来更改文本。

于 2015-07-11T18:57:23.747 回答
2

使换行成为一种特殊情况的原因不止一个(而且“民间传说”似乎是一个不恰当的术语):

  • xterm 的FAQ对wrapping 的描述很奇怪,多说吗?是讨论 vt100 换行的众多地方之一。
  • vim 和screen都注意不要使用光标寻址来避免换行,因为这会干扰在 xterm 中选择换行的行。相反(并且示例似乎也显示 bash 这样做了)它们发送一系列可打印字符,这些字符在发送其他控制序列之前跨页边距,这将阻止在 xterm 中设置换行标志。这在 xterm 的手册页中有说明:

    如果行由 xterm 本身而不是由窗口中运行的应用程序换行,则通过双击或三次单击选择的逻辑字和行可能会换行超过一个屏幕行。

  • 至于“代码中的注释”——当然有,向维护者解释什么不应该改变。这来自 Sven Mascheck 的XTerm资源文件给出了一个很好的解释:

    ! Wether this works also with _wrapped_ selections, depends on ! - the terminal emulator: Neither MIT X11R5/6 nor Suns openwin xterm ! know about that. Use the 'xfree xterm' or 'rxvt'. Both compile on ! all major platforms. ! - It only works if xterm is wrapping the line itself ! (not always really obvious for the user, though). ! - Among the different vi's, vim actually supports this with a ! clever and little hackish trick (see screen.c): ! ! But before: vim inspects the _name_ of the value of TERM. ! This must be similar to "xterm" (like "xterm-xfree86", which is ! better than "xterm-color", btw, see his FAQ). ! The terminfo entry _itself_ doesn't matter here ! (e.g.: 'xterm' and 'vs100' are the same entry, but with ! the latter it doesn't work). ! ! If vim has to wrap a word, it appends a space at the first part, ! this space will be wrapped by xterm. Going on with writing, vim ! in turn then positions the cursor again at the _beginning_ of this ! next line. Thus, the space is not visible. But xterm now believes ! that the two lines are actually a single one--as xterm _has_ done ! some wrapping also...

@rici 引用的评论来自于 Eric Raymond 于 1995 年从 SCO 合并的 terminfo 文件。terminfo 源的历史部分指的是这个。其中的一些材料基于 BSD termcap 源,但有所不同,当将本节中的BSD termcapncurses进行比较时会注意到这一点。以“不完全”开头的四个段落与 SCO 文件相同(除了换行)。这是该文件的剪切/粘贴:

# # --------------------------------
#
# dec: DEC (DIGITAL EQUIPMENT CORPORATION)
#
# Manufacturer: DEC (DIGITAL EQUIPTMENT CORP.)
# Class:    II
# 
# Info:
#   Note that xenl glitch in vt100 is not quite the same as concept,
#   since the cursor is left in a different position while in the
#   weird state (concept at beginning of next line, vt100 at end
#   of this line) so all versions of vi before 3.7 don't handle
#   xenl right on vt100. The correct way to handle xenl is when
#   you output the char in column 80, immediately output CR LF
#   and then assume you are in column 1 of the next line. If xenl
#   is on, am should be on too.
#   
#   I assume you have smooth scroll off or are at a slow enough baud
#   rate that it doesn't matter (1200? or less). Also this assumes
#   that you set auto-nl to "on", if you set it off use vt100-nam 
#   below.
#   
#   The padding requirements listed here are guesses. It is strongly
#   recommended that xon/xoff be enabled, as this is assumed here.
#   
#   The vt100 uses rs2 and rf rather than is2/tbc/hts because the 
#   tab settings are in non-volatile memory and don't need to be 
#   reset upon login. Also setting the number of columns glitches 
#   the screen annoyingly. You can type "reset" to get them set.
#
# smkx and rmkx, given below, were removed. 
# smkx=\E[?1h\E=, rmkx=\E[?1l\E>,
# Somtimes smkx and rmkx are included.  This will put the auxilliary keypad in
# dec application mode, which is not appropriate for SCO applications.
vt100|vt100-am|dec vt100 (w/advanced video),

如果比较两者,ncurses 版本在 terminfo 功能名称周围添加了尖括号,并且在第一句中进行了小的语法更改。但评论的作者显然不是雷蒙德。

于 2015-07-11T21:22:44.413 回答