7

我需要为字符串中的每个字符获取 ASCII 字符。实际上它是一个(小)文件中的每个字符。以下前 3 行成功地将文件的所有内容拉入字符串(根据此配方):

set fp [open "store_order_create_ddl.sql" r]
set data [read $fp]
close $fp

我相信我正确识别字符的 ASCII 码(参见http://wiki.tcl.tk/1497)。但是,我在弄清楚如何遍历字符串中的每个字符时遇到了问题。

首先,我不认为以下是使用 Tcl 在字符串中循环字符的一种特别惯用的方式。其次,更重要的是,它的行为不正确,在每个字符之间插入了一个额外的元素。

下面是我编写的代码,用于处理上面设置的“数据”变量的内容,然后是一些示例输出。

代码:

for {set i 0} {$i < [string length $data]} {incr i} {
  set char [string index $data $i]
  scan $char %c ascii
  puts "char: $char (ascii: $ascii)"
}

输出:

char: C (ascii: 67)
char:  (ascii: 0)
char: R (ascii: 82)
char:  (ascii: 0)
char: E (ascii: 69)
char:  (ascii: 0)
char: A (ascii: 65)
char:  (ascii: 0)
char: T (ascii: 84)
char:  (ascii: 0)
char: E (ascii: 69)
char:  (ascii: 0)
char:   (ascii: 32)
char:  (ascii: 0)
char: T (ascii: 84)
char:  (ascii: 0)
char: A (ascii: 65)
char:  (ascii: 0)
char: B (ascii: 66)
char:  (ascii: 0)
char: L (ascii: 76)
char:  (ascii: 0)
char: E (ascii: 69)
4

2 回答 2

11

以下代码应该可以工作:

set data {CREATE TABLE}
foreach char [split $data ""] {
    lappend output [scan $char %c]
}
set output ;# 67 82 69 65 84 69 32 84 65 66 76 69

至于输出中的额外字符,问题似乎出在文件中的输入数据上。文件中的每个字符之间是否有空字符(\ 0)?

于 2009-11-04T18:31:20.197 回答
0

在寻找其他东西时遇到了这个较旧的问题..为了其他可能正在寻找这个问题答案的人的利益而回答它..

首先,了解什么是字符编码。示例中的源数据不是 ASCII 字符编码,因此 ASCII 字符代码(代码 0-127)确实没有任何意义——除了在此示例中,编码似乎是 UTF-16,其中包含 ASCII 代码作为子集. 您可能想要的是从 0 到 255 的全部“字符”代码,但根据您的系统、数据来源等,代码 128-255 可能是 ANSI、ISO 或其他一些奇怪的代码页。您要做的是将数据转换为您知道如何处理的格式,例如非常常见的 ISO 8859-1 代码(编码“iso8859-1”),它与 Windows 1252 标准编码(编码“ cp1252") 或 UTF-8 (编码 "utf-8") 使用 "encoding" 命令:

set data [encoding convertto utf-8 $data] ;# For UTF-8

set data [encoding convertto iso8859-1 $data] ;# For ISO 8859-1

等等。如果您正在从文件中读取数据,您可能还需要在读取数据之前设置文件编码(通过 fconfigure),以确保您正在正确读取文件数据。查找“encoding”(和“fconfigure”)的手册页以获取有关处理字符集编码的更多详细信息。

一旦您控制了数据的编码,示例代码的其余部分应该可以按预期工作。

于 2015-04-15T19:20:00.017 回答