当我创建包含 AcroForm 格式(PDF 字典,无 XFA)的文本字段的 PDF 表单(例如使用 Acrobat),并将数据提交到服务器时,如何指定/检索将使用的编码?
例如。当我提交中文字形“测试”(测试)时,我在服务器端收到以下标头和内容:
accept: application/x-ms-application, image/jpeg, application/xaml+xml, image/gif, image/pjpeg, application/x-ms-xbap, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, */*
content-type: application/x-www-form-urlencoded
content-length: 23
acrobat-version: 10.1.4
user-agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; WOW64; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; MDDC; .NET4.0C; AskTbCLA/5.15.1.22229)
accept-encoding: gzip, deflate
connection: Keep-Alive
Song=%b2%e2%ca%d4&Test=
除了 x-www-form-urlencoded 之外,没有对编码的引用。这两个字形表示为四个字节:B2 E2 CA D4。经过一番调查,我知道 B2E2 是第一个字形的 GBK 值,而 CAD4 是第二个字形的 GBK 值,但我无法从请求标头中得出这个。
总是GBK吗?我想通过在 PDF 的字典中设置特定键来更改数据编码,但似乎没有。例如:我想确保 PDF 始终发送 Unicode 字符而不是 GBK。
请注意,我已经通过更改文本字段的默认字体(和编码)进行了试验。我还在 ISO-32000-1 中搜索了字段中的编码,但我发现的只是一种为复选框定义非拉丁字符的方法,以及有关 FDF 文件编码的一些信息。没有一个回答我的问题。