问题标签 [xml-encoding]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
80 浏览

xml - 在 Python 中将 XML 转换为数据框;绊倒为什么不解析xml。编码问题?

非常感谢一些帮助。我已经忙了两天多,四处浏览以了解为什么我无法访问此 xml 文件以将其内容放入 df 中。我的目标是将工作表放在熊猫数据框中的 xml 文件中。我知道有几篇文章讨论了这个主题,但我似乎面临一些使其复杂的错误。

该数据是从知名 ETF 提供商处下载的。它以“.xls”格式下载,但实际上是“xml”格式;显然是一个 Excel xlm。所以一个简单的 pd.read_excel 是行不通的。这就是我被迫进入 xml 格式和 LXML 和 xml.etree.ElementTree 等库的地方。不过,我已经在 BS4 上工作了一段时间。

xml 下载未指定任何编码,当我尝试解析它时,它返回错误。因此,我涉足了 chardet 和 et.XMLParser 以发现它的编码并将其“硬设置”在解析器中。但无济于事。解析时返回:

'lxml.etree.XMLSyntaxError: 文档为空,第 1 行,第 1 列'

我没有直接解析它(参见下面的 xml_tree1),而是尝试使用 fromstring 读取 xml,但我注意到一些乱码。所以我什么都没有替换它:

xml_str = xml_file.read().replace('', '')

现在我有干净的 xml 代码,但在我的根目录中仍然找不到任何子项。事实上,它似乎是空的,根本没有解析。我的知识让我失望了。有人能把我推向正确的方向吗?我的问题处于早期阶段;我似乎无法解析文件和底层格式。第二个问题是我需要解析文档中各个工作表上的 ss:table。在代码中更进一步,我记下了一些示例供我使用。任何评论都非常受欢迎。

这些是对我帮助最大的帖子;

使用 ElementTree 解析 XML 时如何获取子节点的文本值

使用 ElementTree 读取像 .xml 这样的电子表格

xml 的来源可以在这里找到(荷兰语版本)。您可以在右上角下载。

https://www.ishares.com/nl/professionele-belegger/nl/producten/251882/ishares-msci-world-ucits-etf-acc-fund

xml的片段:

到目前为止我的代码:

0 投票
1 回答
43 浏览

xml - WSProxy:尝试调用 SOAP 服务的嵌套错误错误

我在尝试调用 SOAP 服务时遇到错误,客户端提供了正文内容的“样本”,但是,我可以在在线 XML 验证器上获得的最佳结果是以下错误:

请求正文是:

任何人都可以看到这里有什么错误?

0 投票
0 回答
44 浏览

.net - 如何查询存储为 varbinary 的 utf-16 编码的 XML 文件?

我想对存储在 SQL Server 2016 中的 XML 文件运行全文搜索,以varbinary在这些文件中查找短语(id、姓名、电话等)。问题是查询没有找到 UTF-16 编码的文件。

我有以下表格

文件

ID 文件名
1 utf8-encoded.xml
2 utf16-encoded.xml

表文件内容:

ID 内容 类型
1 0x444ae9b... XML
2 0x422de56... XML

和一个观点:

然后我在 .NET Framework 4.6.1 中使用 Dapper 在 C# 中执行全文搜索查询:

像这样将 Dapper 参数更改为 sql-injectable 字符串连接:WHERE CONTAINS(s.Content, " + searchTerm" + ")"不会改变任何东西。

该查询查找 UTF-8 编码的 XML 文件,但找不到 UTF-16 编码的文件。我相信这不是与 Dapper 相关的问题。

我该如何解决这个问题才能找到 UTF-16 编码的 XML 文件呢?SQL Server 的全文搜索是否也适用于 UTF-16 编码的 XML 文件?