问题标签 [domdocument]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
8 回答
13993 浏览

php - 使用 PHP 解析 XML

我一直在用 PHP 解析 XML 时遇到问题,并且没有真正找到“正确的方法”,或者至少没有找到解析 XML 文件的标准化方法。

首先我试图解析这个:

我正在使用这段代码:

现在我想获取“media:content”和“media:thumbnail”url 属性,我该怎么做?现在我认为我应该使用 DOMElement::getAttribute 但我还没有设法让它工作:/ 任何人都可以对此有所了解,并让我知道这是否是解析 XML 的好方法?

问候, 沙迪

0 投票
4 回答
49265 浏览

php - 通过 DomDocument (PHP) 加载格式不正确的 HTML 时禁用警告

我需要解析一些 HTML 文件,但是,它们的格式不正确,PHP 会打印出警告。我想以编程方式避免这种调试/警告行为。请指教。谢谢!

代码:

这个:

可以抑制警告,但如何以编程方式捕获这些警告?

0 投票
2 回答
21413 浏览

php - 如何使用 DOMDocument 类删除 HTML 元素

有没有办法通过使用DOMDocument类来删除 HTML 元素?

0 投票
1 回答
1809 浏览

php - dom文档格式

我正在尝试阅读某个网页的正文以显示在单独的网页上,但我遇到了一些麻烦。现在,我使用以下代码

这段代码有效,但是它似乎删除了很多格式,这对我很重要,例如换行符。我该如何阻止这种情况发生

0 投票
3 回答
20714 浏览

php - 我如何告诉 DOMDocument->load() 我希望它使用什么编码?

我从其他地方搜索和处理 XML 文件,并且需要使用一些 XSLT 对其进行转换。没问题。使用 PHP5 和 DOM 库,一切都变得轻而易举。工作正常,到现在为止。今天,时髦的字符出现在 XML 文件中——看起来像是来自 Word 的“智能”引用。无论如何, DOMDocument->load 抱怨它们,说它们不是 UTF-8,并指定编码。

瞧,这些 XML 文件中没有指定编码。如果我将 'encoding="iso-8859-1"' 添加到标题中,它可以正常工作。问题是我无法控制这些 XML 文件。

将文件读入字符串、修改其标题并将其写回另一个位置似乎是我唯一的选择,但我更愿意这样做,而根本不必使用 XML 文件的临时副本。有什么方法可以简单地告诉解析器解析它们,就好像它们是 iso-8859-1 一样?

0 投票
1 回答
1875 浏览

php - DOMDocument & XPath - 每个节点的 HTML 标签

使用以下 PHP 代码DOMDocument

如何知道每个匹配节点的标签名称?

0 投票
3 回答
10126 浏览

php - 有没有办法获取 DOMElement 的所有属性?

我正在使用 PHP 阅读一些 XML,并且目前正在使用DOMDocument该类来执行此操作。我需要一种方法来获取标签(的实例DOMElement)属性的名称和值,而无需事先知道它们是什么。该文档似乎没有提供类似的东西。我知道如果我有一个属性的名称,我可以得到它的值,但同样,我不知道其中任何一个,需要找到两者。

我也知道其他类似的类也SimpleXMLElement具有此功能,但我对如何使用DOMDocument.

0 投票
9 回答
32117 浏览

php - 如何在 php 中查看 DOMNodeList 对象的数据

当我想测试 php 数组时,我使用以下代码

但知道我想查看我的对象所在的对象的数据

当我使用

我得到那个输出

我想遍历这个对象的值来测试我的查询结果?

0 投票
1 回答
569 浏览

php - 来自多个文件的相同元素 DomDocument loadHTMLFile PHP

似乎当我在“/var/www/cal/attach/”目录中有多个文件时,它只会一遍又一遍地从第一个文件中提取元素。我是否需要以某种方式清除这些元素才能使其正常工作?我想要做的是让脚本遍历多个 *.htm 文件,并将文件中的数据解析为 $value[x] ,稍后我可以调用。然而,多个文件显示相同的值......出了什么问题?

0 投票
2 回答
4179 浏览

php - 将可点击的锚标记转换为 html 文档中的纯文本

我正在尝试匹配<a>我的内容中的标签,并将它们替换为链接文本,后跟方括号中的 url 以获取打印版本。

如果只有“href”,则以下示例有效。如果<a>包含另一个属性,则它匹配太多并且不会返回所需的结果。

如何匹配 URL 和链接文本,仅此而已?

这是我的代码:

期望的结果: