问题标签 [jtidy]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Jtidy过滤器似乎没有被调用
我正在尝试在一个非常简单的 hello world Struts 项目上测试 Jtidy 过滤器。
我正在关注过去在这里给出的其他答案。
在部署或访问 JSP 期间我没有收到任何错误。但似乎过滤器什么也没做。即没有从创建的 html 中删除 html 注释。
Struts 过滤器似乎工作正常.. 因为我的 Action 类被调用了。
这是我的 web.xml:
我在这里可能做错了什么?如果我没有得到任何异常,我怎样才能知道?
tidy - Jtidy - 不应该在页面源代码中显示 TM 的编码字符(â„¢)?
我正在使用 Jtidy 渲染新闻信息,当新闻信息中有 TM 时,页面源将其显示为
'â„¢' 无效...
这是我的代码:
InputStream is = new ByteArrayInputStream(description.getBytes()); 输出流 os=new ByteArrayOutputStream();
知道如何显示 TM 代替此编码字符....或如何将 (ISO-8859-1) 设置为 Tidy?
html - jtidy 无法解析 html - 选项
所以我试图评估几个 HTML 解析器并尝试了 JTidy。尝试解析此 URL:
http://htmlcleaner.sourceforge.net/doc/org/htmlcleaner/TagNode.html
给出这些错误:
第 1 行第 56,258 列 - 错误:标签结尾缺少“>”
第 1 行第 56,258 列 - 错误:无法识别!
它说第一行,因为它作为一行读入,但这是 JTidy 呕吐/失败的那一行:
我的代码很简单:
这只是 JTidy 中的一个错误还是我做错了什么?到目前为止,我已经评估了大约 6 个其他人,他们都没有在这个页面上遇到问题。
html - 使用 xpath 提取单引号 html 属性
我想使用 Xpath 提取单引号 html 属性的值。我使用 JTidy 清理了 html 文档,我的代码如下所示:
java - 使用java创建mhtml文件
有人可以建议如何mhtml
使用Java创建文件吗?我已经使用过jtidy
API (sourceforge),但无法在浏览器中打开该页面。如果我在 IE 中打开 mhtml 文件,我会得到一个空白屏幕。
注意:文件(.mhtml)创建成功,但在 IE 8 中没有打开)(请参考下面的链接) JTidy java API toConvert HTML to XHTML
jtidy - 运行 jtidy 测试
我正在尝试在 jtidy 源中运行单元测试,但我遇到了这个异常。有谁知道如何解决这一问题?我猜包文件夹设置不正确。
java.lang.Error:java.util.MissingResourceException:找不到基本名称 org/w3c/tidy/TidyMessages 的捆绑包,在 org.w3c.tidy.Report 的语言环境 en_US。(Report.java:649)在 org.w3c .tidy.Tidy.(Tidy.java:135) at org.w3c.tidy.TidyTestCase.setUp(TidyTestCase.java:153) at junit.framework.TestCase.runBare(TestCase.java:128) at junit.framework.TestResult $1.protect(TestResult.java:106) 在 junit.framework.TestResult.runProtected(TestResult.java:124) 在 junit.framework.TestResult.run(TestResult.java:109) 在 junit.framework.TestCase.run(TestCase .java:120) 在 org.eclipse.jdt.internal.junit.runner.junit3.JUnit3TestReference.run(JUnit3TestReference.java:130) 在 org.eclipse.jdt.internal.junit.runner.TestExecution.run(TestExecution.java :38) 在 org.eclipse.jdt.internal.junit.runner.RemoteTestRunner。runTests(RemoteTestRunner.java:467) at org.eclipse.jdt.internal.junit.runner.RemoteTestRunner.runTests(RemoteTestRunner.java:683) at org.eclipse.jdt.internal.junit.runner.RemoteTestRunner.run(RemoteTestRunner. java:390) 在 org.eclipse.jdt.internal.junit.runner.RemoteTestRunner.main(RemoteTestRunner.java:197)
java - 在 servicemix 中安装功能
我正在运行 Apache servicemix 4.5.2。我想安装一个功能,即一个jar 文件。我想要的功能是jtidy。
pom依赖是:
并且存储库是
http://repo1.maven.org/maven2/jtidy/jtidy/4aug2000r7-dev/jtidy-4aug2000r7-dev.jar
例如,我知道命令features:install webconsole,但 jtidy 不在我的features:list 中。我也尝试过使用 addurl 命令,但是没有用。( addurl mvn: http://repo1.maven.org/maven2/jtidy/jtidy/4aug2000r7-dev ) Karaf 文档建议使用 Features XML 模式添加特征描述符,但不幸的是链接已损坏。
要知道我所做的是下载 jtidy.jar 并将其复制到我的部署目录。它有效,但我认为这不是正确的方法。
有人知道如何在 servicemix 中正确安装 jtidy 吗?
谢谢!
java - 使用java将html转换为xml
任何人都可以建议我使用 java 将 html 转换为 xml 的最佳方法是否有任何 API 可用?html 也可能包含 javascript 代码
我试过下面的代码:
但它没有按预期工作
java - JTidy HTML to XHTML 不处理文件内容
我正在尝试使用 JTidy 解析 HTML 文件,但它似乎忽略了输出中文件的内容,尽管输出日志显示 JTidy 正在遍历文件的内容。
但它只输出
有人知道我在做什么错吗?
java - 如何将 Tidy 配置设置为不替换
标签?
我希望 .tmpPdf 文件中的输出为“Hello world1
”。在这里,“Hello world”应该
介于我的输出之间。