问题标签 [webarchive]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
644 浏览

javascript - Android WebView WebArchive 加载后冻结

我目前正在为平板电脑开发一个 android 应用程序,我想介绍用例:“如果没有互联网连接,我希望应用程序正常运行”。

我使用 webview 在应用程序中加载调查,因此一旦安装在我们的商店中,每次我们需要进行新的改造或添加问题时,我都不必安装新版本。

为了覆盖没有连接的情况,我保存了一个 webArchive,当我需要加载网页时,如果没有 wifi,我会加载它。

唯一的问题是 webarchive 一加载就冻结了。我尝试了很多方法来使其正常工作,但解决方案正在逃避我。

当我将应用程序设置为平面模式并重新加载应用程序时,我看到主页正常,但点击事件不起作用。我的 Android Javascript 界面也无法正常工作,因为我测试了在应用程序完成加载时发送 Toast 进行调试,所以我猜测 javascript 在我的 webarchive 中不起作用,或者 webarchive 可能不包括来自其他的 CSS 和 Javascript W3.css 和 JQuery 之类的网站?

也许如果我使用这些资产的本地版本,它们将包含在网络档案中。

欢迎大家提出意见。

谢谢

0 投票
0 回答
75 浏览

bash - 如何修复 Bash for webscraper 上的时区导入错误?

我正在尝试使用命令行实用程序 wayback-machine-scraper 从存档站点中提取数据。刮板需要在 Bash 中运行,但需要时区,我只能在 Python 3.X 中找到。如果我切换到 python,那么我会在 wayback-machine-scraper 上得到一个语法错误。我需要专门使用这个刮板,因为它允许搜索最近的存档站点和日期范围。

输出

对不起,如果这不是完美的格式。这是我第一次在这里发帖。感谢你的帮助!

0 投票
1 回答
403 浏览

ruby - wayback_machine_donwloader 尝试从网络存档下载“http://mexiko-lexikon.de”时出错

截屏

知道为什么我会得到这个吗?

0 投票
0 回答
62 浏览

arabic - Openwayback 搜索不适用于 URL 中的阿拉伯网站

我已经安装并设置了openwayback 的基础知识,现在尝试使其与以下资源一起使用

设置:

  1. 我用webrecorder.io下载了上面的warc文件。
  2. 将openwayback配置为最低限度并将warc文件放入数据文件夹
  3. 打开网络应用程序尝试搜索该确切地址

结果:

  1. 什么都找不到。地址变成

    http://localhost:8855/wayback/19960101000000-20181231235959 */ https://moj.gov.ae/documents/21128/102233/????+????+???????+? ??+18+??????+2017+??????+??????+??????+???????+??????????+? ????????.pdf

  2. 但例如,如果我只输入https://moj.gov.ae,那么我可以找到URL encoded. 但即使我将整个 URL 编码复制到搜索栏中,也没有任何结果。

我的期望:

  1. 如果您复制整个 URL,无论是否是阿拉伯语,该特定文档必须显示
  2. 搜索结果应该是非编码形式

有没有我错过的设置?

0 投票
0 回答
1251 浏览

drive - 如何查看保存在 Google Drive 中的 readme.md 文件

我已将来自 GitHub 的 readme.md 文件作为 webarchive 文件保存在 Google 驱动器中。我打算把它分享给其他人。上传后,我无法打开它。说没有可用的预览。我也没有看到任何连接的应用程序。有什么建议么。

0 投票
1 回答
131 浏览

evernote - 有没有办法在 Evernote iOS SDK 中将笔记转换为 HTML 文件

我开发了一个混合应用程序,我想在我的应用程序中显示 Evernote 内容。为此,我使用了一个标签并使用 iframe 来加载 evernote html 内容。 混合应用和 iframe 区域

它适用于Android平台。我可以使用 Evernote Android SDK 将笔记下载为 html 文件,然后使用 iframe 加载它。

但是在iOS平台,印象笔记iOS SDK生成的笔记内容是一个.webarchive文件,我尝试在iframe中加载这个.webarchive,但是没有成功。

所以,我想知道是否可以使用 iOS SDK 下载 Html 文件?帮助将不胜感激:D

0 投票
0 回答
25 浏览

web - 我如何证明某个 http 资源在特定时间存在于服务器中?(存在证明/POE)

我正在研究一种简单地保存网页的warcmhtml格式的网络归档技术。需要身份验证的受保护/私有内容在客户端存档,容易被篡改,这使得它们无法用于合法许可。

所以我提出了一个解决方案来创建一个mitmproxy服务器来拦截流量并对内容进行哈希处理并使用 EC 密钥对其进行签名并将其添加到标头中。这样任何人都可以通过验证标头中的签名来验证存档。代理服务器将充当受信任的签名机构,不依赖于客户端。这是正确的方法吗?

是否有任何现有方法可以通过验证标题来证明文档在特定时间存在于服务器中?

我发现 content-md5 标头可以提供文档的摘要,解决了一半的问题,但它不是全球标准,只有一些服务器使用它。还发现 ETag 标头有时可以是内容的散列,但它又不是真正的标准。

0 投票
0 回答
185 浏览

java - 用于将“X-Document-Type: Workbook”转换为 Excel 的 Java 库

我们有一些.xls(HSSF) 格式的遗留数据,我们正在.xlsx使用 Apache POI 库将其转换为 (XSSF) 格式。在我们开始看到很多之前,这一切都运作良好 org.apache.poi.poifs.filesystem.NotOLE2FileException。经过仔细检查,我们意识到引发此异常的文件实际上不是 Excel 文件(尽管具有误导性的.xls扩展名),而是单文件网页文件(网络存档X-Document-Type: Workbook)。


问题)是否有任何将“X-Document-Type:Workbook”转换为 Excel 的开源 Java 库?


附录:@kiwiwings 要求的澄清

不,文件不是“XML 工作簿”格式。它们是带有X-Document-Type: Workbook声明的 MIME 文档。每个部分都是一个标准的 HTML 文件,有自己的表格。

这些文件被赋予了.xls扩展名,并且 Excel 能够打开它们,尽管在发出以下警告之后:

您尝试打开的文件“blah-blah-blah.xls”的格式与文件扩展名指定的格式不同。在打开文件之前,请确认文件没有损坏并且来自受信任的来源。您现在要打开文件吗?

0 投票
1 回答
317 浏览

python - 是否可以在 Python 中将以下奇怪的 .XLS 文件(实际上是某种 HTML/XML 格式)转换为 .XLSX?

对这些 .xls 文件的格式感到非常困惑,因为它们并不是真正的 .xls 文件,我将文件的前几行放在下面以供参考,完整文件在这里

转换正常的 .xls 是没有问题的p.save_book_as(file_name=fname, dest_file_name=fname+'x')

我想用python批量转换为.xlsx,这甚至可以用以下格式吗?

0 投票
0 回答
167 浏览

ios - 保存 WKWebView 的显示状态

我希望能够在用户退出我的应用程序时保存 WKWebView 的状态,并能够将其恢复到用户返回应用程序时的状态。我希望它恢复带有表单的网站、存储计算历史的在线计算器或任何动态生成 Javascript 对象的网站。我怎样才能做到这一点?

我在这里尝试了 createWebArchiveData 方法,但是在保存和恢复 Web 存档版本时,它不会将显示数据恢复原样。当我从网络档案中恢复它时,就像我刚刚刷新了我不想要的页面。

我无法使用任何 HTML5 存储方法或使用任何evaluateJavaScript方法来处理此问题,因为我希望能够保存和恢复我访问的任何网站的状态。