问题标签 [webarchive]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1075 浏览

python - 如何从 warc 文件中读取记录的子集

我正在尝试从Python 中的Common Crawl解析 .warc 文件。

由于文件很大,我想从前几条记录的样本/子集开始。

如何截断文件以仅包含前 X 行,同时保留现有的换行符/回车符?

这是我已经尝试过的:

  1. head -n 250 oldfile > newfile这删除了解析文件所需的一些返回。如果我尝试在我的 Hadoop 作业中使用这个文件(使用warc包读取它),这是我得到的错误:

    /li>
  2. 与 #1 相同,但使用tail命令

  3. 与 #1 相同,但使用tror sedafter 替换任何丢失的换行符或^M(回车符)字符。这会导致warc包仍然抱怨预期的回车或换行符没有到位。
  4. unix2dos oldfile
0 投票
0 回答
570 浏览

android - 将 webarchiev 加载到 WebView 应用程序崩溃后

在尝试为某些网站加载 WebArchievs 后,我收到此错误。

保存 WebArchiev:

加载 WebArchiv:

0 投票
1 回答
279 浏览

java - 使用动态 web 项目类到一个普通的 java 项目中

我有一个 web 项目,我正在编写一个支持 Java 项目(将生成可运行的 jar),它将为我的 web 项目做一些后期处理。

我需要从 web 项目中访问一些类和函数(我不想在支持项目中重写)。

当 Web 应用程序生成 .war 文件而不是 .jar 时,如何将这些类导入我的支持项目?

0 投票
1 回答
1441 浏览

geoserver - 如何使用 apache tomcat 8 部署 geoserver web 存档?

我想web archive在我的tomcat网络服务器中运行 geoserver。我正在使用 tomcat 8。我从geoserver
下载 GeoServer 2.7.1.1 。当我想部署war文件时,出现如下错误: web archive在此处输入图像描述

但是当我部署另一个war应用程序时,它部署正确。

问题出在哪里?

0 投票
0 回答
88 浏览

javascript - D3 svg 元素在 Safari webarchive 中重复

由于特殊原因,我正在处理的项目需要使用 Safari 的 webarchive 功能。我正在使用这支笔的简化版本作为进度条。更简单的代码可以在这里和下面看到。

如果此页面保存为 webarchive,进度条会在其下方复制。如果它是动画的,它下面的“幽灵”是不活动的。我想知道是否有解决方法,所以没有重复。任何更改可见性设置的尝试,例如 hidden 或 display:none 都失败了。

编辑:我现在已经通过使用引导进度条来规避这个问题。

0 投票
1 回答
1157 浏览

html - 以 HTML 格式打开 webarchive 文件

我正在尝试通过 html 网页打开一个网络存档文件,该文件只是下载而不是打开。

我怎样才能让它作为网页打开?

我的代码是;

提前致谢。

0 投票
1 回答
1286 浏览

download - 有没有办法从 Wayback 机器中恢复整个网站?

我的网站文件已损坏并以某种方式丢失了所有备份文件。任何人都可以建议下载整个网站的过程。

它是一个简单的 html 网站。下载后如何托管?请帮忙

0 投票
1 回答
171 浏览

javascript - 如何检测网页是从网站还是本地文件系统运行?

以前有人问过这个问题,但提供的答案都不是正确的。我不允许对原始问题(或答案)发表评论,因此我正在创建一个向我建议的新问题。

如何检测网页是从网站还是本地文件系统运行

我需要检测用户是否通过 Safari Web Archive 或通过正确的 Web url 访问了特定页面。

链接问题的答案均​​不适用于 Safari 网络档案。接受的答案是这样的:

但是,出于某种原因,Safari webarchive 文件的行为似乎就像在服务器上远程访问它们一样。在测试位置协议时,它总是返回 http,而不是 file://

safari webarchive 中唯一不同的似乎是文件本身的 mimetype,即“application/x-webarchive” 但似乎没有可靠的方法来检测当前页面的 mime 类型。

我很想找到一个合适的解决方案来从远程访问的页面中检测本地页面。

0 投票
1 回答
281 浏览

safari - 如何在 Mac 上从 RStudio 编织 HTML 文件?

我教一门数据科学课,让学生在 R markdown 中输入笔记和作业。从那里,RStudio 通常将文档编织成 HTML 文件。我更喜欢让学生上交那些易于阅读的 HTML 文件进行评分。但是,我的一些学生正在使用 Safari 和 Mac 书籍。他们的软件默认编织成更高级的.webarchive文件。我们如何获取.html文件?

0 投票
0 回答
76 浏览

cocoa - 放置在我的沙盒应用程序文件夹中的 Webarchive (Safari) 文件已损坏。我需要什么权限?

现在这是一个有趣的案例。您将 Safari 中的 webarchive 文件保存到桌面。它工作正常,Safari 可以打开它。没问题。

如果您将此 webarchive 拖放到我的应用程序中,该文件将被移动到我的应用程序的容器文件夹中FSMoveObjectAsync。之后,webarchive 将无法打开,因为“......它已损坏且无法打开”。将文件移回无济于事。看起来 macOS 安全系统已将其放入隔离区。

现在棘手的部分是没有问题,如果我在非沙盒模式下运行。在沙盒中,网络存档会损坏。

没有其他文件类型受此影响。只有网络档案。

似乎我的应用程序缺少一些能够处理网络存档的沙盒权利。但我不知道是哪一个。

尝试打开“隔离”网络存档时,控制台显示以下消息:


需要帮忙。