问题标签 [disaster-recovery]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1249 浏览

backup - Xen 虚拟机的良好备份解决方案?

我们正在为我们的 xen 服务器寻找满足以下要求的备份解决方案:

  1. 在机器运行时进行备份
  2. 在发生灾难时,无需依赖复杂的基础架构即可轻松使用灾难恢复
  3. 可以备份各种linux和windows机器
  4. 如果某些东西不起作用,则发送某种消息。我们不想手动监控一切

我们尝试了 Acronis Backup & Recovery 10 虚拟版,但它与 linux vms 不兼容。据我们所知,Bacula 似乎没有很好的灾难恢复功能。

我的问题:有什么好的备份解决方案可以满足我们的要求?

提前感谢您的回答。

干杯

阿恩

0 投票
3 回答
1246 浏览

sql - 如果我的连接中断,请运行 SQL 命令?(SQL 服务器)

这是我假设的程序产生的事件序列......

  1. 打开与服务器的连接。
  2. 运行更新命令。
  3. 去做一些可能需要大量时间的事情。
  4. 运行另一个 UPDATE 以反转步骤 2 中的更改。
  5. 关闭连接。

但是哦,不!在第 3 步中,运行该程序的机器确实爆炸了。查询同一数据库的其他机器现在会认为爆炸的机器仍在工作并做某事。

我想做的就是在打开连接时,但在进行任何更改之前,告诉服务器无论出于何种原因,该连接是否应该关闭,以运行一些 SQL。这样,我可以确定如果出现问题,关闭更新将运行。

(为了抢占答案,我不是在寻找表/记录锁或事务。我不是在这里做资源声明。)

非常感谢,比尔PG。

0 投票
3 回答
8918 浏览

git - 仅从对象中恢复 Git 存储库

我有一个 Windows 框,它已将其删除大部分 Git 存储库(必须触发重要工作检测器;)。我剩下的(我能找到的)就是对象。我也不确定对象的集合有多完整。是否可以仅从对象中恢复事物?据我所知,对象树是完整的。所有的包装和松散的物品都已到位;我只是没有说服 Git 的元数据。

0 投票
1 回答
24914 浏览

sql - T-SQL 复制登录名、用户、角色、权限等

我们已将日志传送作为数据库灾难恢复解决方案实施,并且想知道是否有一种方法可以使用 T-SQL 将所有登录名、用户、角色权限等脚本写入辅助服务器上的主数据库,以便 T- SQL 可以作为 SQL 作业运行吗?

我的目标是,在发生 D/R 情况时,我们可以简单地将每个数据库的事务日志恢复到辅助服务器,而不必担心孤立用户等。

谢谢你的帮助!

0 投票
2 回答
67 浏览

.net - 实施恢复模式的策略

我有一个 Windows 应用程序,如果它失败了,我想默认为“恢复模式”,它在失败后第一次运行。

我可以标记错误以及用户可以执行的不同操作来恢复,但恢复模式实用程序的实际启动让我很头疼。我有几个想法,但我希望其他人可能会遇到更好的方法。

1)当主应用程序加载它做的第一件事时,如果检查以前的错误,然后启动恢复模式实用程序。

这样做的问题是,如果应用程序有任何问题(很可能),那么它根本不会启动。

2)让用户启动一个实用程序来检查以前的错误,而不是主应用程序,然后启动主应用程序或进入恢复模式。

这解决了第一个想法的问题,但是目标机器非常锁定并且可能存在部署问题。

还有其他实现恢复模式的策略吗?

谢谢

0 投票
1 回答
206 浏览

algorithm - 事件链分析和推理

我的老板说客户不能接受当前状态的日志。如果出现故障,设备的十几个不同模块会报告它们自己的错误,并且它们都会记录在日志中。故障的原始原因可能隐藏在列表中间的某个地方,可能不会出现在列表中(考虑到模块损坏太大而无法报告),或者在其他所有内容完成报告原始故障导致的问题之后才出现。无论如何,除了系统开发人员之外,很少有人能够正确解释日志并得出实际发生的情况。

我目前的任务是编写一个模块来进行客户友好的故障报告。也就是说,收集过去约 3 秒内报告的所有事件(大约是故障发生的起源和最后产生的后遗症之间的最大间隔),对这些数据进行一些神奇的处理,然后得出一条清晰、友好的路线,什么是坏的,需要修复。

问题是神奇的部分:如何在给定大量故障报告的情况下找出故障的原始来源。没有简单的因果列表。只有经常发生的事件链显示出某些规律性。

例子:

  • 检测到短路,导致限制操作模式,限制操作不排除故障,因此紧急状态升级,总输出功率断开。
  • 安全线被启用。没有模块报告在它被接合后的 3 秒内接合它,因此将“未知来源或干扰”归结为系统停止的原因。
  • 大多数输出​​模块报告没有输出电压。大约1s后,电源监控模块报告power out,这是原来的原因。
  • 输出模块在其所有输出线路中均未报告输出电压。电源模块无报告。原因是电源线与模块断开。
  • 输出模块报告其输出线路之一没有输出电压。未报告其他故障。原因是保险丝烧毁。
  • 输出模块没有报告应用收到的状态。不久之后,控制模块报告了非法状态或输出线,(由于输出模块确实没有及时更新状态。)原因是输出模块(引入故障),而不是控制模块(停止了故障)。系统由于检测到故障)。
  • 输入模块故障将设备切换到备用故障安全模式。迄今为止未使用的有故障的输出模块进入此模式,并且故障模式升级为严重。最初的原因不是输入,它允许报告有关故障的误报,而是中断的备份输出导致操作中止。
  • 在最后 2 秒内,输出模块没有任何类型的活动。这意味着它已损坏,必须进入故障模式。

对于什么导致什么,没有完整的规则列表。这些规则将随着新类型的故障“在野外”发生并被诊断​​和修复而添加。其中一些是启发式的——如果这个错误伴随着这些错误,那么很可能是这个错误。有些故障将无法解决 - 一个平淡无奇的模块报告列表就足够了。有些答案会模棱两可,一组症状可能表明两种不同的故障。这更像是“尽力而为”,而不是“有保证的解决方案”。

现在对于(过于笼统和模糊的)问题:如何解决这个问题?这类问题是否有特定的算法、方法或通用解决方案?如何编写通用规则集并与之匹配?如何进行软匹配?(比如说,一个输入模块在紧急停止过程中损坏了,这是一个完全不相关的事件,可以忽略。)请帮忙?

0 投票
2 回答
1345 浏览

node.js - node.js 是单进程服务器吗?

node.js 是一个进程服务器,还是可以模拟 Apache 的一堆子进程,每个子进程都服务于不同的请求,并且每个子进程都相互独立(以及子进程的循环以避免长期内存泄漏)。
使用 node.js 时是否需要它?

0 投票
1 回答
7660 浏览

sql - 是否可以在没有备份的情况下在 postgres 中恢复表

是否可以在没有任何备份的情况下做到这一点?我需要反转一个命令。

0 投票
1 回答
184 浏览

architecture - 重构架构之前的灾难恢复计划

我主要要为客户设计一个备份和恢复计划,但另一个职责是使系统在故障转移和负载平衡方面可靠,这将使我改变系统架构。

我主要认为应该更好地设计一个应用重构系统后的备份和恢复计划,我的意思是,立即设计重构后的备份和恢复计划。

我觉得如果提前这样做会很头疼。

您认为在应用 DR 计划之前建议我的客户重构系统是个好主意吗?

你愿意吗?

谢谢

0 投票
2 回答
2413 浏览

amazon-s3 - 从 S3 下载大量文件

我想为包含约 200 万个文件的 s3 存储桶设置灾难恢复副本。

这不必自动化,因为我们相信 Amazon 对高可靠性的承诺,我们已启用版本控制并设置 MFA 以删除存储桶本身。

所以我只想定期下载(手动)存储桶的内容以保持离线副本。

我尝试了一些 S3 客户端,但大多数在处理如此大的文件夹时都会挂起。

是否有适合这项工作的工具,或者我们是否必须求助于亚马逊的数据导出服务(每次需要离线备份时,我们都必须向他们发送 USB 驱动器)。

提前感谢您的建议!