我在一个分为两组的 IT 部门工作。一组开发和管理应用程序,另一组管理公司的基础设施和服务器。我们面临的问题之一是沟通中断。我为应用程序组工作,我遇到的问题之一是当服务器被基础设施关闭或正在刷新数据库时没有收到通知。
有没有人对如何改善两组之间的通信有任何建议,或者对如何在多个系统(Linux 和 Windows)之间保持轻量级日志有任何想法?理想情况下,如果我们可以让我们的盒子只是推特他们的状态或其他东西,那就太好了。
谢谢您的帮助,
本
我在一个分为两组的 IT 部门工作。一组开发和管理应用程序,另一组管理公司的基础设施和服务器。我们面临的问题之一是沟通中断。我为应用程序组工作,我遇到的问题之一是当服务器被基础设施关闭或正在刷新数据库时没有收到通知。
有没有人对如何改善两组之间的通信有任何建议,或者对如何在多个系统(Linux 和 Windows)之间保持轻量级日志有任何想法?理想情况下,如果我们可以让我们的盒子只是推特他们的状态或其他东西,那就太好了。
谢谢您的帮助,
本
要传达服务器状态,您可以做的一件事是让我们的基础设施组设置一个像Nagios这样的网络监控系统。这将使您的应用程序组中的每个人都能够获得系统中每个服务器状态的快照视图。当您进行开发时,拥有这种状态是非常宝贵的。
Nagios 为您提供网络监控,但也允许您显示系统中特定服务器的计划停机时间。
你的团队可以做的另一件事是促进与基础设施的沟通,让你的构建系统报告它当前正在使用哪些服务器来构建和测试你的产品。
此外,在两个群体的利益相关者之间建立定期会议可能也是一个好主意。如果你们都在互相交谈,即使每周 15 分钟,您可能会看到像您上面描述的那样的事件会减少很多。
我认为这是变更控制的一个更大问题。
您应该拥有硬件和软件变更控制以及批准流程。
最终,基础设施为您服务——IT 基础设施的目的是运行应用程序。
在我目前的大型财务数据公司中,未经客户端和应用程序组的适当授权,服务器不会被触摸。这似乎是一个巨大的痛苦,但每台服务器的存在都是有原因的——满足特定的业务目标并运行特定的应用程序。基础设施团队根本没有任何借口可以随意改变事物或扰乱服务器。
对关键硬件故障的响应可能是一个例外。
所需的软件和操作系统更新通过计划的维护窗口和批准的更改流程进行处理。
我也喜欢 Nagios 的想法。如果您想设置更多的通信工具,我会推荐像 Drupal 这样的内容管理系统。
我们在内部使用 Drupal 在团队之间进行交流。当一个团队关闭服务器时,他们会在 Drupal 中添加一个事件。我们其他人要么将其作为电子邮件、RSS 项目获取,要么仅通过刷新页面来获取。
实施变更控制流程,为两个组提交、批准和安排变更。这让每个人都知道发生了什么。这个过程可以是轻量级的,也可以是重量级的。