问题
SNMPD 正确地将 SNMP 轮询请求委托给另一个程序,但该程序的响应无效。具有相同参数的程序的手动运行响应正确。
细节
我已经在服务器上安装了正确的 LSI RAID 驱动程序并想要配置 SNMP。根据说明,我添加了以下内容以/etc/snmp/snmpd.conf
将具有给定 OID 前缀的 SNMP 轮询请求重定向到程序:
pass .1.3.6.1.4.1.3582 /usr/sbin/lsi_mrdsnmpmain
它不适用于 SNMP 轮询请求:
snmpget -v1 -c public localhost .1.3.6.1.4.1.3582.5.1.4.2.1.2.1.32.1
我得到以下回复:
Error in packet
Reason: (noSuchName) There is no such variable name in this MIB.
Failed object: SNMPv2-SMI::enterprises.3582.5.1.4.2.1.2.1.32.1
我试过的
SNMPD 传递两个参数,-g
和<oid>
期望一个三行响应<oid>
,<data-type>
和<data-value>
。
如果我手动运行以下命令:
/usr/sbin/lsi_mrdsnmpmain -g .1.3.6.1.4.1.3582.5.1.4.2.1.2.1.32.0
我正确地得到了正确的三行响应:
.1.3.6.1.4.1.3582.5.1.4.2.1.2.1.32.0
integer
30
这意味着该pass
命令正常工作并且/usr/sbin/lsi_mrdsnmpmain
程序在此示例中正常工作
我尝试用/usr/sbin/lsi_mrdsnmpmain
bash 脚本替换。bash 脚本委托调用并记录所提供的参数和委托调用的输出:
#!/bin/bash
echo "In: '$@" > /var/log/snmp-pass-test
RETURN=$(/usr/sbin/lsi_mrdsnmpmain $@)
echo "$RETURN"
echo "Out: '$RETURN'" >> /var/log/snmp-pass-test
并修改pass
命令以重定向到 bash 脚本。如果我手动运行 bash 脚本,/usr/sbin/snmp-pass-test -g .1.3.6.1.4.1.3582.5.1.4.2.1.2.1.32.0
我会得到正确的三行响应,就像我/usr/sbin/lsi_mrdsnmpmain
手动运行时一样,我会记录以下内容:
In: '-g .1.3.6.1.4.1.3582.5.1.4.2.1.2.1.32.0
Out: '.1.3.6.1.4.1.3582.5.1.4.2.1.2.1.32.0
integer
30'
当我重新运行snmpget
测试时,我得到了同样的Error in packet...
错误,并且 bash 脚本的日志显示捕获的委托调用输出为空:
In: '-g .1.3.6.1.4.1.3582.5.1.4.2.1.2.1.32.0
Out: ''
如果我将 bash 脚本修改为仅回显一个空行,我也会收到相同的Error in packet...
消息。
我还尝试确保手动调用时存在的环境变量/usr/sbin/lsi_mrdsnmpmain
与 bash 脚本相同,但我得到相同的空输出。
最后,我的问题
- 为什么 bash 脚本在这两种情况下的行为会有所不同?
- bash 脚本存在的问题是否可能与最初注意到的相同(手动运行的程序与 SNMPD 运行程序的输出不同)?
更新
eewanco 的建议
在每个场景中运行程序的用户是什么?
我添加echo "$(whoami)" > /var/log/snmp-pass-test
到 bash 脚本root
并被添加到日志中
也许尝试在 cron 中执行它
将以下内容添加到 root 的 crontab 并记录正确的三行响应:
* * * * * /usr/sbin/lsi_mrdsnmpmain -g .1.3.6.1.4.1.3582.5.1.4.2.1.2.1.32.1 >> /var/log/snmp-test-cron 2>&1
格里沙·列维特的建议
尝试记录标准错误
没有记录任何错误
检查 /var/log/messages
当我通过 SNMPD 运行它时,我会MegaRAID SNMP AGENT: Error in getting Shared Memory(lsi_mrdsnmpmain)
登录。当我直接运行它时,我没有。我做了一些谷歌搜索,我可能需要安装 lm_sensors;我会试试这个。
我安装了 lm_sensors 和 compat-libstdc++-33.i686(后者是因为它说它是说明中的先决条件,我错过了它),卸载并重新安装了 LSI 驱动程序并遇到了同样的问题。
SELinux
我偶然发现了一个关于使用脚本扩展 snmpd 的页面,它说要检查脚本是否具有正确的 SELinux 上下文。我grep AVC /var/log/audit/audit.log | grep snmp
在运行 a 之前和之后运行,snmpget
并添加了以下条目作为运行的直接结果snmpget
:
type=AVC msg=audit(1485967641.075:271): avc: denied { unix_read unix_write } for pid=5552 comm="lsi_mrdsnmpmain" key=558265 scontext=system_u:system_r:snmpd_t:s0 tcontext=system_u:system_r:initrc_t:s0 tclass=shm
我现在假设SELinux 导致调用失败;我会进一步挖掘......请参阅解决方案的答案。
strace(eewanco 的建议)
尝试使用带和不带 snmp 的 strace,看看是否可以捕获系统调用失败或一些其他提示
为了完整起见,我想看看 strace 是否暗示 SELinux 正在否认。我不得不删除semodule -r <policy-package-name>
用于重新引入问题的策略包,然后运行以下命令:
strace snmpget -v1 -c public localhost .1.3.6.1.4.1.3582.5.1.4.2.1.2.1.32.1 >> strace.log 2>&1
结尾strace.log
如下,除非我遗漏了什么,否则它似乎没有提供任何提示:
...
sendmsg(3, {msg_name(16)={sa_family=AF_INET, sin_port=htons(161), sin_addr=inet_addr("127.0.0.1")}, msg_iov(1)= [{"0;\2\1\0\4\20public\240$\2\4I\264-m\2"..., 61}], msg_controllen=32, {cmsg_len=28, cmsg_level=SOL_IP, cmsg_type=, ...}, msg_flags=0}, MSG_DONTWAIT|MSG_NOSIGNAL) = 61
select(4, [3], NULL, NULL, {0, 999997}) = 1 (in [3], left {0, 998475})
brk(0xab9000) = 0xab9000
recvmsg(3, {msg_name(16)={sa_family=AF_INET, sin_port=htons(161), sin_addr=inet_addr("127.0.0.1")}, msg_iov(1)= [{"0;\2\1\0\4\20public\242$\2\4I\264-m\2"..., 65536}], msg_controllen=0, msg_flags=0}, MSG_DONTWAIT) = 61
write(2, "Error in packet\nReason: (noSuchN"..., 81Error in packet
Reason: (noSuchName) There is no such variable name in this MIB.
) = 81
write(2, "Failed object: ", 15Failed object: ) = 15
write(2, "SNMPv2-SMI::enterprises.3582.5.1"..., 48SNMPv2- SMI::enterprises.3582.5.1.4.2.1.2.1.32.1
) = 48
write(2, "\n", 1
) = 1
brk(0xaa9000) = 0xaa9000
close(3) = 0
exit_group(2) = ?
+++ exited with 2 +++