0

使用 sriov 网络创建 pod 时遇到以下问题。当我看到设备驱动程序的输出使用

$**dmesg** 
*mlx5_core 0000:b5:00.0: mlx5_cmd_check:772:(pid 5271): CREATE_SQ(0x904) op_mod(0x0) failed, status bad parameter(0x3), syndrome (0xd61c0b)*

与硬件通信似乎有些问题。下面列出的系统详细信息:

PCI:  b5:00.0 Ethernet controller: Mellanox Technologies MT28841
Driver: mlx5_core (5.0-0.0)
Card: ConnectX-6 Dx
OS version: Ubuntu 18.04.6 LTS
Kernel: Linux 5.4.0-89-generic
Architecture: x86-64

以下是网络yaml: 在此处输入图像描述

豆荚yaml:

apiVersion: v1
kind: Pod
metadata:
  name: mellonox-test-pod
  annotations:
    k8s.v1.cni.cncf.io/networks: sriov-rdma-net1
spec:
  containers:
  - name: mellonox-alpine
    image: alpine
    imagePullPolicy: Never
    command: [ "/bin/bash", "-c", "--" ]
    args: [ "while true; do sleep 300000; done;" ]
    resources:
      requests:
        mellanox.com/mlnx_sriov_rdma: '1'
      limits:
        mellanox.com/mlnx_sriov_rdma: '1' 

pod创建结果:

$kubectl describe pod mellonox-test-pod
`"error bringing interface up in container ns: \"invalid argument\""`

之后,当我看到设备驱动程序输出时,遇到了这个问题*mlx5_core 0000:b5:00.0: mlx5_cmd_check:772:(pid 5271): CREATE_SQ(0x904) op_mod(0x0) failed, status bad parameter(0x3), syndrome (0xd61c0b)*.

很高兴获得任何帮助。提前致谢。

4

1 回答 1

0

您可以尝试在网络注释中更具体吗?似乎与命名空间有关,添加 metadata.namespace=target_namespace。

请注意,Pod 规范和 SriovNetowrk CR 中的 target_namespace 需要相同。

干杯。

于 2021-11-17T18:23:32.347 回答