1

我将 Python 脚本作为子进程运行,使用 Nodejs 生成。

在本地运行时,或者在本地使用 Docker/Kubernetes 安装时,它按预期工作并完成脚本中的所有功能。在 Kubernetes Azure 中运行容器时,脚本会在不到 1 小时的时间内静默停止/失败,不会记录任何异常或错误。

内存和 CPU 使用率保持在最大 30% 以下,容器作为一个整体不会失败。运行时,ps -fA | grep python我可以看到脚本在生成后正在运行。脚本在失败/静默停止后不再显示。Nodejs 中用于生成的进程的“退出”和“关闭”事件不会触发。

任何有关如何排除故障的建议将不胜感激。

编辑:Nodejs产生

import {/* inject, */ BindingScope, injectable} from '@loopback/core';

const path = require('path');

const spawn = require('child_process').spawn;

@injectable({scope: BindingScope.TRANSIENT})
export class PythonService {
  constructor() {} 
  stopPython(valuationId) {}

  executePython(id: string) {
    const filepath = path.resolve(process.env.PY_PATH);

    const ls = spawn('python', [filepath, id]);

    ls.stdout.on('data', function (data) {
      console.log('stdout: ' + data.toString());
    });

    ls.stderr.on('data', function (data) {
      console.log('stderr: ' + data.toString());
    });

    ls.error.on('error', function (data) {
      console.log('error: ' + data.toString());
    });

    ls.on('exit', function (code) {
      console.log('child process exited with code ' + code.toString());
    });

    ls.on('close', code => {
      console.log(`child process exited with code ${code}`);
    });
  }
}

编辑:Dockerfile

# Pull base image
FROM python:3.7-slim

# Set installation environment variables
ENV PYTHONDONTWRITEBYTECODE=1
ENV PYTHONUNBUFFERED=1
ENV NODE_VERSION=12.20.0

# Install NVM for later use to install Node and NPM
RUN apt-get update && apt install -y curl
RUN curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.39.0/install.sh | bash
ENV NVM_DIR=/root/.nvm
RUN . "$NVM_DIR/nvm.sh" && nvm install ${NODE_VERSION}
RUN . "$NVM_DIR/nvm.sh" && nvm use v${NODE_VERSION}
RUN . "$NVM_DIR/nvm.sh" && nvm alias default v${NODE_VERSION}
ENV PATH="/root/.nvm/versions/node/v${NODE_VERSION}/bin/:${PATH}"

# Create app directory (with user `node`)
RUN mkdir -p /home/node/app

# Set work directory
WORKDIR /home/node/app

# Install python dependencies
COPY  requirements.txt /home/node/app/
RUN pip install -r requirements.txt
RUN pip install swifter

# Install node app dependencies
# A wildcard is used to ensure both package.json AND package-lock.json are copied
# where available (npm@5+)
COPY  package*.json ./
RUN npm install

# Bundle app source code
COPY . .

# Build node app
RUN  npm run build

# Expose ports
EXPOSE ${DB_PORT}
EXPOSE ${API_PORT}
EXPOSE ${SOCKET_PORT}

CMD [ "node", "." ]

Python v 3.7.11 Nodejs v 12.20

4

1 回答 1

0

由于内存使用率高,Unix 正在杀死 Python 进程,我能够通过使用 ssh 进入 pod,然后使用dmesg杀死日志并ps aux --sort -pmem查看 pod 中的内存使用情况,在系统日志中找到 OOM 错误。

OOM 的原因是分配给 Nodejs 的默认内存远高于正常的 2GB 限制,这减少了 Python 的可用内存。减少 Nodejs 内存分配或删除独占的 Nodejs 内存分配可以解决该问题。

于 2022-02-16T12:14:13.623 回答