5

我正在尝试运行一项使用简单的变压器罗伯塔模型进行分类的服务。推理脚本/函数本身在测试时按预期工作。当我将它包含在快速 api 中时,它会关闭服务器。

uvicorn==0.11.8
fastapi==0.61.1
simpletransformers==0.51.6
cmd : uvicorn --host 0.0.0.0 --port 5000 src.main:app

@app.get("/article_classify")
def classification(text:str):
    """function to classify article using a deep learning model.
    Returns:
        [type]: [description]
    """

    _,_,result = inference(text)
    return result

错误 :

INFO:     Started server process [8262]
INFO:     Waiting for application startup.
INFO:     Application startup complete.
INFO:     Uvicorn running on http://0.0.0.0:5000 (Press CTRL+C to quit)
INFO:     127.0.0.1:36454 - "GET / HTTP/1.1" 200 OK
INFO:     127.0.0.1:36454 - "GET /favicon.ico HTTP/1.1" 404 Not Found
INFO:     127.0.0.1:36454 - "GET /docs HTTP/1.1" 200 OK
INFO:     127.0.0.1:36454 - "GET /openapi.json HTTP/1.1" 200 OK
before
100%|████████████████████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 17.85it/s]
INFO:     Shutting down
INFO:     Finished server process [8262]

推理脚本:

model_name = "checkpoint-3380-epoch-20"
model = MultiLabelClassificationModel("roberta","src/outputs/"+model_name)
def inference(input_text,model_name="checkpoint-3380-epoch-20"):
    """Function to run inverence on one sample text"""
    #model = MultiLabelClassificationModel("roberta","src/outputs/"+model_name)
    all_tags =[]
    if isinstance(input_text,str):
        print("before")
        result ,output = model.predict([input_text])
        print(result)
        tags=[]
        for idx,each in enumerate(result[0]):
            if each==1:
                tags.append(classes[idx])
        all_tags.append(tags)
    elif isinstance(input_text,list):
        result ,output = model.predict(input_text)
        tags=[]
        for res in result : 
            for idx,each in enumerate(res):
                if each==1:
                    tags.append(classes[idx])
            all_tags.append(tags)

    return result,output,all_tags

更新:尝试使用烧瓶并且服务正在运行,但是当在烧瓶顶部添加 uvicorn 时,它会陷入重启循环。

4

4 回答 4

3

我通过显式使用多处理启动进程池解决了这个问题。

from multiprocessing import set_start_method
from multiprocessing import Process, Manager
try:
    set_start_method('spawn')
except RuntimeError:
    pass
@app.get("/article_classify")
def classification(text:str):
    """function to classify article using a deep learning model.
    Returns:
        [type]: [description]
    """
    manager = Manager()

    return_result = manager.dict()
    # as the inference is failing 
    p = Process(target = inference,args=(text,return_result,))
    p.start()
    p.join()
    # print(return_result)
    result = return_result['all_tags']
    return result
于 2021-01-11T05:48:01.837 回答
0

根据https://github.com/ThilinaRajapakse/simpletransformers/issues/761它与多处理有关。

我设置了 args={'use_multiprocessing': False} 并且 Web 服务器不再关闭。

于 2021-11-25T17:42:44.733 回答
0

我最近遇到了类似的问题。我的情况可能有点不同,但想提供它作为参考。我正在使用需要下载大重量文件的句子转换器,下载过程需要 o(10) 秒。但是,默认的独角兽有一个设置timeout_notify=30。通过阅读源代码,这似乎是导致服务器不断重启的原因,因为下载需要很长时间(接近30秒)。

后来,我使用不同的方式来加快下载速度,然后重新启动问题就消失了。

于 2021-02-08T18:21:20.437 回答
-1

将整个函数放在一个try-except块下并显示输出,以便我们调查真正的问题。

import logging

@app.get("/article_classify")
def classification(text:str):
    """function to classify article using a deep learning model.
    Returns:
        [type]: [description]
    """
    try:
    _,_,result = inference(text)
    except:
        logging.exception("something bad happened")  # automatically print exception info

    return result
于 2021-01-10T11:49:01.497 回答