你可以使用这样的东西,我刚刚创建了一个函数,它使用一些用户输入来实现 AWS 开发工具包库。该示例根据以下代码中的 InitialVariantWeight 参数以 1:1 的比例拆分模型 1 和模型 2 的流量。SageMaker 库的详细信息可在此处获得:https ://boto3.readthedocs.io/en/latest/reference/services/sagemaker.html
def custom_create_endpoint_config(model1,model2,endpoint_config_name,instancetype= 'm1.t2.medium'):
response = client.create_endpoint_config(
EndpointConfigName=endpoint_config_name,
ProductionVariants= [
{
'VariantName': 'variant1',
'ModelName': model1,
'InitialInstanceCount': 1,
'InstanceType': instancetype,
'InitialVariantWeight': 1
},
{
'VariantName': 'variant2',
'ModelName': model2,
'InitialInstanceCount': 1,
'InstanceType': instancetype,
'InitialVariantWeight': 1
},],
Tags=[
{
'Key': str(endpoint_config_name +'_key'),
'Value': str(endpoint_config_value +'_value')
},]
)
def custom_delete_endpoint_config(endpoint_config_name):
client.delete_endpoint_config(\
EndpointConfigName=config_name)