0

我正在学习spring cloud dataflow的概念,想知道存储全局资源的常用方法是什么。

例如,当我有一个带有pmml 处理器的流时,我想通过 spring-cloud-task 定期重新训练底层 pmml 模型。

我将在哪里存储模型,以便处理器可以将其用作(只读)资源并由任务每晚更新?spring cloud dataflow中是否有全局存储的概念?我应该只使用 spring-cloud 之外的传统数据库还是有更好的方法?

4

2 回答 2

3

Spring Cloud Data Flow 本身没有共享存储的一般概念,但Resource用于为 PMML 处理器提供模型的 Spring 非常灵活(参见http://docs.spring.io/spring/docs/current/spring- framework-reference/html/resources.html,特别是表 8.1 中的一些可用于pmml.model-location参数的路径选项)。所以有几个开箱即用的选项:

  • 使用共享文件系统(然后可以通过file://协议访问);
  • 将模型存储在可通过 HTTP 用作静态资源的可访问位置;

S3(通过https://cloud.spring.io/spring-cloud-aws/)和 HDFS(通过 Spring for Apache Hadoop - 请参阅http://docs .spring.io/spring-hadoop/docs/current/reference/htmlsingle/#using-hdfs-resource-loader)。

于 2017-03-04T20:16:16.417 回答
0

我有一个类似的问题,我最终用这个来解决它

https://docs.spring.io/spring/docs/current/spring-framework-reference/core.html#resources-resourceloader

groovy-transform --script=file:///root/apps/script.groovy

谢谢马里乌斯·博戈耶维奇。

于 2018-11-08T10:56:55.190 回答