0

flink 1.7.2 数据集不支持 kafka sink 吗?

完成批处理操作后,我需要将消息发布到 kafka,这意味着 source 是我的 postgres,sink 是我的 kafka。

是否可以 ?

4

2 回答 2

1

开箱即用:还没有,您必须从一开始就使用数据流,或者如上所述创建自己的自定义输出格式。

然而,有计划在 Flink 2.0 中长期统一 Apache Flink 项目中的 APIDataSet和API: https ://flink.apache.org/roadmap.htmlDataStream

于 2020-05-20T09:40:50.407 回答
1

您可以创建自己的输出格式并使用 Kafka Producer生产到 Kafka。检查下面的代码。

...
data.output(new KafkaOPFormat());
env.execute();
import java.io.IOException;
import java.util.Properties;
import org.apache.flink.api.common.io.RichOutputFormat;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.configuration.Configuration;
import org.apache.kafka.clients.producer.KafkaProducer;
import org.apache.kafka.clients.producer.ProducerRecord;

public class KafkaOPFormat extends RichOutputFormat<Tuple2<String, String>> {

  private final Properties properties = new Properties();
  private KafkaProducer<String, String> producer;

  @Override
  public void configure(Configuration configuration) {
    properties.put("bootstrap.servers", "localhost:9092");
    properties.put("acks", "all");
    properties.put("retries", 0);
    properties.put("batch.size", 16384);
    properties.put("linger.ms", 1);
    properties.put("buffer.memory", 33554432);
    properties.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
    properties.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");
  }

  @Override
  public void open(int i, int i1) throws IOException {
    producer = new KafkaProducer<String, String>(properties);
  }

  @Override
  public void writeRecord(Tuple2<String, String> record) throws IOException {
    producer.send(new ProducerRecord<>(record.f0, record.f1));
  }

  @Override
  public void close() throws IOException {
    producer.close();
  }
}

PS:我不记得所有配置,请检查您的配置并进行相应更改。

于 2020-05-20T09:45:11.203 回答