Apache Flume-구성

Flume을 설치 한 후에는 Java 속성 파일 인 구성 파일을 사용하여 구성해야합니다. key-value pairs. 파일의 키에 값을 전달해야합니다.

Flume 구성 파일에서 다음을 수행해야합니다.

  • 현재 에이전트의 구성 요소 이름을 지정합니다.
  • 소스를 설명 / 구성합니다.
  • 싱크를 설명 / 구성합니다.
  • 채널을 설명 / 구성합니다.
  • 소스와 싱크를 채널에 바인딩합니다.

일반적으로 Flume에는 여러 에이전트가있을 수 있습니다. 고유 한 이름을 사용하여 각 에이전트를 구별 할 수 있습니다. 그리고이 이름을 사용하여 각 에이전트를 구성해야합니다.

구성 요소 이름 지정

먼저 아래와 같이 에이전트의 소스, 싱크 및 채널과 같은 구성 요소의 이름을 지정하고 나열해야합니다.

agent_name.sources = source_name 
agent_name.sinks = sink_name 
agent_name.channels = channel_name

Flume은 다양한 소스, 싱크 및 채널을 지원합니다. 아래 표에 나열되어 있습니다.

출처 채널 싱크
  • Avro 소스
  • 중고품 소스
  • Exec 소스
  • JMS 소스
  • 스풀링 디렉토리 소스
  • Twitter 1 % firehose 소스
  • Kafka 소스
  • NetCat 소스
  • 시퀀스 생성기 소스
  • Syslog 소스
  • Syslog TCP 소스
  • 멀티 포트 Syslog TCP 소스
  • Syslog UDP 소스
  • HTTP 소스
  • 스트레스 소스
  • 레거시 소스
  • 중고품 레거시 소스
  • 맞춤 소스
  • 스크라이브 소스
  • 메모리 채널
  • JDBC 채널
  • Kafka 채널
  • 파일 채널
  • 유출 가능한 메모리 채널
  • 의사 트랜잭션 채널
  • HDFS 싱크
  • 하이브 싱크
  • 로거 싱크
  • Avro 싱크
  • 중고품 싱크
  • IRC 싱크
  • 파일 롤 싱크
  • 널 싱크
  • HBaseSink
  • AsyncHBaseSink
  • MorphlineSolrSink
  • ElasticSearchSink
  • 카이트 데이터 셋 싱크
  • 카프카 싱크

그들 중 하나를 사용할 수 있습니다. 예를 들어 트위터 소스를 사용하여 메모리 채널을 통해 HDFS 싱크로 트위터 데이터를 전송하고 에이전트 이름 ID를TwitterAgent, 다음

TwitterAgent.sources = Twitter 
TwitterAgent.channels = MemChannel 
TwitterAgent.sinks = HDFS

에이전트의 구성 요소를 나열한 후 해당 속성에 값을 제공하여 소스, 싱크 및 채널을 설명해야합니다.

출처 설명

각 소스에는 별도의 속성 목록이 있습니다. "type"이라는 속성은 모든 소스에 공통이며 사용중인 소스의 유형을 지정하는 데 사용됩니다.

속성 "유형"과 함께 모든 값을 제공해야합니다. required 아래와 같이 특정 소스의 속성을 구성합니다.

agent_name.sources. source_name.type = value 
agent_name.sources. source_name.property2 = value 
agent_name.sources. source_name.property3 = value

예를 들어, 우리가 twitter source, 다음은 구성하기 위해 값을 제공 해야하는 속성 입니다.

TwitterAgent.sources.Twitter.type = Twitter (type name) 
TwitterAgent.sources.Twitter.consumerKey =  
TwitterAgent.sources.Twitter.consumerSecret = 
TwitterAgent.sources.Twitter.accessToken =   
TwitterAgent.sources.Twitter.accessTokenSecret =

싱크 설명

소스와 마찬가지로 각 싱크에는 별도의 속성 목록이 있습니다. "type"이라는 속성은 모든 싱크에 공통적이며 사용중인 싱크의 유형을 지정하는 데 사용됩니다. 속성 "유형"과 함께 모든 항목에 값을 제공해야합니다.required 구성 할 특정 싱크의 속성.

agent_name.sinks. sink_name.type = value 
agent_name.sinks. sink_name.property2 = value 
agent_name.sinks. sink_name.property3 = value

예를 들어 HDFS sink, 다음은 구성하기 위해 값을 제공 해야하는 속성 입니다.

TwitterAgent.sinks.HDFS.type = hdfs (type name)  
TwitterAgent.sinks.HDFS.hdfs.path = HDFS directory’s Path to store the data

채널 설명

Flume은 소스와 싱크간에 데이터를 전송할 수있는 다양한 채널을 제공합니다. 따라서 소스 및 채널과 함께 에이전트에서 사용하는 채널을 설명 할 필요가 있습니다.

각 채널을 설명하려면 아래와 같이 필수 속성을 설정해야합니다.

agent_name.channels.channel_name.type = value 
agent_name.channels.channel_name. property2 = value 
agent_name.channels.channel_name. property3 = value

예를 들어 memory channel, 다음은 구성하기 위해 값을 제공 해야하는 속성 입니다.

TwitterAgent.channels.MemChannel.type = memory (type name)

소스와 싱크를 채널에 바인딩

채널은 소스와 싱크를 연결하기 때문에 아래와 같이 두 채널을 모두 채널에 바인딩해야합니다.

agent_name.sources.source_name.channels = channel_name 
agent_name.sinks.sink_name.channels = channel_name

다음 예에서는 소스와 싱크를 채널에 바인딩하는 방법을 보여줍니다. 여기서 우리는twitter source, memory channel,HDFS sink.

TwitterAgent.sources.Twitter.channels = MemChannel
TwitterAgent.sinks.HDFS.channels = MemChannel

Flume 에이전트 시작

구성 후 Flume 에이전트를 시작해야합니다. 다음과 같이 수행됩니다-

$ bin/flume-ng agent --conf ./conf/ -f conf/twitter.conf 
Dflume.root.logger=DEBUG,console -n TwitterAgent

어디서-

  • agent − Flume 에이전트 시작 명령

  • --conf ,-c<conf> − conf 디렉토리의 구성 파일 사용

  • -f<file> − 누락 된 경우 구성 파일 경로를 지정합니다.

  • --name, -n <name> − 트위터 에이전트의 이름

  • -D property =value − 자바 시스템 속성 값을 설정합니다.