ApacheFlume-構成

Flumeをインストールした後、Javaプロパティファイルである構成ファイルを使用して構成する必要があります。 key-value pairs。ファイル内のキーに値を渡す必要があります。

Flume構成ファイルでは、次のことを行う必要があります。

  • 現在のエージェントのコンポーネントに名前を付けます。
  • ソースを説明/構成します。
  • シンクの説明/構成。
  • チャネルを説明/構成します。
  • ソースとシンクをチャネルにバインドします。

通常、Flumeには複数のエージェントを含めることができます。一意の名前を使用して、各エージェントを区別できます。そして、この名前を使用して、各エージェントを構成する必要があります。

コンポーネントの命名

まず、以下に示すように、エージェントのソース、シンク、チャネルなどのコンポーネントに名前を付けてリストする必要があります。

agent_name.sources = source_name 
agent_name.sinks = sink_name 
agent_name.channels = channel_name

Flumeは、さまざまなソース、シンク、およびチャネルをサポートします。それらは以下の表にリストされています。

ソース チャンネル シンク
  • アブロソース
  • スリフトソース
  • Execソース
  • JMSソース
  • スプーリングディレクトリソース
  • Twitter 1%消防ホース出典
  • カフカソース
  • NetCatソース
  • シーケンスジェネレータソース
  • Syslogソース
  • SyslogTCPソース
  • マルチポートSyslogTCPソース
  • SyslogUDPソース
  • HTTPソース
  • ストレス源
  • レガシーソース
  • スリフトレガシーソース
  • カスタムソース
  • スクライブソース
  • メモリチャネル
  • JDBCチャネル
  • カフカチャンネル
  • ファイルチャネル
  • こぼれるメモリチャネル
  • 疑似トランザクションチャネル
  • HDFSシンク
  • ハイブシンク
  • ロガーシンク
  • アブロシンク
  • スリフトシンク
  • IRCシンク
  • ファイルロールシンク
  • ヌルシンク
  • HBaseSink
  • AsyncHBaseSink
  • MorphlineSolrSink
  • ElasticSearchSink
  • Kiteデータセットシンク
  • カフカシンク

あなたはそれらのどれでも使うことができます。たとえば、Twitterソースを使用してメモリチャネルを介してHDFSシンクにTwitterデータを転送している場合、エージェント名IDはTwitterAgent、その後

TwitterAgent.sources = Twitter 
TwitterAgent.channels = MemChannel 
TwitterAgent.sinks = HDFS

エージェントのコンポーネントを一覧表示した後、プロパティに値を指定して、ソース、シンク、およびチャネルを説明する必要があります。

ソースの説明

各ソースには、プロパティの個別のリストがあります。「type」という名前のプロパティはすべてのソースに共通であり、使用しているソースのタイプを指定するために使用されます。

プロパティ「type」とともに、すべての値を提供する必要があります required 以下に示すように、特定のソースのプロパティを構成します。

agent_name.sources. source_name.type = value 
agent_name.sources. source_name.property2 = value 
agent_name.sources. source_name.property3 = value

たとえば、 twitter source、以下は、それを構成するために値を提供する必要があるプロパティです。

TwitterAgent.sources.Twitter.type = Twitter (type name) 
TwitterAgent.sources.Twitter.consumerKey =  
TwitterAgent.sources.Twitter.consumerSecret = 
TwitterAgent.sources.Twitter.accessToken =   
TwitterAgent.sources.Twitter.accessTokenSecret =

シンクの説明

ソースと同様に、各シンクには個別のプロパティのリストがあります。「type」という名前のプロパティはすべてのシンクに共通であり、使用しているシンクのタイプを指定するために使用されます。プロパティ「type」とともに、すべてのに値を提供する必要がありますrequired 以下に示すように、特定のシンクのプロパティを構成します。

agent_name.sinks. sink_name.type = value 
agent_name.sinks. sink_name.property2 = value 
agent_name.sinks. sink_name.property3 = value

たとえば、 HDFS sink、以下は、それを構成するために値を提供する必要があるプロパティです。

TwitterAgent.sinks.HDFS.type = hdfs (type name)  
TwitterAgent.sinks.HDFS.hdfs.path = HDFS directory’s Path to store the data

チャネルの説明

Flumeは、ソースとシンク間でデータを転送するためのさまざまなチャネルを提供します。したがって、ソースとチャネルとともに、エージェントで使用されるチャネルを記述する必要があります。

各チャネルを説明するには、以下に示すように、必要なプロパティを設定する必要があります。

agent_name.channels.channel_name.type = value 
agent_name.channels.channel_name. property2 = value 
agent_name.channels.channel_name. property3 = value

たとえば、 memory channel、以下は、それを構成するために値を提供する必要があるプロパティです。

TwitterAgent.channels.MemChannel.type = memory (type name)

ソースとシンクをチャネルにバインドする

チャネルはソースとシンクを接続するため、以下に示すように、両方をチャネルにバインドする必要があります。

agent_name.sources.source_name.channels = channel_name 
agent_name.sinks.sink_name.channels = channel_name

次の例は、ソースとシンクをチャネルにバインドする方法を示しています。ここでは、twitter source, memory channel, そして HDFS sink

TwitterAgent.sources.Twitter.channels = MemChannel
TwitterAgent.sinks.HDFS.channels = MemChannel

Flumeエージェントの開始

構成後、Flumeエージェントを起動する必要があります。それは次のように行われます-

$ bin/flume-ng agent --conf ./conf/ -f conf/twitter.conf 
Dflume.root.logger=DEBUG,console -n TwitterAgent

ここで−

  • agent −Flumeエージェントを開始するコマンド

  • --conf ,-c<conf> −confディレクトリの設定ファイルを使用する

  • -f<file> −欠落している場合は、構成ファイルのパスを指定します

  • --name, -n <name> −Twitterエージェントの名前

  • -D property =value −Javaシステムのプロパティ値を設定します。