Apache NiFi - Основные понятия
Apache NiFi состоит из веб-сервера, контроллера потока и процессора, который работает на виртуальной машине Java. Он также имеет 3 репозитория Flowfile Repository, Content Repository и Provenance Repository, как показано на рисунке ниже.

Репозиторий потоковых файлов
В этом репозитории хранится текущее состояние и атрибуты каждого потокового файла, который проходит через потоки данных apache NiFi. По умолчанию этот репозиторий находится в корневом каталоге apache NiFi. Местоположение этого репозитория можно изменить, изменив свойство с именем «nifi.flowfile.repository.directory».
Репозиторий контента
Этот репозиторий содержит весь контент, присутствующий во всех потоковых файлах NiFi. Его каталог по умолчанию также находится в корневом каталоге NiFi, и его можно изменить с помощью свойства org.apache.nifi.controller.repository.FileSystemRepository. Этот каталог занимает много места на диске, поэтому желательно иметь достаточно места на установочном диске.
Репозиторий Происхождения
Репозиторий отслеживает и хранит все события всех потоковых файлов, которые текут в NiFi. Есть два репозитория происхождения -volatile provenance repository (в этом репозитории все данные о происхождении теряются после перезапуска) и persistent provenance repository. Его каталог по умолчанию также находится в корневом каталоге NiFi, и его можно изменить с помощью свойства org.apache.nifi.provenance.PersistentProvenanceRepository и org.apache.nifi.provenance.VolatileProvenanceRepositor для соответствующих репозиториев.
