AVRO - десериализация с использованием парсеров

Как упоминалось ранее, можно прочитать схему Avro в программе либо путем создания класса, соответствующего схеме, либо с помощью библиотеки парсеров. В Avro данные всегда хранятся с соответствующей схемой. Следовательно, мы всегда можем прочитать номерное изделие без генерации кода.

В этой главе описывается, как читать схему using parsers library а также Deserializing данные с помощью Avro.

Десериализация с использованием библиотеки парсеров

Сериализованные данные хранятся в файле mydata.txt. Вы можете десериализовать и прочитать его с помощью Avro.

Следуйте приведенной ниже процедуре, чтобы десериализовать сериализованные данные из файла.

Шаг 1

Прежде всего, прочтите схему из файла. Для этого используйтеSchema.Parserкласс. Этот класс предоставляет методы для анализа схемы в разных форматах.

Создайте экземпляр Schema.Parser class, передав путь к файлу, в котором хранится схема.

Schema schema = new Schema.Parser().parse(new File("/path/to/emp.avsc"));

Шаг 2

Создать объект DatumReader интерфейс с использованием SpecificDatumReader класс.

DatumReader<emp>empDatumReader = new SpecificDatumReader<emp>(emp.class);

Шаг 3

Создать экземпляр DataFileReaderкласс. Этот класс читает сериализованные данные из файла. Это требуетDatumReader объект и путь к файлу, в котором существуют сериализованные данные, в качестве параметров для конструктора.

DataFileReader<GenericRecord> dataFileReader = new DataFileReader<GenericRecord>(new File("/path/to/mydata.txt"), datumReader);

Шаг 4

Распечатайте десериализованные данные, используя методы DataFileReader.

  • В hasNext() метод возвращает логическое значение, если в Reader есть какие-либо элементы.

  • В next() метод DataFileReader возвращает данные в Читателе.

while(dataFileReader.hasNext()){

   em=dataFileReader.next(em);
   System.out.println(em);
}

Пример - десериализация с использованием библиотеки парсеров

Следующая полная программа показывает, как десериализовать сериализованные данные с помощью библиотеки Parsers -

public class Deserialize {
   public static void main(String args[]) throws Exception{
	
      //Instantiating the Schema.Parser class.
      Schema schema = new Schema.Parser().parse(new File("/home/Hadoop/Avro/schema/emp.avsc"));
      DatumReader<GenericRecord> datumReader = new GenericDatumReader<GenericRecord>(schema);
      DataFileReader<GenericRecord> dataFileReader = new DataFileReader<GenericRecord>(new File("/home/Hadoop/Avro_Work/without_code_gen/mydata.txt"), datumReader);
      GenericRecord emp = null;
		
      while (dataFileReader.hasNext()) {
         emp = dataFileReader.next(emp);
         System.out.println(emp);
      }
      System.out.println("hello");
   }
}

Перейдите в каталог, в котором размещен сгенерированный код. В этом случае он находится наhome/Hadoop/Avro_work/without_code_gen.

$ cd home/Hadoop/Avro_work/without_code_gen/

Теперь скопируйте и сохраните указанную выше программу в файле с именем DeSerialize.java. Скомпилируйте и выполните его, как показано ниже -

$ javac Deserialize.java
$ java Deserialize

Выход

{"name": "ramu", "id": 1, "salary": 30000, "age": 25, "address": "chennai"}
{"name": "rahman", "id": 2, "salary": 35000, "age": 30, "address": "Delhi"}