Учебное пособие по Apache Tajo
Apache Tajo - это среда распределенного хранилища данных с открытым исходным кодом для Hadoop. Первоначально Tajo была основана Gruter, инфраструктурной компанией, базирующейся на Hadoop, в Южной Корее. Позже в проект внесли свой вклад специалисты Intel, Etsy, NASA, Cloudera, Hortonworks. Таджо на корейском языке означает страуса. В марте 2014 года Tajo получил проект Apache с открытым исходным кодом высшего уровня. В этом руководстве будут изучены основы Tajo и, в дальнейшем, объяснены настройка кластера, оболочка Tajo, SQL-запросы, интеграция с другими технологиями больших данных и, наконец, в заключение приведены некоторые примеры.
Прежде чем приступить к изучению этого руководства, вы должны хорошо разбираться в ядре Java, любой ОС Linux и СУБД.
Это руководство было подготовлено для профессионалов, стремящихся сделать карьеру в области анализа больших данных. Это руководство даст вам достаточно знаний об Apache Tajo.