Sqoop-소개

전통적인 애플리케이션 관리 시스템, 즉 RDBMS를 사용하는 관계형 데이터베이스와 애플리케이션의 상호 작용은 빅 데이터를 생성하는 소스 중 하나입니다. RDBMS에서 생성 된 이러한 빅 데이터는 관계형에 저장됩니다.Database Servers 관계형 데이터베이스 구조에서.

Hadoop 생태계의 MapReduce, Hive, HBase, Cassandra, Pig 등과 같은 빅 데이터 스토리지 및 분석기가 등장했을 때, 그 안에 상주하는 빅 데이터를 가져오고 내보내기 위해 관계형 데이터베이스 서버와 상호 작용하는 도구가 필요했습니다. 여기에서 Sqoop은 관계형 데이터베이스 서버와 Hadoop의 HDFS 간의 실행 가능한 상호 작용을 제공하기 위해 Hadoop 에코 시스템의 한 자리를 차지합니다.

Sqoop − "SQL에서 Hadoop으로, Hadoop에서 SQL로"

Sqoop은 Hadoop과 관계형 데이터베이스 서버간에 데이터를 전송하도록 설계된 도구입니다. MySQL, Oracle과 같은 관계형 데이터베이스에서 Hadoop HDFS로 데이터를 가져오고 Hadoop 파일 시스템에서 관계형 데이터베이스로 내보내는 데 사용됩니다. Apache Software Foundation에서 제공합니다.