Hive 설치
일반적으로 하이브는 사용자의 워크스테이션에서 실행되고, 작성된 SQL 쿼리는 일련의 맵리듀스 잡으로 변환되어 하둡 클러스터에서 구동된다. 하이브는 HDFS에 저장된 데이터(디렉터리/파일)에 구조(스키마)를 입히는 방식으로 데이터를 테이블로 구조화시킨다. 테이블 스키마와 같은 메타데이터는 메타스토어라 불리는 데이터베이스에 저장된다.
하이브와 하둡 버전의 호환성
하이브의 모든 배포판은 여러 버전의 하둡과 문제없이 작동하도록 설계되었다. 일반적으로 하이브는 릴리즈 목록에 열거된 예전 버전을 지원할 뿐만 아니라 안정된 최신 하둡 배포판에서도 잘 동작한다. 하이브에 사용할 하둡의 버전을 굳이 알려주지 않아도 되며, 단지 하둡의 실행 파일이 실행 경로에 있고 HADOOP_HOME 환경변수가 설정되어 있으면 된다.
하이브 설치
- 하이브를 내려받고, 사용자 워크스테이션의 적절한 위치에서 타르볼 파일을 푼다.
http://hive.apache.org/downloads.html
tar xzf apache-hive-x.y.z-bin.tar.gz
- 사용자 경로에 하이브를 넣어두면 실행하기 편리하다.
export HIVE_HOME=~/sw/apache-hive-x.y.z-bin export PATH=$PATH:$HIVE_HOME/bin
- hive 명령어를 실행하여 하이브 쉘 구동
hive