文章目录
  1. Hive-1_安装配置
  2. 1. 节点
  3. 2. 下载和安装
  4. 3. hive基本配置
  5. 4. 数据源配置
  6. 5. 启动hive

Hive-1_安装配置

[TOC]

1. 节点

Apache Hive是基于分布式存储(Hadoop HDFS)的一个数据仓库。它可以通过 SQL 很方便的读写、管理上面的庞大的数据集。用户可以通过 命令行JDBC Driver 连接Hive并使用。

2. 下载和安装

  • 下载地址:http://hive.apache.org/downloads.html (如下载 1.2.1 版本, 也可以手动下载源码进行编译)
  • 开发文档:https://cwiki.apache.org/confluence/collector/pages.action?key=Hive

这里有一些 基本软件环境的要求, 如JDK1.7以上, 还有Hadoop版本相关的注意点。

3. hive基本配置

  • JDK的环境配置(不累赘了)
  • Hadoop环境配置(不累赘了)
  • Hive的环境变量配置
1
2
export HIVE_HOME="/Users/icemimosa/mimosa/hive-1.0.1"
export PATH="$HIVE_HOME/bin:$PATH"
  • hive是依赖Hadoop的,所以你需要配置上 HADOOP_HOME 的环境变量。或者在 $HIVE_HOME/confhive-env.sh ( hive-env.sh.template 修改一下名字)中最后可以看到Hadoop的配置。
1
2
3
4
5
## 如配置上
HADOOP_HOME=/Users/icemimosa/mimosa/hadoop-2.7.1

## hive conf
export HIVE_CONF_DIR=/Users/icemimosa/mimosa/hive-1.0.1/conf

4. 数据源配置

  • 由于hive启动默认是使用的内嵌的 Derby 数据库,这个数据库只支持一个hive连接,使用不是很方便。
  • 所以这里将使用 mysql 进行 hive元数据 的存储

    • 1、将 mysql 的 jdbc 驱动拷贝到 $HIVE_HOME/lib
    • 2、修改conf下的 hive-site.xml 文件(由 hive-default.xml.template 修改而来),注意这里先将 hive-site.xml 情况,需要覆盖什么配置从 hive-default.xml.template 拷贝即可。配置如下:

      1
      2
      3
      4
      5
      6
      7
      8
      9
      10
      11
      12
      13
      14
      15
      16
      17
      18
      19
      20
      21
      22
      23
      24
      <?xml version="1.0" encoding="UTF-8" ?>
      <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
      <configuration>
      <property>
      <name>javax.jdo.option.ConnectionDriverName</name>
      <value>com.mysql.jdbc.Driver</value>
      <description>Driver class name for a JDBC metastore</description>
      </property>
      <property>
      <name>javax.jdo.option.ConnectionURL</name>
      <value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true</value>
      <description>JDBC connect string for a JDBC metastore</description>
      </property>
      <property>
      <name>javax.jdo.option.ConnectionUserName</name>
      <value>root</value>
      <description>Username to use against metastore database</description>
      </property>
      <property>
      <name>javax.jdo.option.ConnectionPassword</name>
      <value>******</value>
      <description>password to use against metastore database</description>
      </property>
      </configuration>
* 修改含有 `${system:java.io.tmpdir}` 的一些路径配置项

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
<property>
<name>hive.exec.local.scratchdir</name>
<value>/usr/local/var/hive/iotmp</value>
<description>Local scratch space for Hive jobs</description>
</property>
<property>
<name>hive.downloaded.resources.dir</name>
<value>/usr/local/var/hive/${hive.session.id}_resources</value>
<description>Temporary local directory for added resources in the remote file system.</description>
</property>
<property>
<name>hive.querylog.location</name>
<value>/usr/local/var/hive/iotemp</value>
<description>Location of Hive run time structured log file</description>
</property>
<property>
<name>hive.server2.logging.operation.log.location</name>
<value>/usr/local/var/hive/${system:user.name}/operation_logs</value>
<description>Top level directory where operation logs are stored if logging functionality is enabled</description>
</property>

5. 启动hive

  • 直接运行 hive 命令 (注意:确保 Hadoop 和 mysql 的服务以及启动), 成功如下:

  • 输入命令测试:

文章目录
  1. Hive-1_安装配置
  2. 1. 节点
  3. 2. 下载和安装
  4. 3. hive基本配置
  5. 4. 数据源配置
  6. 5. 启动hive