hive jdbc jar包是一款与编程、数据库相关的工具型安装包,主要用于转换与快速管理代码的储存与编写,还是挺实用的,且配套的社区服务也相对完善,更新频繁、开源免费,推荐给大家!
hive安装包简介
hive是基于hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为mapreduce任务进行运行。 其优点是学习成本低,可以通过类sql语句快速实现简单的mapreduce统计,不必开发专门的mapreduce应用,十分适合数据仓库的统计分析。
hive是建立在 hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(etl),这是一种可以存储、查询和分析存储在 hadoop 中的大规模数据的机制。hive 定义了简单的类 sql 查询语言,称为 hql,它允许熟悉 sql 的用户查询数据。同时,这个语言也允许熟悉 mapreduce 开发者的开发自定义的 mapper 和 reducer 来处理内建的 mapper 和 reducer 无法完成的复杂的分析工作。
hive 没有专门的数据格式。 hive 可以很好的工作在 thrift 之上,控制分隔符,也允许用户指定数据格式。

hive jdbc jar包特征
hive 是一种底层封装了hadoop 的数据仓库处理工具,使用类sql 的hiveql 语言实现数据查询,所有hive 的数据都存储在hadoop 兼容的文件系统(例如,amazon s3、hdfs)中。hive 在加载数据过程中不会对数据进行任何的修改,只是将数据移动到hdfs 中hive 设定的目录下,因此,hive 不支持对数据的改写和添加,所有的数据都是在加载的时候确定的。hive 的设计特点如下。
● 将元数据保存在关系数据库中,大大减少了在查询过程中执行语义检查的时间。
● 可以直接使用存储在hadoop 文件系统中的数据。
● 内置大量用户函数udf 来操作时间、字符串和其他的数据挖掘工具,支持用户扩展udf 函数来完成内置函数无法实现的操作。
● 类sql 的查询方式,将sql 查询转换为mapreduce 的job 在hadoop集群上执行。
● 支持索引,加快数据查询。
● 不同的存储类型,例如,纯文本文件、hbase 中的文件。
hive适用场景
hive 构建在基于静态批处理的hadoop 之上,hadoop 通常都有较高的延迟并且在作业提交和调度的时候需要大量的开销。因此,hive 并不能够在大规模数据集上实现低延迟快速的查询,例如,hive 在几百mb 的数据集上执行查询一般有分钟级的时间延迟。
因此,hive 并不适合那些需要低延迟的应用,例如,联机事务处理(oltp)。hive 查询操作过程严格遵守hadoop mapreduce 的作业执行模型,hive 将用户的hiveql 语句通过解释器转换为mapreduce 作业提交到hadoop 集群上,hadoop 监控作业执行过程,然后返回作业执行结果给用户。hive 并非为联机事务处理而设计,hive 并不提供实时的查询和基于行级的数据更新操作。hive 的**使用场合是大数据集的批处理作业,例如,网络日志分析。