163java
About 108 results
  1. hive防止数据倾斜 参考资料

    http://chengjianxiaoxue.iteye.com/blog/2197590
    2015年04月01日 -   http://www.cnblogs.com/end/archive/2012/06/19/2554582.html   写的不错  风生水起     1数据倾斜的原因 1.1操作: 关键词 情形 后果 Join 其中一个表较小, 但是key集中 分发到某一个或几个Reduce上的数据远高于平均值 大表与大表,但是
  2. hadoop hive hbase 入门学习 (一)

    http://knight-black-bob.iteye.com/blog/2186044
    2015年02月15日 -   ////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////  
  3. 基于Hive的日志数据统计实战

    http://baiyunl.iteye.com/blog/866869
    2011年01月10日 - 一、Hive简介 Hive 是一个基于 hadoop 的开源数据仓库工具,用于存储和处理海量结构化数据。    它把海量数据存储于 hadoop 文件系统,而不是数据库,但提供了一套类数据库的数据存储和处理机制,并采用 HQL (类 SQL )语言对这些数据进行自动化管理和处理。我们可以把 hive 中海量结构化数据看
  4. multitask and Hive

    http://codeplayer.iteye.com/blog/84844
    2007年05月30日 - multitask multitask allows Python programs to use generators (aka coroutines) to perform cooperative multitasking and asynchronous I/O. Applications written usi
  5. hive的权限控制

    http://running.iteye.com/blog/983740
    2011年04月02日 - hive是没有库的概念的,但是我们通常是需要“库”这个东西存在。 1.不同日志,视为不同的“库”,其MetaStore在Mysql建立不同的数据库存放 2.每个“库”, 对应一个用户,并且创建单独的conf目录 3.在单独的conf目录下,修改hive-default.xml文件,配置相应的db 4.启动单独的hive
  6. hive数据模型

    http://samuschen.iteye.com/blog/834872
    2010年12月06日 -   Hive 中所有的数据都存储在 HDFS 中, Hive 中包含以下数据模型: Table , External Table , Partition , Bucket 。 Hive 中的 Table 和数据库中的 Table 在概念上是类似的,每一个 Table 在 Hive 中都有一个相应的目录存储数据。例如,一
  7. hive运行实例

    http://samuschen.iteye.com/blog/831983
    2010年12月02日 - 实际示例 创建一个表 CREATE TABLE u_data ( userid INT, movieid INT, rating INT, unixtime STRING) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' STORED AS TEXTFILE; 下载示例数据
  8. Hive-0.5中SerDe概述

    http://dajuezhao.iteye.com/blog/795190
    2010年10月27日 - 一、背景 1、当进程在进行远程通信时,彼此可以发送各种类型的数据,无论是什么类型的数据都会以二进制序列的形式在网络上传送。发送方需要把对象转化为字节序列才可在网络上传输,称为对象序列化;接收方则需要把字节序列恢复为对象,称为对象的反序列化。 2、Hive的反序列化是对key/value反序列化成hive table的每
  9. hive compile-1

    http://samuschen.iteye.com/blog/916305
    2011年02月22日 - Hive 是Apache Hadoop 项目下的一个子项目,是一个底层用Map/Reduce实现的查询引擎,具体的介绍可以查看Hive的wiki 。 入口 Hive有三种用户接口:CLI、Client(JDBC、ODBC、thrift或其他)和WebUI,如下图所示: 图1 Hive的入口 这些用户接口的工作是将用户输
  10. Hive QL

    http://samuschen.iteye.com/blog/842556
    2010年12月15日 - Hive 的官方文档中对查询语言有了很详细的描述,请参考:http://wiki.apache.org/hadoop/Hive/LanguageManual ,本文的内容大部分翻译自该页面,期间加入了一些在使用过程中需要注意到的事项。 Create Table CREATE [EXTERNAL] TABLE [IF N