选择正确的数据库引擎(sql-engine)来访问Hadoop大数据

使用Hadoop数据库”SQL-on-Hadoop”技术,可使得我们可以使用熟悉的SQL语言来访问存储在Hadoop中的大数据。通过合理的查询优化等交给hadoop分布式计算处理,最后通过各种报表或分析工具来处理和研究数据。

Read more

Hive 报 message:Metastore contains multiple versions 错误

[摘要] 早上看到从4点起所有 Hive 任务都跑失败了,手…

Read more

Hadoop数据倾斜,快速精确balance的方法

Hadoop集群Datanode数据倾斜,个别节点hdfs空…

Read more

Hbase升级版本,导入数据抛出 RegionTooBusyException 的解决

【背景】要将Hbase 从0.94.2(hadoop-1.0…

Read more

吐槽 flume-ng

这几天在折腾 flume-ng,版本为官方的1.5.2,参考…

Read more

saltstack install jdk

[摘要] saltstack再来一个测试配置,搭建java环…

Read more

hadoop decommission 时卡住

hadoop decommission一个节点Datanod…

Read more

Hadoop-2.2.0源码编译,搭建与配置

【摘要】之前一直使用Hadoop1.x的版本,计划升级到2.…

Read more

TokuMX的数据压缩能力令人惊喜

相比原生的MongoDB, TokuMX 提供了三个主要的特…

Read more

fastdfs slave file mode 的应用场景及好处

fastdfs Java版本的上传api中有多种方式,当初对…

Read more