对hadoop的hive数据仓库和hbase有一些质疑。希望有专家帮忙解决。谢谢大家!!!
首先,我感觉你有点乱。。。
你先了解数据仓库的功能——存储历史数据——然后分析数据,只提供查询——不提供修改。
1。Hive的目标是做数据仓库,所以它提供了SQL和文件表映射,而且因为Hive是基于HDFS的,所以它不提供更新,因为HDFS本身不支持。
2.HBase是一个NoSQL数据库——所以不要和传统的混淆——no SQL提供了另一种思路来满足高性能的需求,而这些都是传统数据库的缺点,与传统的概念不同。
3 .加载数据这个可以自己查。Hbase应该使用自己的API。
4.是的。
5.这句话不对。
6.映射意味着结构上的对应——比如文件中每行的第一个字段——被映射到Hive表的第一个字段。
类似Hibernate的语法分析。
Hive本身实现了一套语法结构,即运算符。比如扫描文件,最后笔记本会转换成MapReduce来运行。