hiveでひでぶ。
hqlに一連の作業を記述すべきだけど、トランザクションがないので落ちたときの復旧がめんどくさい。
テーブル作成や削除はHDFS データを残すか残さないかで悩みどころ。
m&rに比べてテーブル結合は便利だけどちょい使いにくい。
管理専用にして閲覧だけでいいのじゃないかと
hiveはRDBのSQLに似たhqlが使えるけど、トランザクション管理ができない。
それに、基本的には、UPDATEやDELETEなんかはできない。
普通にSELECTするのには便利だから、管理者がデータの確認用に使うのが適しているように思う。
CREATE TABLEの場合と、CREATE EXTERNAL TABLEでDROP TABLE時の挙動が変わったりするので、
どっちを使うかルールを徹底しておいた方がいいと思う。
http://www.ne.jp/asahi/hishidama/home/tech/apache/hive/table.html
テーブルを毎回作成するとなると、データを格納してテーブルを削除して…と結構面倒。
CREATE TABLEだと毎回、データも削除されてしまうので配置しなおす必要あるし。
hiveは便利だけど使いにくい。そんな感じ。
【今日のはてブ】
TKG は男のロマン。けしからん卵かけご飯ばかり。卵と醤油とご飯のみで勝負すべき。
カクカク速報:卵かけご飯日本一を決定 もう、卵かけご飯を超えた
http://htn.to/Cq5tNP
TKGは岡山だろうと。シンプルなのが一番。