【ビッグデータ】hiveでひでぶ

programming

hiveでひでぶ。
hqlに一連の作業を記述すべきだけど、トランザクションがないので落ちたときの復旧がめんどくさい。
テーブル作成や削除はHDFS データを残すか残さないかで悩みどころ。
m&rに比べてテーブル結合は便利だけどちょい使いにくい。
管理専用にして閲覧だけでいいのじゃないかと

hiveはRDBのSQLに似たhqlが使えるけど、トランザクション管理ができない。
それに、基本的には、UPDATEやDELETEなんかはできない。
普通にSELECTするのには便利だから、管理者がデータの確認用に使うのが適しているように思う。

CREATE TABLEの場合と、CREATE EXTERNAL TABLEでDROP TABLE時の挙動が変わったりするので、
どっちを使うかルールを徹底しておいた方がいいと思う。
http://www.ne.jp/asahi/hishidama/home/tech/apache/hive/table.html

テーブルを毎回作成するとなると、データを格納してテーブルを削除して…と結構面倒。
CREATE TABLEだと毎回、データも削除されてしまうので配置しなおす必要あるし。

hiveは便利だけど使いにくい。そんな感じ。

【今日のはてブ】

TKG は男のロマン。けしからん卵かけご飯ばかり。卵と醤油とご飯のみで勝負すべき。
カクカク速報:卵かけご飯日本一を決定 もう、卵かけご飯を超えた
http://htn.to/Cq5tNP

TKGは岡山だろうと。シンプルなのが一番。

コメント

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください