arison.jp arison.jp blog - 現在をたのしく、未来をたのしむ。日常の思い出兼備忘録。

【ビッグデータ】データレイクとデータウェアハウスとデータマートの違いのたとえ

データレイク(データの湖)からデータ(魚)をとって、
データウェアハウス(データの倉庫)へ加工して商品を置いて、
データマート(データのお店)で販売するってことか。

上記のつぶやきは、データレイクとデータウェアハウスとデータマートをデータを魚にあてはめてまとめたつぶやき。
最近になってデータレイクという言葉を聴くようになった。
それぞれが似ているようなものなんだけど、少しずつ役割が違う。
役割が違うから別の言葉として誕生しているわけだけど。

データレイク
データレイクとは、構造化データや非構造化データを格納する場所であり、様々なデータソースから集められたデータを管理し、活用のための前処理を行える環境。

データウェアハウス
データウェアハウスは、予め定義されたKPIなどの指標をモニタリング/分析するために、社内外の様々なデータソースからデータを収集し、検索のための最適化が行われた環境。

データマート
データマートは、データウェアハウスの中から特定の目的に合わせた部分を取り出した環境。

焼き魚(結果のデータ)を食べたいとき。
・手っ取り早く店舗(データマート)で焼き魚を買うこともある。
・港や市場(データウェアハウス)で魚を買って料理したいこともある。
・湖(データレイク)で釣りして魚を捕って料理したいときもある。

About arison

大都会岡山の南部にある玉野市生まれ。 大都会岡山のIT会社(目標は大都会No.1)でコンピュータとお客を相手に日夜格闘中。 関東出張中はグルメブログ。 基本的に遊び人のおっさん。 ライフハックとガンダム好き。ギガフロート玉野を浸透中。

26. 4月 2018 by arison
Categories: 日記, 仕事 | Tags: | Leave a comment

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください