データレイク(データの湖)からデータ(魚)をとって、
データウェアハウス(データの倉庫)へ加工して商品を置いて、
データマート(データのお店)で販売するってことか。
データレイク(データの湖)からデータ(魚)をとって、データウェアハウス(データの倉庫)へ加工して商品を置いて、データマート(データのお店)で販売するってことか。
— アリソン (@arisonjp) April 26, 2018
上記のつぶやきは、データレイクとデータウェアハウスとデータマートをデータを魚にあてはめてまとめたつぶやき。
最近になってデータレイクという言葉を聴くようになった。
それぞれが似ているようなものなんだけど、少しずつ役割が違う。
役割が違うから別の言葉として誕生しているわけだけど。
データレイク
データレイクとは、構造化データや非構造化データを格納する場所であり、様々なデータソースから集められたデータを管理し、活用のための前処理を行える環境。
データウェアハウス
データウェアハウスは、予め定義されたKPIなどの指標をモニタリング/分析するために、社内外の様々なデータソースからデータを収集し、検索のための最適化が行われた環境。
データマート
データマートは、データウェアハウスの中から特定の目的に合わせた部分を取り出した環境。
焼き魚(結果のデータ)を食べたいとき。
・手っ取り早く店舗(データマート)で焼き魚を買うこともある。
・港や市場(データウェアハウス)で魚を買って料理したいこともある。
・湖(データレイク)で釣りして魚を捕って料理したいときもある。
焼き魚(結果のデータ)を食べたいとき。
・手っ取り早く店舗(データマート)で焼き魚を買うこともある。
・港や市場(データウェアハウス)で魚を買って料理したいこともある。
・湖(データレイク)で釣りして魚を捕って料理したいときもある。— アリソン (@arisonjp) April 26, 2018