Tableau Prep Builder
Part1 基礎編
ノンプログラミングでデータ加工
データ活用のために、データの前処理は非常に重要です。 データ品質に問題がある場合は、有用な分析結果を期待できません。そして、生データそのものは分析に適していないことが多いです。
以下は「よくあるデータの課題」の例です。
- 売上データには商品名が載っていなく、商品マスターが別のファイルにある
- アンケートデータには多数の設問カラムが並び、分析に使いづらい
- 複数支店のデータを統合したいが、支店によって列や商品名が微妙に違う
このとき、 社内のデータエンジニア(IT部門など)に依頼が集中すると担当者の負担オーバーとデータ処理の属人化がオーバーすることが懸念されます。膨大な量のデータの複雑な処理はExcelで行おうとしても、効率と正確性に欠けることもあります。
そんな時、「Tableau Prep Builder」を活用してデータの前処理を行うことで、データ加工の幅が広がり、データソース整形を効率化できるます!
★Tableau Prep Builder とは★
Tableau Prep Builder は、分析対象データの前処理を行うためのツールです。 ノンプログラミングGUIの上で、集計、ピボット、結合、ユニオン、計算フィールドの作成 クリーニング(列の削除、値のフィルタ、データ型の変更、項目名の変更、 グループ化、置換)など 、データの「ありがちな問題」を解決してくれる機能が色々用意されています。
Prepの1番の強みは、 データ加工の操作がわかりやすく、 加工しながらデータの整合性を随時確認できることです。 そのため、慣れていない方でも、安心して自らデータ整形を行うことができます。
また、Tableau Prepでデータを整理し軽量化した上でTableau Desktopに取り組むことで、Desktop単体よりも効率よく可視化分析ができます。Tableau特有のhyper形式で出力し、ワンクリックでDesktopで開いて分析することが推奨されています。
※1 本講座は、ソフトウェアバージョンTableau Prep 2021.3以降を想定している。 ただし、大部分の操作はそれより前のバージョンでも実施可能
※2 件数の多いデータに複雑な処理を現実的な時間で行うためには、ある程度スペックの高 い端末を用意するとよい
本講座で目指すこと
◆Tableau Prep の特徴を知る
◆ 基本的な操作を使いこなす
◆様々な”難あり”データの加工を実践する
◆ 講座で学んだ加工技術を、身の回りの業務データに応用できる
講座の中のがで行う「基礎演習」では、実務上データに”よくある問題”を持つ データのクリーニングを行ってい来ます。この演習を通じて、データ分析において(Tableau Desktopと併せて) Tableau Prepをデータ準備に使用するイメージを持ちやすくなります。
また、本講座の修了後に是非とも次の1つ上のレベルの「実践演習」にも挑戦してください。
一連の処理を記述する「フロー」を構築し、以降はそのフローを実行するだけで、同じデータ処理を繰り返し実行可能です(例:月に一度売上データの加工用フローを実行し、出力ファイルを部署内 の共有フォルダに格納する)。
データの状態を実際に目で確認しながら加工作業ができる。
データに含まれる列項目、異常値や欠損値の有無、どんな値がどれくらいの割 合を占めているのか、2つのデータを結合した後に一致する件数など。
教材の内容
PDFテキスト(データ処理の演習をStep-by-stepで解説)
Prep のサンプルフロー
練習用のデータ各種
ピクアカのTableau講座
BIツールとTableau の入門講座、Tableauを用いたデータ加工および可視化分析の演習については、以下の講座をご活用ください。