目次
1.はじめに
2. pygwalkerのインストールとセットアップ
3. 基本の操作
4. 基本的なチャートを作成する
5. まとめ
1. はじめに
本ブログの目的
このブログでは、Pygwalkerライブラリを使用して、Jupyter Notebook上でのデータ可視化をUIベースで行ってみます。
pygwalkerとは
pygwalkerは、pandasのデータフレームをTableauスタイルのUIに変換することで、データ分析とデータ可視化をマウス操作で簡単に行うことができます。
2. pygwalkerのインストールとセットアップ
必要な環境や依存関係
今回は以下の環境で実行しています。
- OS: Mac OS Ventura 13.5.1
- Python: 3.10.6
- ライブラリ:
インストール手順
pygwalkerをインストールします。
■python
pip install pygwalker
また、jupyter notebookを使用するため、これもインストールします。
■python
pip install notebook
3. 基本の操作
データを読み込む
ライブラリの読み込みと、データの準備を行います。
ここでは、サンプルデータとして、タイタニックのデータセットを使用します。
■python
import pandas as pd import pygwalker as pyg
データを読み込んで、表示してみます。
■python
df = pd.read_csv('../data/titanic.csv') df.head()
![スクリーンショット 2023-08-23 17.20.05.png (71.5 kB)](https://img.esa.io/uploads/production/attachments/16757/2023/08/23/93654/24eebd2a-7ad3-4b85-93d8-df3075ddfd08.png)
pygwalkerのUIを起動する
pyg.walkを実行すると、pygwalkerのUIが起動します。pygwalkerのUIには、「Data」と「Visualization」の2つのタブが存在します。
■python
walker = pyg.walk(df, spec='config.json', use_preview=True)
![スクリーンショット 2023-08-23 17.23.36.png (105.0 kB)](https://img.esa.io/uploads/production/attachments/16757/2023/08/23/93654/09831e40-6b24-44d9-8e43-0bfa489b7d3b.png)
Dataタブ
Dataタブをクリックすると、読み込んだデータフレームの中身が表示されます。
![スクリーンショット 2023-08-23 17.28.39.png (256.7 kB)](https://img.esa.io/uploads/production/attachments/16757/2023/08/23/93654/b983e3b4-0901-4c79-9fe3-36017371ff20.png)
Visualization タブ
Visualizationタブをクリックすると、グラフ作成のためのUI画面が表示されます。
![スクリーンショット 2023-08-23 17.30.16.png (98.8 kB)](https://img.esa.io/uploads/production/attachments/16757/2023/08/23/93654/c35578e4-9f6b-4d4b-9dd8-04d9593163be.png)
4. 基本的なチャートを作成する
UIのX-Axis・Y-Axisに、データフレームの列を追加することで、データを可視化することができます。
ここでは、X軸を「生存フラグ」(‘0’なら死亡、’1’なら生存)、Y軸を「年齢」とした箱ひげ図を表示してみましょう。
表示するカラムを指定する
X-Axisに「生存フラグ」を表すSurviveを、Y-Axisに「年齢」を表すAgeをドラッグして配置します。
![スクリーンショット 2023-08-23 18.31.04.png (135.8 kB)](https://img.esa.io/uploads/production/attachments/16757/2023/08/23/93654/d078d4e6-587e-47f5-b1f4-af14766a81ae.png)
グラフの形式を指定する
グラフの形式は、メニューバーの左から4つ目のアイコンである「Mark type」から指定できます。
![スクリーンショット 2023-08-23 18.32.55.png (127.8 kB)](https://img.esa.io/uploads/production/attachments/16757/2023/08/23/93654/be98da7a-69c6-44ca-b9e2-27fd7558bdf8.png)
非集計のデータを表示するように指定する
箱ひげ図の場合は、データの分布を表示するため、データを非集計のまま表示する必要があります。
メニューバーの左から3つ目のアイコンである「Aggregation」で、データの集計/非集計を指定できます。
![スクリーンショット 2023-08-23 18.33.58.png (111.8 kB)](https://img.esa.io/uploads/production/attachments/16757/2023/08/23/93654/3aabcab5-14e9-4fdd-9c1f-f0d13f320203.png)
グラフをリサイズする
グラフをリサイズします。グラフの右下の角をドラッグするか、メニューバーの左から10番目のアイコンである「Layout Mode」をfixedに設定することによって、修正することができます。
![スクリーンショット 2023-08-23 18.35.01.png (125.8 kB)](https://img.esa.io/uploads/production/attachments/16757/2023/08/23/93654/2154e4dc-cdf6-4ea9-a06b-5e3ab513dc4b.png)
5. まとめ
pygwalkerを使用することで、マウスドラッグでデータの可視化を行うことができました。
BIツールのような画面でデータフレームを操作できるため、TableauやPower BIなどのBIツールの扱いに慣れている人は、分析操作を簡単に行うことが出来ます。
ただし、用意されているグラフの種類は少ないため、用途はベーシックな可視化に限られるという印象を持ちました。
発展的なグラフは用意されていないため、そういったグラフは、まだpythonで自分で書く必要があります。