公開日:2024年12月10日最終更新日:
AWSにはデータ分析に関するサービスがいくつもあり、その中にQuickSight があります。リリースされてから人気を集めているデータ分析基盤で、AWS内外のデータを集約できるBIツールです。今回はAWSでデータ分析基盤を構築するためにも、QuickSight がどのようなサービスであるか紹介します。
目次 <Contents>
QuickSightのサービス概要と仕組み
QuickSight はAWSから提供されているビジネス分析サービスです。
QuickSight のサービス概要
QuickSight はいわゆるBIツールと呼ばれるものに該当し、AWSに蓄積されたデータを活用して、様々なダッシュボード機能を利用できます。本来、BIツールを利用するためには、ソフトウェアを導入し、データ連携などの作業が必要です。しかし、QuickSightであればサービスを有効化するだけでサーバーの管理やソフトウェアのインストールなしに利用できます。
分析の対象となるデータソースは各種データベースやS3などが挙げられます。日々アップデートが続いていて、2024年10月にも大きなアップデートがありました。これからも同様のアップデートが続き、収集や分析の対象はさらに広がるでしょう。
QuickSight が関連するデータソースをAWS内部の処理で接続します。各種ソースアクセスするためにコーディングなどが必要なく、直感的なUIで設定できることが特徴です。
SPICE(スパイス)
QuickSight には、SPICEと呼ばれるインメモリ型の高速データベースが内蔵されています。サービスの利用者向けに用意された専用データベース領域です。ここにデータを取り込んでおくことで、分析などの処理を高速化できます。すべてのデータを取り込めるわけではありませんが、頻繁に使うデータを取り込んでおくと、スムーズに処理を進められる仕組みです。
なお、SPICEを利用する際は、QuickSight の基本料金とは別に、容量に応じた料金が課金されます。そのため、必ずしもSPICEを利用しなければならないという仕組みではありません。処理を実行するたびに、データソースへアクセスして、読み込んだり、処理したりすることもできます。状況に応じて、SPICEを利用するかどうかは検討しなければなりません。
QuickSight で意識したい3つのロール
ユーザーアカウントの発行に関連する部分ですが、QuickSight には3つのロールがあります。状況に応じてこれらのロールを使い分けて発行しなければなりません。
作成者
データを収集したり分析したりする役割を持つ人向けのロールです。データ収集に向けてデータセットを作成したり、分析の定義を追加したりできます。また分析結果をダッシュボードへ公開し、以下で説明する閲覧者へ提供することも可能です。データの分析作業などを担当する人へ発行しなければなりません。
なお「著者プロ」と呼ばれるロールも用意されていて、こちらはすべての作成者機能と、Amazon Q in QuickSight の生成BI機能を利用できます。近年、Amazon Qとの組み合わせが強化されているため、こちらも検討してみてください。
閲覧者
閲覧者はレポートやダッシュボードを参照するだけの役割です。データの収集や分析作業ではなく、その結果だけを開示したい場合などに利用します。例えば、社内のデータアナリストは作成者の権限を持ち、管理職のようにデータの分析結果を参照するだけの人がロールを切り分けるのです。ただ、閲覧者といえどもレポートをブックマークしたり、変更をメールで通知してもらったりできます。ユーザビリティを高める機能が用意されているため、ここは注目しておきましょう。
管理者
QuickSight 全体を管理できるロールです。一つのアカウントに対して1人以上の管理者を設ける必要があり、これを用いて、ユーザの追加などに対応します。また、作成者や閲覧者の権限を変更するなどの手続きも可能です。厳密にはQuickSight でロールとして定義されていませんが、利用時には必要となるものであるため、ここでは説明しています。
QuickSight を構築する際のプラン
料金プランは1種類に統一され、1人あたりの料金などが計算しやすくなりました。
以前はスタンダードエディションやエンタープライズエディションを選択する必要があり、どちらを選択するかで料金が変化しました。しかし、QuickSight のバージョンアップによって複雑な料金体系が改善され、上記のようにシンプルなものに統一されています。
QuickSight を利用する際の重要なキーワード
QuickSight を快適に利用するためには、理解しておくべきキーワードがあります
データソース
データソースは、QuickSight がデータ分析する際に、アクセスできる情報源です。日々アップデートが続いていて、2024年11月現在では、以下のデータソースが利用できます。
Amazon RDS
- Amazon Redshift
- Amazon EC2
- オンプレミスやVPNで接続できるデータベース
- Amazon S3に保存されたCSV・ELF/CLF・JSON・XLSXファイル
- SaaSデータ(Jira・ServiceNow)
データセット
可視化のために集約されたデータの集まりを指します。QuickSight の場合、単一のデータだけで可視化することもあれば、複数のデータソースに格納されたデータを結合して可視化することもあるでしょう。フィルターをかけるなど、独自の処理を組み込むこともあるはずです。
一般的には、加工する前のデータをデータセットと呼ぶ傾向にあります。実際には可視化対象のデータであれば、すべてデータセットに該当するのです。
分析
QuickSight の中心となる機能で、権限を有しているユーザーであれば、分析画面を表示できます。標準でさまざまな分析アルゴリズムが提供されていて、これを活用することで簡単にデータ分析が可能です。本来、専門的な知識を必要とする作業ですが、QuickSight であれば画面に表示されたアイコンをクリックするだけでスムーズに進められます。
また、アルゴリズムを適用するだけではなく、さまざまな形式でアウトプットが可能です。例えば、グラフにアウトプットする場合は棒グラフ・円グラフ・折れ線グラフなどの選択肢が用意されていて、状況に応じて使い分けできます。
ダッシュボード
分析した結果を公開するだけの読み取り専用機能です。本来、管理画面には、データソースへのアクセスや分析機能が表示されますが、ダッシュボードではこれらが表示されません。
QuickSight の始め方
これから新しくAWSでデータ分析したい人に向けて、QuickSight の始め方を紹介します。なお、QuickSight は頻繁にデザインの変更があるため、ユーザーインターフェースが変化している可能性には注意してください。
導入
AWSのコンソールからQuickSight へアクセスします。まずは表示されているアカウントが、サービスを有効化する対象であるかどうか確認しましょう。アカウント名に間違いがなければ、サインアップをクリックします。
続いて、連絡先情報や認証方法を入力しなければなりません。
続いて、サービスを有効化するリージョンと、ログインの際に利用するアカウント名を入力します。
QuickSight で分析対象とするAWSへのサービスを選択します。ここでサービスを選択しておくと、権限設定など自分自身で進める必要がありません。継続的な情報収集にも対応してくれるため、必要なものは漏れなくチェックしておきましょう。
最後にピクセルパーフェクトレポート機能を追加するかどうかを選択します。レポート機能を強化する機能ではありますが、月額料金が高額であるため、慎重に判断しなければなりません。
なお、標準ではチェックが入っていて、意識せずに有効化してしまうと高額な課金を受けてしまいます。一旦チェックを外してレポートは追加せず、後から有効化するかどうかを検討することをおすすめします。全ての入力が完了すれば、完了ボタンをクリックします。
アカウントを作成している間は以下の画面が表示されるため、数分待機しましょう。
問題なくアカウントが作成されると、完了画面に切り替わります。
設定や分析
QuickSight のコンソール画面では、使い方を確かめるためにサンプルデータを用いた操作が可能です。例えば分析タブを開くと、どのようなグラフを表示できるのか確認できます。
データの編集も可能であるため、まずはできることを把握して、どのようにデータを収集したり分析したりするか考えてみると良いでしょう。
続いて、データセットを追加しなければなりません。有効化の際に設定したデータソースは自動的に接続されています。ここでは、それら以外のデータセットを追加する場合と考えてください。追加する際は、新しいデータセットボタンをクリックします。
例えば、ローカルに保存されているファイルをアップロードして、データソースに追加が可能です。
他にも個別にデータベースを追加して、データセットとして読み込ませることもできます。AWSで管理していないもの含めて接続できるようになっているため、必要に応じて追加するようにしてください。
ダッシュボードへの公開
データソースの連携が完了し、分析まで終了したならば、ダッシュボードとして公開できます。分析画面の右上に公開ボタンがあるため、こちらをクリックして名称を設定します。
まとめ
AWSで提供されるBIツールであるQuickSight を紹介しました。近年は様々なBIツールが登場していて、それらの中でもAWSでのデータ収集に強みを持ったものです。ただデータソースを設定することで、AWS以外のデータも収集できるため、幅広いソースからのデータ分析基盤として役立てられるでしょう。