Copilot for Power BIがGA (General Availability)となったことを受け、下記いくつかのポイントをまとめておきたいと思います。まずブログで正式発表となりましたが、FabricにおいてCopilot対応の全てのワークロードがGAとなっているのではなく、Copilot for Power BIだけのGAとなっています。
- Copliot for Power BIとは
- Copliot for Power BIのセキュリティについて
- 現時点のCopilot機能について
- レポート作成のCopilot機能について
- その他FAQ
- Q1. GAによるCopilot for Power BIは何が変わりますか?
- Q2. Copilotのハルシネーション(幻覚)が怖いです
- Q3. 会社が独自に持っているデータをCopilotにトレーニングをさせたいが可能か?
- Q4. 他の企業におけるCopilot for Power BIのユースケースについて教えてほしい
- Q5. Copilot for Power BIを賢く利用するためのTipsを教えて欲しい
- Q6. Copilot for Power BIにおて、クエリが可能となるテーブル数の制限はあるか?
- Q7. Copilot in Fabric(for Power BI)のアーキテクチャについて知りたい
- Q8. データに対するフォローアップ質問(インターアクティブな質問)を行いたい
- Q9. 例を使用して、Copilotのパフォーマンスチューニングを行いたい
- Q10. Copilotによって返された結果(例: チャート等)に対する簡潔な説明文を付けて欲しい
- Q11. Copilot 導入前に作成された既存の PBI レポートに、Copilot を使用するためのベストプラクティスを適用することが困難
- 最後に
Copliot for Power BIとは
Microsoft Fabricが目指す世界の4つ目の特徴が「AI 搭載」であり、全てのワークロードにCopilotを搭載することを目指しています。
AI機能は今後全てのデータ関連サービスに織り込まれてくるでしょうし、Fabricに搭載されたCopilotは開発者からビジネスユーザーまで、あらゆるペルソナの生産性を高めることを目標としています。
直近の顧客対応において、Copilot for Power BIをリードするLadaさんに質問することが多く、その中で様々な回答を得ることができたのでそれらをまとめて共有しておきます。Copilot for Power BIの機能紹介については、下記のリンクをご参考ください。
Copliot for Power BIのセキュリティについて
非常に良く質問されるのがセキュリティ問題になります。すなわち、「MicrosoftがCopilot搭載して、仕事が便利になるのは分かっているけど、自社のデータをどのように扱っているのかが不安」といった質問になります。
これに対する答えはシンプルに、
Microsoftはモデルの訓練に顧客データを使うことはない
となります。言い換えれば、実際の顧客データ(生データ等)がMicrosoftが管理するデータセンターに送られることはない、ということになります。
とはいえ、実際には何かしらのデータが送られなければ、USやフランスにあるAzure OpenAIで処理できないため、何かしらの形でデータは送られます。ただ、そこで送信されるデータは
- User Prompt(ユーザーの質問)
- Meta Prompt(データスキーマ: 列ヘッダー/テーブル名など)
- ユーザーIDで照会されたデータ
等のメタデータ情報を中心としたものとなります。
以前は不正使用監視のため、ユーザーデータを30日間保存していました(有害な言語や適切に使用されるべきでないキーワードなどを手動で保存)。現在は、自動化されたシステムにより保存する必要がなくなっています。
Copilotを利用するにはGPU*1が必要であることは周知の通りです。しかし2024年5月現在、まだフランスとアメリカでしか利用できません。以前は、ヨーロッパのユーザーがEU圏内でデータを保持したい場合、「Copilot を有効にする」と「地理間データ処理を有効にする」を選択する必要がありましたが、現在はそのようなことを行う必要がなくなっています(米国は米国、ヨーロッパはフランスのAzure OpenAIを活用する)。
日本を拠点とする人は殆ど気にする必要はないかもしれませんが、GDPR (一般データ保護規則) が厳しいヨーロッパでは多くの質問が上がっていました。
一方、EU/US以外では、Copilotを利用するには上図の通り、「Copilot を有効にする」と「地理間データ処理を有効にする」を✅にする必要があります。Copilot for Power BIのAzure OpenAIの利用について、他の地域でGPUが追加されるかどうか、またその時期について、現時点(2024年5月)では未定*2 となっています。
なお、日本からメタデータがUS/フランスのどこに送られたかは上図の「Azure OpenAI Serviceがホストされる地理的エリア」から知ることができます。
繰り返しになりますが、MicrosoftはユーザーからUser PromptとMeta Promptがパッケージされた情報を受け取ることはあっても、ユーザーが持つデータにアクセスすることはありません。
現時点のCopilot機能について
ここで現時点のCopilot for Power BIの機能についておさらいをしておきます。詳細はリンク先を見て頂きたいのですが、大きく下記4つに分かれます。
- DAX Query View with Copilot: Power BI Desktopで利用可能。メジャーの作成、説明/文書化など
- Copilot for Power BI: 2024年4月からPower BI Desktopで利用可能。レポート作成を迅速化
- Q&A同義語: Copilotによる同義語の生成(こちら)
- Narratives: ”説明”機能(インサイトをリストアップ)。Narrativesは現時点、最も人気の高いCopilotの機能の1つ
レポート作成のCopilot機能について
- レポート作成:
- 現在: ユーザーの初期作業を支援
- 今後: 変更機能のサポート、対話型のレポート作成が可能に
- 要約:
- 現在: 箇条書きリスト。レポート内のデータに基づく質問のみ対応
- 今後: セマンティックモデルに基づく質問が可能
- DAX Copilot: 一般的な質問が可能となる。DAX関数や使用例など。現在はPower BI Desktopでのみ利用可能のところ、2024年中にWeb UIでも利用できるようになる予定
- Copilot チャットペイン:
- 現在: 編集および表示モードのみサポート
- 今後: アプリの履歴を保持し、複数ページにわたる要約が可能になる。近い将来には、質問に対してチャットペイン内にビジュアルを表示させることが可能となる。また、Copilotか前の文脈を理解し、対話型の利用も可能に
Copilot for Power BIで上がっているリクエストの1つとして、ステップ・バイ・ステップでレポートを作成する機能があります。これは、ユーザーが質問し、それに基づいてチャットペインに表示されたビジュアルをレポートキャンバスに挿入できる機能であり、今後数ヵ月のうち提供されるでしょう
なお、日本語対応はもう少し先になりそうです。
その他FAQ
Q1. GAによるCopilot for Power BIは何が変わりますか?
A1. GAにより、GPT-4 32Kが採用される。パブリックプレビューでリリースされた時よりも精度やパフォーマンスが向上するだろう。ただし、GA発表の数週間後に各テナントへ順次展開されるため、5月末時点では展開されていない可能性が高い
Q2. Copilotのハルシネーション(幻覚)が怖いです
A2. Microsoftはプロンプトを使って、LLM*3が幻覚を出さないように導こうとしている。例えば、要約機能では、LLMが勝手に計算するのを避け、Microsoftが送ったデータの値だけを使うようにリクエストをしている
Q3. 会社が独自に持っているデータをCopilotにトレーニングをさせたいが可能か?
A3. FabricのCopilotはお客様のデータでトレーニングを行っていません。現時点、そのような選択肢はありません。
Q4. 他の企業におけるCopilot for Power BIのユースケースについて教えてほしい
A4. 製造業、ヘルスケア、金融業等では、ビジネスユーザーが、企業のITチームを介さずに、Copilotを使用して独自のレポートを作成できるようしている。一方、医療機器、自動車業界では、販売者がレポートについて質問できるようにし、地域の業績をより理解できるようにしている
Q5. Copilot for Power BIを賢く利用するためのTipsを教えて欲しい
A5. セマンティックモデルのベストプラクティスに従う。これには、Copilotが正しい名前を参照できるようにテーブル名とフィールド名を区別すること、データ型が正確であること、不要なフィールドがモデル内に隠されていることを確認することが含まれる
Update your data model to work well with Copilot for Power BI - Power BI | Microsoft Learn
Q6. Copilot for Power BIにおて、クエリが可能となるテーブル数の制限はあるか?
A6. そのような制限はありません。セマンティックモデルが大きい場合、より大きなデータスキーマをプロンプトとして送信していることになる
Q7. Copilot in Fabric(for Power BI)のアーキテクチャについて知りたい
A7. 現時点開示しておらず、FabricのCopilotチームと協力する必要がある
Q8. データに対するフォローアップ質問(インターアクティブな質問)を行いたい
A8. まだサポートされていないが、ロードマップに入っている(前述済)。
Q9. 例を使用して、Copilotのパフォーマンスチューニングを行いたい
A9. Copilotは顧客データを使用しないため、チューニングはできない
Q10. Copilotによって返された結果(例: チャート等)に対する簡潔な説明文を付けて欲しい
A10. 良いフィードバックであり、今後導入される可能性はある
Q11. Copilot 導入前に作成された既存の PBI レポートに、Copilot を使用するためのベストプラクティスを適用することが困難
A11. Power BIのベストプラクティスに従うことが重要で、特にテーブル名とフィールド名が明確であること、データ型が正確であること、不要なフィールドがモデル内に隠されていないことを確認する。これを機にデータ資産の棚卸を行うことを推奨
最後に
Copilot for Power BI がGAしたからと言って、ユーザーが望む全ての機能が搭載されているわけではないことに留意が必要です。現時点、
- 日本語対応(ローカライゼーション)
- F64+のSKUサイズの見直し
- Copilotの表示結果の精度向上
- Copilotの表示結果のパフォーマンス向上
- 表示結果の確からしさに対する担保(こちらは予定されている)
等が更に良くなることに期待していきたいところです。