テクテク日記

テクテク=テクノロジー&一歩ずつ(テクテク)

Copilot for Power BI の GA(一般提供)

Copilot for Power BIがGA (General Availability)となったことを受け、下記いくつかのポイントをまとめておきたいと思います。まずブログで正式発表となりましたが、FabricにおいてCopilot対応の全てのワークロードがGAとなっているのではなく、Copilot for Power BIだけのGAとなっています。

Copilot in Microsoft Fabric is now generally available in the Power BI experience | Microsoft Power BI ブログ | Microsoft Power BI

Copliot for Power BIとは

Microsoft Fabricが目指す世界の4つ目の特徴が「AI 搭載」であり、全てのワークロードにCopilotを搭載することを目指しています。

AI機能は今後全てのデータ関連サービスに織り込まれてくるでしょうし、Fabricに搭載されたCopilotは開発者からビジネスユーザーまで、あらゆるペルソナの生産性を高めることを目標としています。

直近の顧客対応において、Copilot for Power BIをリードするLadaさんに質問することが多く、その中で様々な回答を得ることができたのでそれらをまとめて共有しておきます。Copilot for Power BIの機能紹介については、下記のリンクをご参考ください。

Copliot for Power BIのセキュリティについて

非常に良く質問されるのがセキュリティ問題になります。すなわち、「MicrosoftがCopilot搭載して、仕事が便利になるのは分かっているけど、自社のデータをどのように扱っているのかが不安」といった質問になります。

これに対する答えはシンプルに、

Microsoftはモデルの訓練に顧客データを使うことはない

となります。言い換えれば、実際の顧客データ(生データ等)がMicrosoftが管理するデータセンターに送られることはない、ということになります。

とはいえ、実際には何かしらのデータが送られなければ、USやフランスにあるAzure OpenAIで処理できないため、何かしらの形でデータは送られます。ただ、そこで送信されるデータは

  • User Prompt(ユーザーの質問)
  • Meta Prompt(データスキーマ: 列ヘッダー/テーブル名など)
  • ユーザーIDで照会されたデータ

等のメタデータ情報を中心としたものとなります。

以前は不正使用監視のため、ユーザーデータを30日間保存していました(有害な言語や適切に使用されるべきでないキーワードなどを手動で保存)。現在は、自動化されたシステムにより保存する必要がなくなっています。

learn.microsoft.com

Copilotを利用するにはGPU*1が必要であることは周知の通りです。しかし2024年5月現在、まだフランスとアメリカでしか利用できません。以前は、ヨーロッパのユーザーがEU圏内でデータを保持したい場合、「Copilot を有効にする」と「地理間データ処理を有効にする」を選択する必要がありましたが、現在はそのようなことを行う必要がなくなっています(米国は米国、ヨーロッパはフランスのAzure OpenAIを活用する)。

日本を拠点とする人は殆ど気にする必要はないかもしれませんが、GDPR (一般データ保護規則) が厳しいヨーロッパでは多くの質問が上がっていました。

一方、EU/US以外では、Copilotを利用するには上図の通り、「Copilot を有効にする」と「地理間データ処理を有効にする」を✅にする必要があります。Copilot for Power BIのAzure OpenAIの利用について、他の地域でGPUが追加されるかどうか、またその時期について、現時点(2024年5月)では未定*2 となっています。

なお、日本からメタデータがUS/フランスのどこに送られたかは上図の「Azure OpenAI Serviceがホストされる地理的エリア」から知ることができます。

繰り返しになりますが、MicrosoftはユーザーからUser PromptとMeta Promptがパッケージされた情報を受け取ることはあっても、ユーザーが持つデータにアクセスすることはありません。

現時点のCopilot機能について

ここで現時点のCopilot for Power BIの機能についておさらいをしておきます。詳細はリンク先を見て頂きたいのですが、大きく下記4つに分かれます。

  • DAX Query View with Copilot: Power BI Desktopで利用可能。メジャーの作成、説明/文書化など
  • Copilot for Power BI: 2024年4月からPower BI Desktopで利用可能。レポート作成を迅速化
  • Q&A同義語: Copilotによる同義語の生成(こちら
  • Narratives: ”説明”機能(インサイトをリストアップ)。Narrativesは現時点、最も人気の高いCopilotの機能の1つ

レポート作成のCopilot機能について

  • レポート作成:
    • 現在: ユーザーの初期作業を支援
    • 今後: 変更機能のサポート、対話型のレポート作成が可能に
  • 要約:
    • 現在: 箇条書きリスト。レポート内のデータに基づく質問のみ対応
    • 今後: セマンティックモデルに基づく質問が可能
  • DAX Copilot: 一般的な質問が可能となる。DAX関数や使用例など。現在はPower BI Desktopでのみ利用可能のところ、2024年中にWeb UIでも利用できるようになる予定
  • Copilot チャットペイン:

    • 現在: 編集および表示モードのみサポート
    • 今後: アプリの履歴を保持し、複数ページにわたる要約が可能になる。近い将来には、質問に対してチャットペイン内にビジュアルを表示させることが可能となる。また、Copilotか前の文脈を理解し、対話型の利用も可能に
      Copilot for Power BIで上がっているリクエストの1つとして、ステップ・バイ・ステップでレポートを作成する機能があります。これは、ユーザーが質問し、それに基づいてチャットペインに表示されたビジュアルをレポートキャンバスに挿入できる機能であり、今後数ヵ月のうち提供されるでしょう

なお、日本語対応はもう少し先になりそうです。

その他FAQ

Q1. GAによるCopilot for Power BIは何が変わりますか?

A1. GAにより、GPT-4 32Kが採用される。パブリックプレビューでリリースされた時よりも精度やパフォーマンスが向上するだろう。ただし、GA発表の数週間後に各テナントへ順次展開されるため、5月末時点では展開されていない可能性が高い

Q2. Copilotのハルシネーション(幻覚)が怖いです

A2. Microsoftはプロンプトを使って、LLM*3が幻覚を出さないように導こうとしている。例えば、要約機能では、LLMが勝手に計算するのを避け、Microsoftが送ったデータの値だけを使うようにリクエストをしている

Q3. 会社が独自に持っているデータをCopilotにトレーニングをさせたいが可能か?

A3. FabricのCopilotはお客様のデータでトレーニングを行っていません。現時点、そのような選択肢はありません。

Q4.  他の企業におけるCopilot for Power BIのユースケースについて教えてほしい

A4. 製造業、ヘルスケア、金融業等では、ビジネスユーザーが、企業のITチームを介さずに、Copilotを使用して独自のレポートを作成できるようしている。一方、医療機器、自動車業界では、販売者がレポートについて質問できるようにし、地域の業績をより理解できるようにしている

Q5. Copilot for Power BIを賢く利用するためのTipsを教えて欲しい

A5. セマンティックモデルのベストプラクティスに従う。これには、Copilotが正しい名前を参照できるようにテーブル名とフィールド名を区別すること、データ型が正確であること、不要なフィールドがモデル内に隠されていることを確認することが含まれる
Update your data model to work well with Copilot for Power BI - Power BI | Microsoft Learn

Q6. Copilot for Power BIにおて、クエリが可能となるテーブル数の制限はあるか?

A6. そのような制限はありません。セマンティックモデルが大きい場合、より大きなデータスキーマをプロンプトとして送信していることになる

Q7. Copilot in Fabric(for Power BI)のアーキテクチャについて知りたい

A7. 現時点開示しておらず、FabricのCopilotチームと協力する必要がある

Q8. データに対するフォローアップ質問(インターアクティブな質問)を行いたい

A8. まだサポートされていないが、ロードマップに入っている(前述済)。

Q9. 例を使用して、Copilotのパフォーマンスチューニングを行いたい

A9. Copilotは顧客データを使用しないため、チューニングはできない

Q10. Copilotによって返された結果(例: チャート等)に対する簡潔な説明文を付けて欲しい

A10. 良いフィードバックであり、今後導入される可能性はある

Q11. Copilot 導入前に作成された既存の PBI レポートに、Copilot を使用するためのベストプラクティスを適用することが困難

A11. Power BIのベストプラクティスに従うことが重要で、特にテーブル名とフィールド名が明確であること、データ型が正確であること、不要なフィールドがモデル内に隠されていないことを確認する。これを機にデータ資産の棚卸を行うことを推奨

最後に

Copilot for Power BI がGAしたからと言って、ユーザーが望む全ての機能が搭載されているわけではないことに留意が必要です。現時点、

  • 日本語対応(ローカライゼーション)
  • F64+のSKUサイズの見直し
  • Copilotの表示結果の精度向上
  • Copilotの表示結果のパフォーマンス向上
  • 表示結果の確からしさに対する担保(こちらは予定されている)

等が更に良くなることに期待していきたいところです。

*1:「Graphics Processing Unit(グラフィックス処理装置)」の略で、主にコンピュータのグラフィックスの描画を担当するハードウェアの一部。高い並列処理能力が持っており、AI時代に欠かせないハードウェア。GPUで最も有名な企業は時価総額世界上位のNVIDIAとなる

*2:異なるCopilotチームにGPUを割り当てなければならず、追加リージョンの情報がありません。Microsoftグループ全体で(限られた)GPUをすべての製品に割り当てなければならないことが理由

*3:Large Language Model