Power Query
前回と少し重複する箇所があるかもしれませんが、今回はさらに具体例を交えながらモデリングのベストプラクティスについて探っていきたいと考えています(一部は重要な補足も含まれています)。
Power BIを使用する際の”ベストプラクティスを教えて欲しい”というリクエストは非常に多く聞かれます。ベストプラクティスはその人の経験、知識量によって対象となるコンテンツが異なってきますが、今回のPower BIを利用し始めたばかりの人でも即効性の高い…
Microsoft Igniteで様々な刺激的な発表がありましたが、特に注目されたのがCopilotでした。Copilotは、Microsoftが提供する人工知能を活用したプログラミング支援ツールや生産性向上ツールの総称であり、「GitHub Copilot」、「Copilot for Microsoft 365」…
以前に「Power BIデータセットをドキュメントする」についての記事を執筆しましたが、今回はその続編となります。Power BIのデータセットに関して、DMV*1経由で様々なメタデータ情報を取得できますが、Power BIサービスにあるセマンティックモデル(データセ…
Power BIはモデルが大きくなってくると、どのようなメジャーが使用され、計算列、メジャーの数式、リレーションシップ等を把握するため、それらを可視化したくなるニーズが出てきます。今回はそれを可能にする方法について紹介したいと思います。説明を読む…
前回は、#sectionsキーワードを使用してPower Queryにクエリを追加する際に、自動的に集計を行う方法について説明しました。今回は、この手法を活用して各テーブルのメタデータ情報を集計する方法についてご紹介します。 なお、この方法はデータモデリングの…
Power Queryを集計する方法は過去いろいろ話してきましたが、中でも便利な関数の1つにTable.Combineがあります。このブログで何度も紹介していますが、複数のレコードでテーブル型の列に対して、 Table.Combine(前ステップ[列名])※前ステップ[列名]はリスト …
SharePointドキュメントライブラリのフォルダをフォルダツリーの状態にして管理したいというリクエストがありましたので、そのやり方について少し研究してみました。Power BIで可視化させるためにはデータを親子階層(Parent-Child Hierarchy)で持っておく…
前回はDataflow Gen2を使用してソースからデータをインポートし、Fabricを介してデータをLakehouseにロードする方法を紹介しました。今回は、ここから日付テーブルを追加し、Power BIで可視化する前まで見ていきたいと思います。たかが日付テーブルというこ…
お客様から割賦ビジネスに関する質問がありましたので、今回はそれについて詳しく解説したいと思います。類似業態ですが、1年前にはSaaS分析に関してKPIの作成やDAXのディープダイブについて、10回にわたるシリーズで解説を行いました。 SaaSビジネスに近い…
Microsoft Fabric (以下、Fabric)が登場して約1ヵ月が経ちました。Fabricは、Power BIをベースとしたSaaS*1型のオールインワンアナリティクス基盤であり、データ分析に必要なワークロードがすべて含まれています。 各種のワークロードには、それぞれ異なる…
拡張コンピューティング エンジンデータフローシリーズの最後として、実際にデータフローの運用シナリオについて見ていきたいと思います。複数の選択肢があると思いますが、どのように選択するかはライセンスの種類や企業内部のポリシーに従うものとなります…
Power BIではモデリングのベストプラクティスの1つに、不要な列をデータモデルに読み込まないルールが有名です。不要な列が減れば、データモデルのサイズが軽くなり、その結果DAXエンジンが計算を行うためにデータをスキャンする時間も短くなります。当たり…
前回は「リンクされたエンティティ」の更新時の動作について検証しましたが、今回はそれに加えて、「計算されたエンティティ」に関するシナリオも見ていきます。前回よりも詳細に掘り下げていますが、最後まで読んでいただければ、データフローの更新ロジッ…
前回は、Premium環境におけるデータフローの機能について説明しました。今回は、1つのデータフローから別のデータフローを構築する場合の留意点について見ていきたいと思います。シナリオをいくつか準備したので、1つずつ見ていきます。
Power BIは、時間単位まで詳細な分析を可能にする一方、財務分析など多くの企業では月次ベースの分析が一般的だと思われます。今回は、月次データの分析について考えていきたいと思います。
データフローに関して、前回から少し間が空いてしまいましたが、データフローを通常(Premium)に運用する際のことについて、留意点も含め記載しておきたいと思います。これまでの話では、データフローは ステージングクエリ(ストレージ)であり、ソースシ…
以前のブログでデータフローの更新について紹介しました。更新履歴を可視化したpbixについて具体的に解説しませんでしたが、今回はこれについて少し改善された点も含めて簡単に紹介したいと思います。
データフローのシリーズは前回に続き、もう少し続きます。データフローはPower BI Pro、もしくはPremium(PPC、もしくはPPU*1)でしか使えませんので、通常よりも追加コストが掛かってしまいます。そこで今回はPower BI Proだけで運用する場合のやり方を紹介…
前回はデータフロー(Power Query Online)の便利なショートカット等について触れてきました。データフローはPower Queryと同じ体験ですが、クラウドサービスということで料金の問題であったり、使い勝手がデスクトップ版のPower Queryと異なったりすること…
前回はデータフローの基礎及び簡単なデモを紹介しましたが、今回はそれをより使いやすくするためのTipsについて少し紹介したいと思います。前回もお話をしましたが、データフロー(Power Query Online)はモダンUIがベースとなっており、こちらはいずれPower…
前回はデータフローの概要について話をしましたが、今回はもう少し掘り下げつつ、実際にハンズオンで構築してみたいと思います。データフローのユースケースは前回少し話をしましたが、個人+組織の両方で活用を広げていくことが目的となります。データフロ…
ExcelやPower BI Desktopに搭載されているセルフサービスETL*1機能であるPower Queryは本ブログで何度も紹介してきました。Power Queryはローカル環境で作業するのに最適で、特にスペックの高いPCを使っている場合、メモリフットプリントを最小化して処理を…
あけましておめでとうございます。思えば、2022年に書いた最後の記事が100回目だったこともあり、2022年では計52記事(平均週1のペース)となりました。2023年の抱負は何といってもエンタープライズ型セルフサービスBIの推進をしていくことであり、そのため…
一年に一回の長編ブログということで、今年は自分がPower BIに出会ってから、どうやって苦しみ、絶望の中から一筋の光を見出してPower BIにオールインを決めたかについて、お話したいと思います。 今でこそ、Power BIの製品チームとして日本・海外企業向けに…
列のピボットについて書くかどうか迷いましたが、意外と知っておいたほうが良いことが多かったので、概念と落とし穴、そして補正についてまとめました。特にエラーが発生しやすいこともあり、公式Docsには載っていない解決法も一緒に見ていきたいと思います…
前回はPower BIからDr.Sumに接続した際の読込パフォーマンスについて見てきました。 今回はDr.SumをソースとしたDirectQueryのパフォーマンスについて見てみたいと思います。
知っている人は知っていますが、Power BIのカスタムコネクタにDr.Sumが対応しました。Dr.SumはWingArc1st社のデータ分析基盤(DWH)ですが、日系ベンダーにおいては相応に人気があるようです。 Dr.SumにPower BIを繋げる機会をもらいましたので、このブログ…
最近はお客さんの要望が多くなってきたせいか、良い意味でちょこちょこPower BIを触ってます。以前は在庫分析ばかりやっていたので、モデリングや使うメジャーに偏りが生じていましたが、最近はそれもないということで色んな分析ができてなかなか面白い。今…
Power BIを活用している方であればインポートモードとDirectQueryの違いについてもある程度知っているかもしれません。今回はPower BI CATチームのPhilさんに共有してもらったDirectQueryにまつわる謎(留意点)について紹介したいと思います。 PhilさんはDA…