前回は、#sectionsキーワードを使用してPower Queryにクエリを追加する際に、自動的に集計を行う方法について説明しました。今回は、この手法を活用して各テーブルのメタデータ情報を集計する方法についてご紹介します。 なお、この方法はデータモデリングの…
Power Queryを集計する方法は過去いろいろ話してきましたが、中でも便利な関数の1つにTable.Combineがあります。このブログで何度も紹介していますが、複数のレコードでテーブル型の列に対して、 Table.Combine(前ステップ[列名])※前ステップ[列名]はリスト …
SharePointドキュメントライブラリのフォルダをフォルダツリーの状態にして管理したいというリクエストがありましたので、そのやり方について少し研究してみました。Power BIで可視化させるためにはデータを親子階層(Parent-Child Hierarchy)で持っておく…
前回はFabricを使用してPower BIのレポートを構築する方法について解説しました。今回は、Power BI Desktopで作成されたデータセットに対してライブ接続を行った場合の留意点について説明をします。データセットは、Excelでいうテーブルに相当しますが、Powe…
前回、Fabricにおける各種アイテム(ステージングアイテム、データフロー、Lakehouse等)やOneLakeの機能であるショートカットについて、M以外の言語(T-SQL, Spark SQL, pySpark)によるデータ変換を説明しました。下図で言うと「ロード先」のステップまで…
前回はDataflow Gen2を使用してソースからデータをインポートし、Fabricを介してデータをLakehouseにロードする方法を紹介しました。今回は、ここから日付テーブルを追加し、Power BIで可視化する前まで見ていきたいと思います。たかが日付テーブルというこ…
お客様から割賦ビジネスに関する質問がありましたので、今回はそれについて詳しく解説したいと思います。類似業態ですが、1年前にはSaaS分析に関してKPIの作成やDAXのディープダイブについて、10回にわたるシリーズで解説を行いました。 SaaSビジネスに近い…
Microsoft Fabric (以下、Fabric)が登場して約1ヵ月が経ちました。Fabricは、Power BIをベースとしたSaaS*1型のオールインワンアナリティクス基盤であり、データ分析に必要なワークロードがすべて含まれています。 各種のワークロードには、それぞれ異なる…
Microsoft Fabricが登場して、ちょうど2週間が経過しました。今回はFabricに対する向き合い方について、私見を入れて考えてみました。 marshal115.hatenablog.com
米国時間2023年5月23日から開催されたMicrosoft Buildは、歴史的な瞬間となりました。データアナリティクスの世界において世界初となるエンドツーエンド(E2E)のSaaS*1型アナリティクスサービス、Microsoft Fabric(以降「Fabric」)の登場です。Microsoft …
Power BIで在庫分析を行う場合、DAXで在庫メジャーを記述する必要があります。在庫が必要な理由は、 商品・製品の売れるタイミングと仕入れたり、製造したりするタイミングにズレがある ためであり、機会損失(欠品)を防ぐために必要なものとなります。在庫…
拡張コンピューティング エンジンデータフローシリーズの最後として、実際にデータフローの運用シナリオについて見ていきたいと思います。複数の選択肢があると思いますが、どのように選択するかはライセンスの種類や企業内部のポリシーに従うものとなります…
少し前に書いた記事では、Monthlyベースの日付テーブルの違いや、使用する際に留意すべき点、モデリングを変更する必要性についてお話しました。今回は、MonthlyベースとDailyベースの日付テーブルのそれぞれで計算した結果に関するクエリパフォーマンスにつ…
Power BIではモデリングのベストプラクティスの1つに、不要な列をデータモデルに読み込まないルールが有名です。不要な列が減れば、データモデルのサイズが軽くなり、その結果DAXエンジンが計算を行うためにデータをスキャンする時間も短くなります。当たり…
前回は「リンクされたエンティティ」の更新時の動作について検証しましたが、今回はそれに加えて、「計算されたエンティティ」に関するシナリオも見ていきます。前回よりも詳細に掘り下げていますが、最後まで読んでいただければ、データフローの更新ロジッ…
前回は、Premium環境におけるデータフローの機能について説明しました。今回は、1つのデータフローから別のデータフローを構築する場合の留意点について見ていきたいと思います。シナリオをいくつか準備したので、1つずつ見ていきます。
Power BIは、時間単位まで詳細な分析を可能にする一方、財務分析など多くの企業では月次ベースの分析が一般的だと思われます。今回は、月次データの分析について考えていきたいと思います。
データフローに関して、前回から少し間が空いてしまいましたが、データフローを通常(Premium)に運用する際のことについて、留意点も含め記載しておきたいと思います。これまでの話では、データフローは ステージングクエリ(ストレージ)であり、ソースシ…
以前のブログでデータフローの更新について紹介しました。更新履歴を可視化したpbixについて具体的に解説しませんでしたが、今回はこれについて少し改善された点も含めて簡単に紹介したいと思います。
Power BIのスライサーは通常、フィルターを行う機能となります。例えば、下図のようなチャートがあるとします。 2019をクリックすると、チャートは2019年の売上でフィルターされ、下図のようになります。 ここで、以下のような少し特殊なニーズについて考え…
最近はデータフローばかり書いているので、口直しに現在爆発的に人気となっているChatGPTを使ってPower BI関連のQ&Aをしてみました。私は立場上、Power BIを活用されるお客様の様々な質問に答える立場にあるため、実はChatGPTとの相性が非常に良いです(例:…
データフローのシリーズは前回に続き、もう少し続きます。データフローはPower BI Pro、もしくはPremium(PPC、もしくはPPU*1)でしか使えませんので、通常よりも追加コストが掛かってしまいます。そこで今回はPower BI Proだけで運用する場合のやり方を紹介…
前回はデータフロー(Power Query Online)の便利なショートカット等について触れてきました。データフローはPower Queryと同じ体験ですが、クラウドサービスということで料金の問題であったり、使い勝手がデスクトップ版のPower Queryと異なったりすること…
前回はデータフローの基礎及び簡単なデモを紹介しましたが、今回はそれをより使いやすくするためのTipsについて少し紹介したいと思います。前回もお話をしましたが、データフロー(Power Query Online)はモダンUIがベースとなっており、こちらはいずれPower…
前回はデータフローの概要について話をしましたが、今回はもう少し掘り下げつつ、実際にハンズオンで構築してみたいと思います。データフローのユースケースは前回少し話をしましたが、個人+組織の両方で活用を広げていくことが目的となります。データフロ…
ExcelやPower BI Desktopに搭載されているセルフサービスETL*1機能であるPower Queryは本ブログで何度も紹介してきました。Power Queryはローカル環境で作業するのに最適で、特にスペックの高いPCを使っている場合、メモリフットプリントを最小化して処理を…
あけましておめでとうございます。思えば、2022年に書いた最後の記事が100回目だったこともあり、2022年では計52記事(平均週1のペース)となりました。2023年の抱負は何といってもエンタープライズ型セルフサービスBIの推進をしていくことであり、そのため…
一年に一回の長編ブログということで、今年は自分がPower BIに出会ってから、どうやって苦しみ、絶望の中から一筋の光を見出してPower BIにオールインを決めたかについて、お話したいと思います。 今でこそ、Power BIの製品チームとして日本・海外企業向けに…
列のピボットについて書くかどうか迷いましたが、意外と知っておいたほうが良いことが多かったので、概念と落とし穴、そして補正についてまとめました。特にエラーが発生しやすいこともあり、公式Docsには載っていない解決法も一緒に見ていきたいと思います…
前回はPower BIからDr.Sumに接続した際の読込パフォーマンスについて見てきました。 今回はDr.SumをソースとしたDirectQueryのパフォーマンスについて見てみたいと思います。