Microsoft Fabricが登場して、ちょうど2週間が経過しました。今回はFabricに対する向き合い方について、私見を入れて考えてみました。
Fabricという世界
Fabricは、あらゆるアナリティカル・ワークロード*1をSaaS*2化(英語ではSaaS-ification)し、"データのサイロ化*3"というデータの世界における課題に対する解決策を提供できるようになりました。OneLakeという共通のプラットフォームを使用して、あらゆるデータを1つの場所に統合し、Delta Parquetフォーマットを介してすべてのワークロードが利用できるようになっています。
突然ですが、上記の解説は、データの世界に詳しい人にとってはわかりやすい説明だと思いますが、ExcelやセルフサービスBIのような領域から来た人にとっては、初めて見ると非常に理解しづらい説明になるかもしれません。ゲームに例えると、序盤からエキサイティングな展開に引き込まれているものの、突然LV100のラストボスが現れて「取りあえず倒そう」と試みるも、戦闘で全滅してしまい、気づいたら主人公は森の小屋で目覚め、宿敵を倒すためにレベルアップの旅が始まるような展開になる感覚に近いかもしれません。
なぜこの話をしたかと言いますと、Fabricはまさにこのようなゲームに近いことが今後、リアルの世界で起こることが予想されるためです。Power BI自体でも基本的な使い方をマスターするには相当な学習投資が必要であるのに、Fabricの登場で更に領域が広がり、全てを網羅しようとすると膨大な時間と労力が必要になります。
話を元に戻すと、Fabricに対してどのように気持ちの整理・立ち向かい方を行うべきかということになりますが、これに対する答えは、「自分のいる世界を理解し、環境などの条件を把握して自分がどこまでやるべきかを考える」に尽きると思います。Fabricについて語るのであれば、企業レベルで考えるべきですが、今回はあくまで個人を対象とした話をしていきますので、「自分」というのが主語になります。
考えるべきポイント
Fabricを活用する上で、いくつか考えるべきポイント及びプロセスを下記まとめておきました。
- 自分がどのペルソナであるか?
Fabricはペルソナ・ドリブンなサービスです。例えば、Power BIはデータアナリスト、ビジネスユーザー、BIプロ等をターゲットとしていますが、Power BI以外の世界にいる方はDBA*4(Data Warehouse)やデータエンジニア(Data Engineering)、データサイエンティスト(Data Science)等がマッチしますので、ご自身がどれに当たるか(あるいは今後どこに進むか)についてよく認識しておくことが大前提となります。分からないという方は、Excelを使っているのであればPower BIに関わるペルソナであると考えても良いと思います。 - Fabricを利用できる環境にあるか?
会社の規模や新規サービスに対する活用方針は、Fabricの利用可能性に大きな影響を与えるかもしれません。Synapseを使用していた会社の場合、Fabricの導入へのエントリーポイントは比較的低い可能性があります。 - 自分がこれからどこを目指していきたいか。それは会社が求めているものか?
自分がやりたいことを実現できるのは理想的ですが、そうでない場合もあるかもしれません。例えば、Fabricという名前は知っているけれども、各ワークロードに対するスキルを持っていない場合です。この場合、エンドユーザーとしての役割を果たすためには、まずはPower BIというワークロードを体験することから始めるのが良いでしょう。そうすることで、Fabricについての理解を深めることができます。
一方で、Microsoftとは全く関係のない他社のツールを使用しており、コーポレートデータの保守と運用、企業内での大規模なETL処理、データ基盤に関わってきた経験がある人にとっては、Data EngineeringとData Warehouseのワークロードが最適な選択肢となる可能性が高いと思います。
最終的には、自身のスキルセットと経験、会社の要件や目標に基づいて最適な選択をする必要があります。自分の強みや興味に応じて、適切なワークロードに焦点を当て、自己成長と価値提供に取り組むことが重要となります。 - 日常業務とのバランス
ご自身が本来抱える業務が多すぎて、Fabricの導入は優先順位が低い場合もあるでしょう。多くの人に当てはまるかもしれませんので、その点は理解できます。最終的な判断は、自身の目標やニーズ、会社の状況に基づいて行う必要がありますので、無理なく自己成長を図りつつ、興味ある分野に取り組むことで、より充実した結果を得ることができると思います。 - 実際に開始してみる
全ての条件を満たす場合は、無料トライアルを開始してみることをおすすめします。トライアル期間が60日間と制限されているため、出し惜しみせずに積極的に活用してみることが重要です。新しいテクノロジーが登場した場合は、自身の領域においてそのテクノロジーの機能や限界などを把握することが有利です。テクノロジーが成熟する前の状態で把握しておくことで、後からキャッチアップするよりも優位な位置に立つことができます。
機能が多様化し、高度化するほど、キャッチアップに必要な学習量も増え、自身の業務との調整も求められます。そのため、トライアル期間中にFabricの機能をできる限り活用し、自身の業務にどのように適用できるかを試してみることが重要です。 - 用語をしっかり理解する
Fabric全体を理解するには、Power BIのユーザーであればPower BIの視点から様々な新しい用語を正確に把握する必要があります。用語を理解していないか、または重要な用語をあいまいに理解したまま進めると、後で困難な状況に陥る可能性があります。
上記は私が考えるFabricと向き合う方法ですが、会社の方針や環境に左右される可能性が高いことに注意が必要です。ただし、Power BIはSaaSであるにも関わらず、Power BI Desktopから始めることができます。それゆえ、Fabricのワークロードに含まれるからといって、Power BIを使用しない選択肢は考えにくいと思います。
Fabricを使用できる環境がある場合、最終的には全てのワークロードを完璧に理解することは難しいかもしれませんが、エンドツーエンド(E2E)チュートリアルを試してみることが最も一般的な方法だと思います。
ただし、まだPublic Preview段階ですので、機能が不足していたり、動かない場合もあるかもしれませんし、UI*5も使いにくいかもしれません。それでも、自分が最先端のテクノロジーを使っているという自負を持つことができれば、それは大きな成果だと思います。
Fabricの説明を初めて受けた人は、情報量の多さに驚くことになります。ですので、上記の内容を念頭に入れておくと、少し気が楽になるかもしれません。Fabricの全てのワークロードに精通している人は殆どいませんので、まずはどれか1つについて深く学んでいくと良いのではないでしょうか。
*1:Fabricにおけるエクスペリエンス。Data Factory, Data Engineering, Data Warehouse, Data Science, Real-Time Analytics, Power BI, Data Activatorの7つを指す
*2:SaaS(Software as a Service)は、クラウドコンピューティングの一形態であり、ソフトウェアをインターネットを通じて提供するサービスのことを指します。Power BI ProやPower BI Premium、Nextflix等の月額課金サービスが相当します
*3:組織内でデータが分断され、異なる部門やシステム間で情報が孤立している状態
*4:Database Administrator