CSVを結合する方法をいくつか紹介してきましたが、今回はその中で基もお手軽にファイルを結合できる方法を紹介します。その前に、CSVファイルを結合する方法をおさらいをしておきますと、
- Binary.Combine( 前ステップ[Content] )
- Csv.Document ( 前ステップ, [Encoding = 932] ) > 列の展開
という2つの方法でしたが、今回紹介するやり方は上記2つのどちらよりもお手軽にできるものとなります。
続きを読む前々回の記事はCSVファイルをBinary.Combineで結合する方法を紹介しましたが、今回はCsv.Documentという関数を使ってデータを抽出する方法を見ていきます。Csv.DocumentはCSVファイルやTextファイルからデータを抽出する際に使われるM言語で、csvやtextファイルのデータ結合に際して使われます。CSVは通常、カンマ「,」区切りで構成されたフラットファイル*1であり、textファイルの多くはタブ区切りで構成されています。
*1:データを列挙したテキストファイルで、改行文字によって各レコードが仕切られているもの。Excelとは異なり、複数のシートでのデータを格納するのではなく、1つのファイルで1つのテーブル(データセット)でデータを格納する
気づけばPower Query(パワークエリ)に関しては4回目の記事となりました。小出しにしているわけではないですが、細かいところや背景等をプラスしていくと、どうしても記事が多くなってきます。
私がPower Queryを本格的に使い始めたのが2016年末の時でしたので、2020年10月時点で約4年のキャリアということになります。思えば当時一番最初にやったのが、今回解説するPower Queryによるデータ集計であり、基礎中の基礎であると同時に、最も使用頻度の高い作業になります。
データ集計はデータソースの種類やデータのクリーン度合いによって多くのパターンが存在し、一回の記事では紹介しきれないので、数回に分けて行いたいと思います。以下今回のコンテンツとなります。
続きを読む前回に続き、Power Query(パワークエリ)の基礎について話をします。記事に出ているExcelはOffice 365バージョンですが、必要に応じでExcel 2016のスクリーンショットも載せています。なお、OSはWindowsとなりますので、Macユーザーの方は以下のリンクをご参考ください。
Power QueryはExcel 2016以降であればExcelに標準搭載されていますが、Excel 2010(Microsoft Office 2010 Professional Plus)やExcel 2013まではアドインとしてダウンロードする必要があり、ご自身の使用バージョンがこれらに当たる場合は下記サイトよりダウンロードしてください。
Power Queryを設定する前にとても重要なことの1つに、現在使用されているExcelのバージョンチェックがあります。以下手順となります。
※ Office 365のExcelを前提
少し前にPower Query(パワークエリ)で簡単にWeb上のデータを抽出できるデモをやりましたが、今回から基礎について見ていきたいと思います。
Power Queryの基本的な特徴は以下の通りです。
世界が新型コロナの影響を受ける中、情報共有の一環としてPower BIで新型コロナ(COVID-19)のBI*1レポートを作成してみました。BIレポートの作成にはPower Query及びDAX / Data Modelの知識が必要ですが、これら全てを駆使して出来上がったものが下記の埋め込みレポートです。ちなみに、レポートは作成後も見た目、指標、使い勝手などを随時調整していますが、大まかな枠組み(80%程度)は3日で仕上げています。
*1:BI = Business Intelligence略。BIツールを用いて、大量データの分析やその結果を可視化することで経営上の意思決定を迅速にサポートする手法