読了 - データマネジメントが30分でわかる本
データアナリスト、データサイエンティスト。
最近、高所得エンジニアとして注目されてますから、なりたい人は多いはず。
必要なスキルは統計、分析、機械学習、AI関連の知識、etc....
勉強することは盛りだくさん。
そう簡単になれる職業ではなさそうですが、これらのスキルはいずれも「どの程度できるのか」がわかりにくいですね。
そこで考えてみました。
仕事を頼む側の立場なら、どういうことが『出来て当然、知ってて当然』な人であって欲しいか?
私なら「データ活用って何から始めて、どうすればいい?」という質問に分かり易い答えを返してほしいです。
前置きが長くなりましたが、これが本書を読んでみた理由でした。
読後に感じたのは「この本、使える」
本書を一言でまとめるなら『データ活用』を実践・定着させるための実用書です。
「データマネジメント知識体系ガイド 第二版」(略称はDMBOK 2nd)をベースにデータマネジメントの考え方の道筋を示そうとした書籍。
なによりもその構成が面白い。
11ある各章ごとに、
【30秒コース】一言で!
【3分コース】なにそれ
【30分コース】どうして
【30分コース】ゴール
【30分コース】具体的にどうする
【3時間コース】ケーススタディ
と、構成されてます。
上司や周りに「データアーキテクチャって何?」と聞かれたら、まず『【30秒コース】一言で!』をそのまま伝えた後、『【3分コース】なにそれ』を使って説明するのに使えます。
それで、自分が担当になったら【30分コース】と【3時間コース】で得た知識をもとに進める、なんてことが出来そうです。
特に【30分コース】、【3時間コース】は著者らの日頃のノウハウを盛り込んでおられるようで、先に知っていなければ見落としそうなTipsも盛り込まれてました。
幾つかピックアップさせて頂きましょう。
まずは、7章 データ品質。
- ルールを策定する際には、データのライフサイクル全般を管理できるよう働きかけましょう。データの出口だけを高品質に保つのではなく、入口や途中のプロセスで高品質を担保する発想が重要です。
- ビジネスで施策を行うなら、効果をモニタリングしたいですよね。ならばログ要件は早い段階で定義すべきです。
システム開発では「機能を実現すること」に重視しすぎて「ビジネス・業務としての効果」に対する配慮がおろそかになりがちです。
実際、ログをビジネス・業務の効果確認に使おうという要件も聞いたことがないです。ここを読んだとき、結構もったいないことしてたんだと焦りました。
つぎに9章の「データ活用を促進する7ステップ」より
⑥地道なハンズオンでデータ文化を醸成します
活用を浸透・定着させるために、こういう活動は地道だけど効果的に違いないでしょう。
見過ごされがちなデータ管理
本書あとがきに
場当たり対応、そろそろ止めませんか?
と、あります。
企業に何か新しい仕組みを導入する場合、前述のように「機能」にだけ注目され、データはシステム間でツギハギになってしまってることは、本当によくあります。
しかし、DXに必要不可欠なものは「データ」です。
ほんの数年前とは、種類・量とも比較にならないほど安価で容易に集めることが出来るようになりました。
当然、データを集めても活用できなければハードディスクの肥やしにしかなりません。
データは場当たり的に集めるのではなく、きちんとマネジメントすべきです。
DMBOK 2ndは、いきなり買うには高いし難しいようなので、本書から始めるのが良さそうです。
(Amazon kindle unlimitedで読んだんですが、改めてこの本は買いました)