Google の非公式ブログで、The Unofficial Google Data Science Blog というデータサイエンスをテーマにしたブログがある。
その中で、Practical advice for analysis of large, complex data setsの記事を元にして作られた Google Developers Guides: Machine Learning Guides > Good Data Analysis を昨日見かけて読んでいたら素晴らしいドキュメントだったので、ここでその感動を共有したかったので筆をとったしだい。
Good Data Analysis の概要
-
Technical: どのような技術を使ってデータを見るべきか
-
Process: データへの取り組み方。どのような観点でデータを見るべきか
-
Mindset: どのような考えでデータ分析をすすめていくべきか
の三段構成でガイドブックが書かれている。
特にガイドブックで自分が好きな言葉は Mindset
章の
Data analysis starts with questions, not data or a technique データ分析は質問とともに
のみ
始まる、データや技術からデータ分析は
始まらない
と
Be both skeptic and champion 懐疑的であれ、そしてそのデータに一番詳しい存在(チャンピオン)であれ
でした。
最近課題の理解が本当に大事だなと痛感する出来事に直面した後にこのドキュメントを読んだので非常に刺さりました。
Google は、同様のガイドブックシリーズで
- Rules of Machine Learning: 機械学習実践の聖書。
- 2020年05月時点で自分が実践しているMLOpsの情報収集方法でも取り上げました。
- People+AI Guidebook: 機械学習を用いた体験をどう作り込むかの知識とベストプラクティスがまとめられている
を公開してくれていて、彼らが経験して本質的な知見を文章化して公開してくれるのは非常にありがたい。
「Rules of ML」 も今回の 「Good Data Analysis」も本質的な事柄を選びぬいているので、時間が経過しても全く色褪せない。時間劣化が全くしない情報を文章として残して、それが知識として伝搬される。これぞまさに知の高速道路。
特にマインドセットは、学部や大学院で磨かれる知的生産力だよなぁと思う。
だが、実務でもこのスキルは問題なく磨けると思っている。逆に実社会だからこそ面白い問題に直面しているぶん、楽しい面もある
日々精進が大事ですね。こういう感動する出来事を日々積み重ねたい