みなさんこんにちは。オイシックス・ラ・大地のデータチームです。
PRMLの輪読会を実施したので、その様子をお伝えします!
PRMLとは?
PRMLとは、機械学習理論の名著である『パターン認識と機械学習』(Pattern Recognition and Machine Learning)という本で、通称「黄色本」と言われます。
機械学習の古典的かつ一般的な手法について網羅的に基礎から解説しており、データサイエンティストの登竜門と呼ばれる本です。
しかし、その分厚さ&難しさから数々のデータサイエンス入門者を苦しめてきた本でもあります。
そこで、弊社では大学教授の方をお呼びして、適宜フィードバックやアドバイスを頂きながら、チームでこの本を読破していこうと思います!
なぜやるのか
目的は2つです。
- データサイエンスの理論的な基礎体力を身につける
- データサイエンスの実務的な基礎体力を身につける
データサイエンスの理論的な基礎体力を身につける
弊社のデータチームは、全員が情報系出身で研究をバリバリしてきたデータサイエンティストではありません。
バックグラウンドはSE出身や広告代理店出身など様々です。
ですので、全員が最新の理論にキャッチアップできるような基礎体力が身につけられればと思い始めました。
この基礎体力が身についていれば、よりデータサイエンスが面白く感じられると思いますし、問題の解決策の幅も広がるのではないかと思います。
データサイエンスの実務的な基礎体力を身につける
輪読会では内容(問題)を理解し、整理し、伝えることが求められます。
このプロセスは実務でも非常に役立つと考えます。
ビジネスの問題をきちんと理解しなければ適切な答えは導けないですし、問題を整理して分かりやすく伝えられなければビジネスサイドの人は理解できません。
ゆえに輪読会を通じて内容(問題)を理解し、整理し、伝えることを繰り返すことで、データサインティストとして必要な実務的な基礎体力が養われるのではないかと思います。
実際の輪読会の風景
輪読中
ディスカッション中
まだ第1回目が始まったばかりですが、かなり有意義な時間になりました! やはりその分野について圧倒的に詳しい方がいると輪読会もスムーズです。