こんばんは、ゴドーです。
今日はインターン生相手に強化学習の数学的理論を説明しました。
説明したといっても、自分自身も決して専門領域というわけではないので、論文や解説記事を読みながら、1行1行自分が解釈した内容を伝えていったという感じ。
式の気持ちを解釈しながら読み進めていったので、かなり時間はかかりましたが、最終的に腹落ちできたのではないかと思います。
インターン生に聞くと、大学の授業ではライブラリを使った実装の練習はよく行うが、背景にある数学の勉強はそこまで行わないと。
海外の話なので、日本の大学とはまた違うかもしれませんが、応用を考えると、実装力だけでなく基礎知識を持っていた方が有利だと思われますね。
個人的に、久しぶりに数式を追う作業をしたので楽しかったです。
一部の式変形で納得いかない部分が宿題として残っているので、今夜はこれをじっくり考えたいと思います。
それでは、また。
/ゴドー