Deep Learning. Goodfellow他著 の1章を読んで

AI

深層学習の勉強の決定版とも言われている教科書“Deep Learning”(2016/11発売)がありますが、

現在、東京大学の松尾研究室の方々が主体となってその教科書の翻訳をしており、以下のサイトで公開されています。

http://www.deeplearningbook.me/

今回はDeep Learningの”1章はじめに”を読み、機械学習のよくある質問の一つである

どれくらいの学習データがあれば十分なのか?の答えの参考となる文章が載っていたので、

引用させて頂きます。

2016年の時点で大体の目安として、一般的に教師ありの深層学習のアルゴリズムでは、カテゴリごとの約5,000のラベルあり事例があれば、満足できる性能が達成され、また少なくとも1,000万のラベルあり事例を含むデータ集合で訓練すれば、人間に匹敵する、あるいは人間を超える性能を発揮する。

近年大量のデータを簡単に集めやすくなったとはいえ、学習対象によっては5,000でも敷居が高いと思うので、(特に個人的に開発している場合)

Data AugmentationやFine-tuning等の手法でどこまでデータ数が少なくても性能が出せるか気になるところです。

Deep Learningを読み進めることでこういった話も出てくるかもしれないので、わくわくしながら続きを読みたいと思います。