ディープラーニングで笑顔を自動検知したい

ディープラーニングで笑顔を自動検知するまでの学習過程を綴っていきます。

最初の一歩

一番参考になった記事

そもそもディープラーニングの仕組みについて全く分からない状態なので、
初心者向けと思われるネットの記事や書籍は結構な数読み漁りました。

個人の好みもあると思いますが、私の中で一番理解しやすかったのがこのサイトです。
ニューラルネットワークと深層学習

もちろん記事の内容のほんの僅かしか理解できていないのですが
以下に後述の通り、現実的な例を挙げて説明されているため、その部分が個人的には理解の助けになりました。

まずはパーセプトロンから

ディープラーニングの前に、恐らく基本中の基本であると思われるパーセプトロンの項は是非読んでみてください。第1章の冒頭で説明されています。
私は3回はこの個所を読み返したと思います。

具体例で考えると意外と簡単?

第1章に「チーズ祭り」を題材に簡単な現実的な例を挙げて説明されているのですが、これを読んだときにピンときました。
また、この「チーズ祭り」を自身の身近な例に置き換えると更にピンときました。

私の場合だと「仕事終わりに飲みの誘い」があった場合でしょうか。
この場合、結果に与える影響としては、

  1. 早く帰って娘と遊びたいか?
  2. 財布の具合はどうか?
  3. 仕事の進み具合はどうか?

が考えられ、これを「チーズ祭り」同様に考えてみると理解が進んだように思います。

結局のところ

言葉だけを聞くと相当難しいことをやっていそうな感じがするのですが、
結果に影響を与える複数の入力があり、それぞれの入力には重みがあって、重みを加味した入力値の合算が次のパーセプトロンに伝播していき、それを繰り返していって、最終的に出力が求まる

そして、
入力から出力までの間に伝播していくパーセプトロン層が沢山あるから"ディープラーニング"
なのだと、自己理解しました。
※あくまで私の解釈なので本来のディープラーニングの意味合いと異なるかも知れません。

きっとライブラリが裏では複雑な計算をやっていると思うのですが、
ざっくりとした概念だけに焦点を当てるとそんなに複雑な訳ではなさそうだと思えてきました。