はじめまして。@kasajei です。
最近、Chainerを使って、機械学習を勉強し始めています!
まだ初心者なので、場違いな質問をしてしまったらすいませんがよろしくお願いします。
今、多層パーセプトロンでのMNISTの学習をしています。
入力層784→中間層1024→出力層10の3層のネットワークで行っています。
普通に行った場合97%ぐらいの制度が出ます。
次に、ドロップアウトを入れてみて、やると95%ぐらいまで精度が落ちます。
学習自体はうまく行ってるように見えるのですが、
テストデータに対しての正答率が悪いように見えます。
質問なのですが
- これぐらいのネットワークではドロップアプトは効果がないのでしょうか?
- 学習時にドロップアウトを適用し、予想時にはドロップアウトしない方が良いでしょうか?
また予想時にドロップアウトをはずす場合、
Chainerではどのように実装したらいいでしょうか?
あと、Autoencoderでのプレ学習もやってみたのですが、
それほど精度が上がらず。。
コードはちょっと雑なのですが、こちらに公開していますので、
もしよろしければご覧いただけると嬉しいです
認識違いなどがあれば、教えていただけると助かります!
( Chainerとは本質的には関係ない質問申し訳ないです。。
このような質問ができる場所が他にあれば教えていただけると、
そちらも助かります!)
よろしくお願いします!