大野です。
中間層のユニットの最適な数はデータセットと問題依存であり、一般的な決定方法はあまり知られていないと思います。
例えば、論文として報告されている問題・データセット・ニューラルネットのアーキテクチャで実験して、
そこからパラメータを変更するなどはよく行われます。
>これについて、十分に学習が行われていないのか過学習なのかわかりかねている状況です。
under fittingかover fittingかは、訓練データとテストデータでの精度(accuracyや損失関数の減少具合)を見て判断するのが良いと思います。
例えば訓練データでの損失関数は下がっているけれど、テストデータで下がっていなければ過学習をしていると思います。
深層学習におけるハイパーパラメータの実践的な調整に関しては、例えばBengioの以下の論文などがあります。
2016年7月8日金曜日 17時01分09秒 UTC+9 yuki ike: