こんにちは.
タイトルの通り,私は不均衡データのクラス分類を行いたいと考えています.
今のままではデータの偏りによって出力結果があまりよくないため,解決方法を探しています.
クラス分類の中身は,9種類の数値データ(x)を入力し3種類(y : 0, 1, 2)に分類をするものです.
解決策の候補は2つあり,1つは
オーバーサンプリングやアンダーサンプリングのような,Trainingデータセットから学習を行う際に用いるデータ数を調整すること
(バッチ数90のとき"y=0のデータ"と"y=1のデータ","y=2のデータ"がそれぞれ30件ずつのように,バランスを取りたい),
もう1つは
データ数の少ないクラスデータを学習する際に重みづけを調整すること
(データ数が"y=0" : 100,"y=1" : 1000,"y=2" : 1000 のとき,クラス0に分類されるデータだけ特別扱いしたい)
です.
これらを実装する方法が見つからず困っています.
それ以外の解決策を含め,何か分かる方がいましたら助けて頂きたいです.
どうぞよろしくお願いします.