Neural Network Console と離れた相談になります。
センテンステキストのベクトル化について相談させてください。
センテンステキストをベクトル化したデータを使用して、
学習: x1 データ から x2 データが得られることを学習させて
評価: 別の x1 データ から x2 データを得たいと考えています。
LSTMを利用して: x1:400次元ベクトル, x2:400次元ベクトル, y=0 → X2':400次元ベクトルを得たい。
この課題で、センテンステキストのベクトル化にはどのような方法を用いるべきでしょうか。
word2vec
doc2vec
dl4j/ paragraphvectors
を用いてベクトル化してみたのですが、
いずれも、
・実行の都度、行レコード(センテンス)に対するベクトル値が異なり、
・同じテキスト情報を持つ他の行レコード(センテンス)に対して異なるベクトル値を出力する
ことから、
今回の課題にはマッチしないのでは? と行き詰まりました。
この課題に対応しているとおもわれるベクトル化の方法の情報を提供いただけるとありがたいです。