自分の持っているマイクロアレイデータとそれに関連するpublicなデータをゲノム上に並列にならべて、その発現量を比較するというコンセプトです。
table1: マイクロアレイのプローブ情報
column1: primary key
column2: probe ID (VARCHAR)
column3: probe IDに対応するrefseq ID もしくはensembl transcript ID (VARCHAR)
table2: 遺伝子情報
column1: primary key
column2: refseq ID もしくはensembl transcript ID (VARCHAR)
column3: gene symbol (VARCHAR)
column4: description (VARCHAR)
table3: 自分の実験データ
column1: primary key
column2: probe ID (VARCHAR)
column3: コントロール区と実験区のlog ratio (FLOAT)
column4: p-value (FLOAT)
tabel4: publicな実験データ
column1: primary key
column2: probe ID (VARCHAR)
column3: コントロール区と実験区のlog ratio (FLOAT)
column4: p-value (FLOAT)
データベースのエントリ数は、使用するマイクロアレイ(Affy HG U133 plus2)のID数である 54,675 の予定です。
検索は、自分の実験のlog ratio で昇順・降順など基本的なところをいまのところ想定しています。