電通大今村です。
> 今月配送された、応用数理に電通大の今村先生の固有値計算アルゴリズムと自動チューニングの
> 話があります。
> 今村先生は、若手ながら数々の多くの賞を獲得しているやり手の研究者であります。
せっかく紹介されたので、固有値計算でGPUネタを少し。
先月の応用数理学会年会で初めてGPUを使って固有値計算を
した内容を話しました。
確かにDGEMMは速いなと実感できます。TeslaC2050では300GFLOPSで
一般的なquad coreよりも1桁上の性能です。
といっても固有値計算はDGEMMだけではないので、計算全体で
GTX285もしくはGTX460を使ってquad coreのCPUの2倍程度速い
(TeslaC2050でも3倍)という結果でした。
コアあたりのメモリ帯域が10倍ではないので、帯域が必要な
ループはPCと同様に性能を落とすことになります。
固有値計算のコストが突出しているのであれば、計算時間が
1/2になるのはかなりの効果といえるでしょうか。