メモリー転送

16 views
Skip to first unread message

Ishii Masayuki

unread,
Nov 3, 2010, 4:07:11 AM11/3/10
to gpgpuf...@googlegroups.com

三浦さん

>思った理由は机上の空論です(汗

 

>が,ちょっと計算してみました.

 

>たとえば5点差分の場合,

>演算 = 積が5 + 和が4回の9flops,メモリのロードとストアが6回×4byte = 24byte,その比率は

9/24 = 0.375

 

>9点差分の場合は

>演算 = 積が9 + 和が8回の17flops,メモリのロードとストアが10回×4byte = 40byte,その比率は

>17/40 = 0.425

 

>と演算の増加は微々たるもので,やっぱりメモリバンド幅の問題といえると思います.

 

三浦さんありがとうございます。忙しくて返信遅れてすいません。

メモリバンド幅のところが利いているんですね。

差分の問題じゃなくてということですね。

 

>ちなみに,N元正方行列の行列積で考えてみると,

>演算=2*N*N*N

>メモリ転送=2*N*N*4byte

>なので,2*N*N*N / 2*N*N*4 = N/4

>すなわち,Nのオーダーで演算量が増します.なので演算量が多く,性能が出やすいのです・・・

 

なるほど。行列積の場合が演算量が多いというわけですね。

こうして考えてみると、量子力学などでは、行列積が頻繁に出てくるので

GPGPUにおいては、行列積の計算で使うと有効というわけですね。

ありがとうございます。

ちょっと行列積でどんなところに出てくるのか、調べてみたいと思います。

 

石井政行

 

Ishii Masayuki

unread,
Nov 9, 2010, 8:05:48 AM11/9/10
to gpgpuf...@googlegroups.com

皆様にお知らせがあります。

 

今までGPGPUのメーリングリストとして運営しておりますが、

これからも情報提供の場として存続しますが、私としてやりたいことがあります。

 

行列の計算ではGPGPUの計算と相性がいいので現在はだんだん日の目を見つつ

あるようですが、とりわけ基礎部分(というか理工系の諸問題では頻出の)大規模

連立一次方程式の数値解法のオープンソースをまず作ってみたいと思います。

 

そのうち、量子力学などで出てくる行列積の計算などにも着手したいと思いますが、

大規模連立一次方程式の数値解法は、何せ多岐にわたるので一番親しみやすい

と思いがあるので、まず先行で開発したいと思います。

 

そこで、オープンソースで作る仲間を募集したいと思います。

興味のある方は、石井政行までお願いします。

 

石井政行

080-6555-0796

Ishii Masayuki

unread,
Nov 12, 2010, 11:54:39 AM11/12/10
to gpgpuf...@googlegroups.com

 

皆様に再度お知らせがあります。

なお、大規模連立一次方程式とありますが、内容はもしも作りたいものがあれば

ソースは自由ということにしたいです。

 

現在1名の方に参加の意思を表明していただきました。

この場を借りてお礼を申し上げます。

 

石井政行

080-6555-0796

Reply all
Reply to author
Forward
0 new messages