CPU の値段は、需要・供給の仕組みが中心に決まっているんでしょ
うか。某所での値段を見ると、性能に比例というわけでもなくて、
こんな感じになっていました。
Pentium4 2.4GHz/FSB800 23,800円
Pentium4 2.6GHz/FSB800 28,000円
Pentium4 2.8GHz/FSB800 35,800円
Pentium4 3.0GHz/FSB800 53,550円
Cache は、全部、512KB。3G と 2.6Gって、10% ちょっとしか変ら
ないのに、値段は倍です。2.6GHzを2個買った方が得といった感じ
です。
高並列計算機の話では、最近、AMD 頑張っていますね。黒字になっ
たみたいですし。Transmeta は、最近聞いた話は、Linus が OSDL
に移籍したという話くらいですが、どうなんでしょうか。
\\ 新城 靖 (しんじょう やすし) \\
\\ 筑波大学 電子・情報 \\
In article <YAS.03Au...@kirk.is.tsukuba.ac.jp>, y...@is.tsukuba.ac.jp (Yasushi Shinjo) writes
> CPU の値段は、需要・供給の仕組みが中心に決まっているんでしょ
> うか。某所での値段を見ると、性能に比例というわけでもなくて、
> こんな感じになっていました。
選別しているからじゃないでしょうか。あとはマーケティングの問
題かな。Intel in Side だとお金がインテルからもらえたりするら
しいですし。独占企業状態じゃ競争もへったくれもないからなぁ。
まぁ、この状態も長くは続かないと思うんですけどね。
> Pentium4 2.4GHz/FSB800 23,800円
> Pentium4 2.6GHz/FSB800 28,000円
> Pentium4 2.8GHz/FSB800 35,800円
> Pentium4 3.0GHz/FSB800 53,550円
> Cache は、全部、512KB。3G と 2.6Gって、10% ちょっとしか変ら
> ないのに、値段は倍です。2.6GHzを2個買った方が得といった感じ
> です。
ま、微妙なところですね。
---
Shinji KONO @ Information Engineering, University of the Ryukyus,
PRESTO, Japan Science and Technology Corporation
河野真治 @ 琉球大学工学部情報工学科,
科学技術振興事業団さきがけ研究21(機能と構成)
この戦略で、RISC UNIX WSは非常に良かったのに流行らず、Wintel
が独走する結果になってしまったと思っています。
>> Pentium4 2.4GHz/FSB800 23,800円
>> Pentium4 2.6GHz/FSB800 28,000円
>> Pentium4 2.8GHz/FSB800 35,800円
>> Pentium4 3.0GHz/FSB800 53,550円
>> Cache は、全部、512KB。3G と 2.6Gって、10% ちょっとしか変ら
>> ないのに、値段は倍です。2.6GHzを2個買った方が得といった感じ
>> です。
>
>ま、微妙なところですね。
そうなんですが、困ったことにPentium~Pentium3までと違って、
Pentium4はXeonでないとSMPで走らないんですよね。
申し訳程度に、Hyper Threadingという条件が整えば(リソースが
ぶつからなければ)1 chip SMPというのが付きましたが。これまた
他社のCPUだと暫く使えないんだろうな。
昔も出ましたが、やはり「競争無き所に不敗有り」ですか。
--
中村和志@神戸 <mailto:k...@kobe1995.net>
NAKAMURA Kazushi@KOBE <http://kobe1995.jp/>
- Be Free(BSD), or Die...
In article <0308261933...@ns.kobe1995.net>, k...@kobe1995.net (NAKAMURA Kazushi) writes
> >まぁ、この状態も長くは続かないと思うんですけどね。
> そう願うのですが、ソースの公開されたソフトウェアがなかなか流行らず、
> バイナリ互換性がやたら重宝されている状況だと、圧倒的トップシェアの
> メーカは他社のCPUでは動かない新命令を次々増やせば済んでしまうし。
それって過去にも、IBMがやりまくっていたわけで...
バイナリ互換は、いつかは行きづまるはずなんだけど。
> この戦略で、RISC UNIX WSは非常に良かったのに流行らず、Wintel
> が独走する結果になってしまったと思っています。
どうなんでしょうね。実は、ここ数年Intelが速かったということ
なのかも。RISCのクロックがなかなかあがらなかったのは事実だし。
386 Unix は実用的な速度で動くのかとか、DXのようなCPU内蔵
クロックだけあげるのって効果があるのかとか、真面目に心配
されたんだけど、結局、動くってのがわかっちゃたわけだし。
> 昔も出ましたが、やはり「競争無き所に不敗有り」ですか。
もう少し状況が変わらないとだめでしょうね。Emulator とか
Code Morphing とかバイナリ互換から逃げる技術はあるわけ
ですから、そのうち変わるんじゃないかな。
85年ぐらいはIBMの不敗神話は生きていたわけですけど、95年には
Windows 全盛になってましたよね。そのあたりから、Intel CPU
の方が速くなって来ちゃったんだよな。金かけられる方が
速くなるから。
PowerPC が、もう少し速いスピードでクロックが上がっていたら、
いまごろ、また IBM 神話復活だったかも知れないし。
In article <0308261933...@ns.kobe1995.net>,
k...@kobe1995.net (NAKAMURA Kazushi) wrote:
> 昔も出ましたが、やはり「競争無き所に不敗有り」ですか。
競争しなければ負けることもないと。:-)
>In article <0308261933...@ns.kobe1995.net>,
> k...@kobe1995.net (NAKAMURA Kazushi) wrote:
>> 昔も出ましたが、やはり「競争無き所に不敗有り」ですか。
>競争しなければ負けることもないと。:-)
「腐敗」の誤変換です。いや、頭の中にはIBMの不敗神話というのが
有ったので、つい見過ごしてしまいました。
愚痴:
XeonでないPentium4より前も、Celeronがcuppermine以降SMP
不可になったのも、単に営業上の理由で、技術的にはダイとパッケージの
配線(多分APIC周り)を省略するくらいで済ませていると思うんだ。
Pentium3とは、ダイのキャッシュ部分以外のコアは同一で。
でも事実上、競争相手も居ないのに、安いCeleronが売れてPentium3
の売上を減らしたくないとかで、折角のSMP能力を殺してもったいない
売り方したんじゃないかな。今のXeonでないPentium4も同じでは?
In article <0308271308...@ns.kobe1995.net>, k...@kobe1995.net (NAKAMURA Kazushi) writes
> XeonでないPentium4より前も、Celeronがcuppermine以降SMP
> 不可になったのも、単に営業上の理由で、技術的にはダイとパッケージの
> 配線(多分APIC周り)を省略するくらいで済ませていると思うんだ。
昔のDX4あたりでも、そんな話し合ったなぁ。
> でも事実上、競争相手も居ないのに、安いCeleronが売れてPentium3
> の売上を減らしたくないとかで、折角のSMP能力を殺してもったいない
> 売り方したんじゃないかな。今のXeonでないPentium4も同じでは?
逆に、その分、(高いもの買う人の分だけ) 安く売っているわけだ
から、悪いことばかりではないですけどね。
In article <0308271308...@ns.kobe1995.net>
k...@kobe1995.net (NAKAMURA Kazushi) writes:
> でも事実上、競争相手も居ないのに、安いCeleronが売れてPentium3
> の売上を減らしたくないとかで、折角のSMP能力を殺してもったいない
> 売り方したんじゃないかな。今のXeonでないPentium4も同じでは?
在りそうな話ですね。
Xeon って、Pentium4 だったんですか。
結局、CPU の値段が、こんな感じでちょっとごまかしをしないとつ
り上げられなくなったとすると、実は、そろそろ需要の方が頭打ち
になってきているという話はないですかね。つまり、実は、CPU の
能力としては、Celeron 1G くらいで十分とか。使い方にもよるの
ですが、「普通」に、電子メールの読み書きとかWWWブラウズと
かでは。
CPU も、ビジネスとしては、メモリのような感じになって来ている
のかもしれません。
ネットワークだと、100Mbps というのは、1人で使う分には、もう
十分という感じですよね。DVD品質の動画像なら、10本流しても平
気だけど、1人で同時に10個の作品を見る人はいいません。
CPU が遅いと感じるのは、最近だと、SPAM 避けのフィルタを動か
す時くらい。(あれも、電子メール着信時に動くように変更すれば
いいんだけど。)カーネル・コンパイルと、VMware の再起動は、
まあ、そんなものかなあという感じだし。
ノートPCは、今は軽さ(バッテリも含むので消費電力の少なさ)
で値段が決まる感じですよね。速度じゃなくて。
> Xeon って、Pentium4 だったんですか。
Xeon ってハイエンドのプロセッサのブランド名みたいなものですから,
Pentium!!! ベースの Xeon もありましたし,Pentium4 ベースのもあります.
Pentium2 のころにも,何かそういう名前がありませんでしたっけ.
> 結局、CPU の値段が、こんな感じでちょっとごまかしをしないとつ
> り上げられなくなったとすると、実は、そろそろ需要の方が頭打ち
> になってきているという話はないですかね。つまり、実は、CPU の
> 能力としては、Celeron 1G くらいで十分とか。使い方にもよるの
> ですが、「普通」に、電子メールの読み書きとかWWWブラウズと
> かでは。
そういう話は太古の昔から延々と繰り返されてきた気がしますが ;-)
最近だとホームAVパソコン需要というのもあるみたいで.テレビを
録画できるとかそういうやつ.そうすると,動画のリアルタイム
エンコードするために速い CPU が……となるわけです.
僕も HDD レコーディングはやりたいですが,でも PC でやるのは
もう疲れました.メンテナンスしたくなくて.民生用のセットトップで
いいです.こういう風に感じると,ノーマン先生は先見の明があるなぁ,
とふと思ったりするわけですが.
http://www.shin-yo-sha.co.jp/mokuroku/books/4-7885-0730-7.htm
> ネットワークだと、100Mbps というのは、1人で使う分には、もう
> 十分という感じですよね。DVD品質の動画像なら、10本流しても平
> 気だけど、1人で同時に10個の作品を見る人はいいません。
10Mbps でも十分でしたね.今でも 802.11b で困らないし.
> ノートPCは、今は軽さ(バッテリも含むので消費電力の少なさ)
> で値段が決まる感じですよね。速度じゃなくて。
このあたりは日本の「ものづくり」が得意なところですよね.
Let's note CF, VAIO U, PEG-UX50 などなど.ThinkPad s30が
海外市場の不振でなくなるなど,あちらではあまり流行らないのかも
しれないけど,slashdot.org を見てると nerd 受けはしてますよね.
小さい携帯もしかり.
----------- ニュースはみんなのために /|\ メールは個人のために -----------
太田 尚志 - OTA Takashi - http://web.sfc.keio.ac.jp/~t00156to/ ICQ#:39782589
In article <bihl3a$s0i$1...@news.sfc.keio.ac.jp>, OTA Takashi <t00156...@sfc.keio.ac.jp> writes
> 僕も HDD レコーディングはやりたいですが,でも PC でやるのは
> もう疲れました.メンテナンスしたくなくて.民生用のセットトップで
> いいです.こういう風に感じると,ノーマン先生は先見の明があるなぁ,
> とふと思ったりするわけですが.
自由度があるぶんめんどくさいですよね。でも、「Windowsだから」
ってのが大きいんじゃないかな。iTunes なんかは良くできていて、
もはや、CD/MD/LP には戻れないです。民生機に戻る気もまったく
ないです。
ビデオも同じじゃないかな。ちゃんとしたソフトがあればコンピュ
ータの方がいいんだと思う。やっぱり、Windows が最低なんでしょう。
あと180GBでもビデオレコーディングだと足りなくないですか? か
といって4.7GBづつ細切れに保存するのもうれしくないし。家庭用
にテラバイトってのも変だけど、それくらいあれば、iTunes みた
いな使い方ができるんだけどな。
> 10Mbps でも十分でしたね.今でも 802.11b で困らないし.
画像だとDVで14Mbpsいるので足りません。802.11b で足りるっての
は、WWW only のような場合だけだと思います。僕も職場では有線
だし。
> 小さい携帯もしかり.
PDAは、携帯機能があるのがいいなぁ。なんか、もっとキャリアと
関係なく端末を買えるようにして欲しいですね。キャリアのカード
とPDA/音声端末の組み合わせみたいなのがいいな。
> > Xeon って、Pentium4 だったんですか。
>
> Xeon ってハイエンドのプロセッサのブランド名みたいなものですから,
> Pentium!!! ベースの Xeon もありましたし,Pentium4 ベースのもあります.
> Pentium2 のころにも,何かそういう名前がありませんでしたっけ.
Intel Pentium II Xeon Processor
Pentium II + 大容量2次キャッシュ + 4プロセッサ以上のMPサポート(PII
はデュアルまで)
Intel Pentium III Xeon Processor
Pentium III + 大容量2次キャッシュ + 4プロセッサ以上のMPサ
ポート(PIIIはデュアルまで)
Intel Xeon Processor (DP)
Pentium 4 + デュアルプロセッササポート(P4はシングルのみ)
Intel Xeon Processor MP
Pentium 4 + 3次キャッシュ + 4プロセッサ以上のMPサポート
だそうです.
# Pentium 4 Xeonじゃなくてただの「Xeon」なんですね.ブランド的には
# Pentiumのサブブランドではなく,独立した製品という位置付け.
Xeon DPはPentium 4と同じコアを使っていましたが,最新のもの(3.06GHz)は
Xeon MPと同じコアになったそうです(3次キャッシュがついた).
いずれにせよ「一部の機能を殺して出荷」は,常に行なわれてるみたいです.
(DPを殺してシングルのみとして出荷とか,MPを殺してDPとして出荷とか.)
また,これも今に始まった話ではないですが,Xeon MPのL3 キャッシュはオン
ダイに2MBあり,1MB版として売られているものは半分を殺してあるそうです.
(営業上の理由か,検査の結果かは定かでありません.)
前田敦司
In article <m3y8xf8o...@maedapc.cc.tsukuba.ac.jp>
MAEDA Atusi <ma...@cc.tsukuba.ac.jp> writes:
> Intel Xeon Processor (DP)
> Pentium 4 + デュアルプロセッササポート(P4はシングルのみ)
> Intel Xeon Processor MP
> Pentium 4 + 3次キャッシュ + 4プロセッサ以上のMPサポート
デュアルと4プロセッサ以上って、どんな信号線が違うんでしょう
か。2個なら相手をとめちゃえばいいような気もしますが、下手を
すればデッドロックですし。結局、arbiter が外付でいるような気
もします。
インテルの石を使った SMP (Symmetric Multiprocessor) は、共有
バスなりスイッチなりの作りは、なにか標準的なものがあるんでしょ
うか。
Sun の SMP は、スケーラビリティがいいんですよね。10年前は、
共有バスがどうのという話もあったのですが、クロスバ・スイッチ
が出てきて、うまく書くと台数効果はすぐに出てきます。まあ、1
つ1つの CPU が遅いんで、しょうがないんだけれど。
> デュアルと4プロセッサ以上って、どんな信号線が違うんでしょう
> か。2個なら相手をとめちゃえばいいような気もしますが、下手を
> すればデッドロックですし。結局、arbiter が外付でいるような気
> もします。
IntelのサイトにあるDatasheetを見ると,BR0#~BR3# (Bus Request)という4
本のピンがあって,プロセッサがバスの使用権を要求する時にはBR0#をアサー
トします.バス上の信号線BREQ0#~BREQ3#というのがあって,4CPU時の結線は,
バス CPU0 CPU1 CPU2 CPU3
BREQ0# BR0# BR3# BR2# BR1#
BREQ1# BR1# BR0# BR3# BR2#
BREQ2# BR2# BR1# BR0# BR3#
BREQ3# BR3# BR2# BR1# BR0#
のようになっています.リセット時にはBREQ0#がアサートされて,各CPUは自
分の番号が分かります.その後,BR0#は出力,それ以外は入力ピンとして働き
ます.つまり,各CPUの中にアービタが入ってます(優先順位は,直前のバスオー
ナの次の番号が最も高い).その他,外部からのバス要求(常に最高優先度)を
入力するBPRI#ピンがあります.
DP版では,DPではBR2#とBR3#は使用できないそうです.なので,BR0#とBR1#を
クロスしてつなぐだけになります.
外部の回路で頑張れば,DP版でも2より多いプロセッサ数でマルチプロセッシ
ングができそうですが…この辺は素人なので良く分かりません.また,MP版の
資料には「4-way, 8-way, あるいはそれ以上のプロセッサ数」と書いてありま
すが,Xeon MPで4よりプロセッサ数が多いSMPマシンって存在するんでしょう
か?
> インテルの石を使った SMP (Symmetric Multiprocessor) は、共有
> バスなりスイッチなりの作りは、なにか標準的なものがあるんでしょ
> うか。
ほとんど全てIntelのチップセット(ServerWorks)を使った共有バスシステムで
しょう.Pentium Proとかの頃は,Compaqあたりが独自のチップセットのSMPサー
バを出していたと思いますが.
> Sun の SMP は、スケーラビリティがいいんですよね。10年前は、
> 共有バスがどうのという話もあったのですが、クロスバ・スイッチ
> が出てきて、うまく書くと台数効果はすぐに出てきます。まあ、1
> つ1つの CPU が遅いんで、しょうがないんだけれど。
SunのCPUは,ほとんど常に他社より劣ってますね.
現在のSun Fire 15kは最大106プロセッサですけど,SMPと言っていいのかな…
4CPU+メモリのボードが18枚クロスバ・スイッチでつながります.ボード内の
ローカルバスの方が速いです.あと,2CPUのPCIカードが17枚差せます.
HPのSuperdomeは4-way SMP4個(計16-way)を1つのクロスバ・スイッチにつなぎ,
このクロスバ・スイッチ4つを完全結合しています.
HP AlphaServer GS1280はCPUごとにローカルメモリと4つのCPU間接続チャネル
があり,32CPUを2次元トーラスでつないでいます.
IBMのp690は,1チップに2CPU入ったチップを4つ(計8-way)載せたモジュールご
とに巨大な(128MB)L3キャッシュがついています.このモジュールを4つとメイ
ンメモリを,バスで接続します.
遠い近いでレーテンシが変わっても(NUMAでも)SMPって言うんですかね.
まあ,NUMAとUMAを合わせてSMPなのかな.
前田敦司
ma...@cc.tsukuba.ac.jpさん:
> 遠い近いでレーテンシが変わっても(NUMAでも)SMPって言うんですか
> ね.まあ,NUMAとUMAを合わせてSMPなのかな.
「対称」とはつまり、どっかのプロセサが偉くなければいい、という
意味じゃないでしょうか。
ということはNORMAでもいい? うーん。 久野
In article <m3u180x...@maedapc.cc.tsukuba.ac.jp>
MAEDA Atusi <ma...@cc.tsukuba.ac.jp> writes:
> IntelのサイトにあるDatasheetを見ると,BR0#~BR3# (Bus Request)という4
> 本のピンがあって,プロセッサがバスの使用権を要求する時にはBR0#をアサー
> トします.バス上の信号線BREQ0#~BREQ3#というのがあって,4CPU時の結線は,
> バス CPU0 CPU1 CPU2 CPU3
> BREQ0# BR0# BR3# BR2# BR1#
> BREQ1# BR1# BR0# BR3# BR2#
> BREQ2# BR2# BR1# BR0# BR3#
> BREQ3# BR3# BR2# BR1# BR0#
> のようになっています.リセット時にはBREQ0#がアサートされて,各CPUは自
> 分の番号が分かります.その後,BR0#は出力,それ以外は入力ピンとして働き
> ます.つまり,各CPUの中にアービタが入ってます(優先順位は,直前のバスオー
> ナの次の番号が最も高い).その他,外部からのバス要求(常に最高優先度)を
> 入力するBPRI#ピンがあります.
>
> DP版では,DPではBR2#とBR3#は使用できないそうです.なので,BR0#とBR1#を
> クロスしてつなぐだけになります.
なるほど。Xeon なら、4頭の SMP までは、簡単に組めるようになっ
ているわけですね。
前に、8頭の Pentium III (550MHz)の SMP を使ったとがあるので
すが、外付で何かしていたんでしょうね。ロックかけると急激に性
能が低下しました。OSは、Linux 2.2.16 (RedHat 6.2)。
> ほとんど全てIntelのチップセット(ServerWorks)を使った共有バスシステムで
> しょう.Pentium Proとかの頃は,Compaqあたりが独自のチップセットのSMPサー
> バを出していたと思いますが.
自分で SMP (4頭以上) を組み立てる、なんてことはできるんでしょ
うか。8 個くらいは欲しいんだけれど。Dual までは、よくマザー
ボードも見るのですが、4 というのは見たことがありません。
> 遠い近いでレーテンシが変わっても(NUMAでも)SMPって言うんですかね.
> まあ,NUMAとUMAを合わせてSMPなのかな.
UMA (Uniform Memory Access), NUMA (Non-Uniform Memory
Access)、Norma (No Remote Memory Access)というマルチプロセッ
サの分類は、1988 年くらいの Mach の論文でよく出てきたもので
す。それが最初かどうかはわからないけれど。OSを作る時には、
そういう分類の仕方は便利です。UMA のことを最近は、SMP
(Symmetric Multiprocessor) と言っているので、NUMA をSMP とは
言わないでしょう。
Symmetric と Uniform が違うと言われても困るし。
> 現在のSun Fire 15kは最大106プロセッサですけど,SMPと言っていいのかな…
> 4CPU+メモリのボードが18枚クロスバ・スイッチでつながります.ボード内の
> ローカルバスの方が速いです.あと,2CPUのPCIカードが17枚差せます.
昔の NUMA は、ローカルとリモートで 100 倍くらい速度が違いま
した。それで、ソフトウェアの作り方を変えないと全然使えません
でした。Sun の場合、今までの UMA 用のソフトエェアでもちゃん
と使えて性能が出るなら、UMA と言ってもいいと思います。UMA と
いっても、もともとキャッシュはアリで、それの速度の差は無視し
ているのですから。
NUMA って、うまいソフトウェアを作るのが難しいんですよね。
Linda の tuple space を置くといいという話は聞いたことがある
んのですけれど、どうなんでしょう。
UMA/SMP なら、マルチスレッドと mutex という技術があります。
NORMA なら、もう通信するしかないとあきらめがつきます。
ハードウェアの話というよりは、ソフトウェアの話が大事なんじゃ
ないですかね。
In article <3988906...@insigna.ie.u-ryukyu.ac.jp>
ko...@ie.u-ryukyu.ac.jp (Shinji KONO) writes:
> 自由度があるぶんめんどくさいですよね。でも、「Windowsだから」
> ってのが大きいんじゃないかな。iTunes なんかは良くできていて、
> もはや、CD/MD/LP には戻れないです。民生機に戻る気もまったく
> ないです。
東芝の HDD レコーダ RD-X2 を使っているのですが、あのソフトウェ
アの作りはひどいです。PCのOSを使っている方からすると、い
らいらすることが多いです。まず、リモコンというしょぼいインタ
フェースしかないという所が問題なんでしょう。
あと、録画中に、既に録画してある別のものを見ることができるの
はいいとして、それを消すことができません。つまり、システム全
体で1度に1つしか書き手が許されないという、いわゆる giant
lock のような作りなっています。
もう1つ、タイトルを消す速度がどんだん遅くなってきました。
「1分以上かかることがありますので電源を切らないように」と親
切にも出てくるのですが、本当に1分かかるようになりました。最
初はもっと速かったのに。
パナソニックの DVD レコーダも使っていますが、こちらは、消す
のは速いです。DVD-RAM の 4.7G だからたかが知れているという話
なのかもしれません。
東芝も、新しい機種なら改善されているんですかね。古い方もソフ
トウェア更新して欲しいんだけれど。
シャープのガリレオなら、Linux だし、自分で rm -r できそうな
のにとか思ったりします。
> あと180GBでもビデオレコーディングだと足りなくないですか?
80G のものを使っていますが、80G も溜めてしまうと、人間の処理
能力が追い付かなくなります。180G だと、今の使い方だとつらそう。
ただ、さらにどんどん記憶容量をあげると相転移おこして、別の使
い方が出てくるんでしょう。基本的にどんどん溜めていて、見ない
作品は自動的に捨てられると。80G とか 180G なら、勝手に捨てら
れたら起こるけれど、80T とか 180T なら、そういう機能がないと
やっていけないでしょう。
続きは、Followup-To: fj.rec.av でお願いします。
In article <YAS.03Au...@kirk.is.tsukuba.ac.jp>
y...@is.tsukuba.ac.jp writes:
>前に、8頭の Pentium III (550MHz)の SMP を使ったとがあるので
>すが、外付で何かしていたんでしょうね。ロックかけると急激に性
>能が低下しました。OSは、Linux 2.2.16 (RedHat 6.2)。
>
>なるほど。Xeon なら、4頭の SMP までは、簡単に組めるようになっ
>ているわけですね。
fj.sys.ibmpcで昔話題になりましたが、Xeonならどれでもというわけでは
ないようです。Pentium3 Xeonでも、4way以上のSMPが組めるのは550MHz,
700MHzのものだけです。他のPentium3 Xeonは、2way止まり。
Pentium4 Xeonも2way止まりで、HTを利用してやっと4スレッドという
ことではないかなあ。
>> 遠い近いでレーテンシが変わっても(NUMAでも)SMPって言うんですかね.
>> まあ,NUMAとUMAを合わせてSMPなのかな.
>
>UMA (Uniform Memory Access), NUMA (Non-Uniform Memory
>Access)、Norma (No Remote Memory Access)というマルチプロセッ
>サの分類は、1988 年くらいの Mach の論文でよく出てきたもので
>す。それが最初かどうかはわからないけれど。OSを作る時には、
>そういう分類の仕方は便利です。UMA のことを最近は、SMP
>(Symmetric Multiprocessor) と言っているので、NUMA をSMP とは
>言わないでしょう。
>
>Symmetric と Uniform が違うと言われても困るし。
一般アプリを作るプログラマまで、マシンのトポロジ構成を意識するようでは
Symmetricとは呼べないと思います。SMPのメリットは、メモリやPEのトポロジ
を意識せずとも、単にマルチスレッドなプログラムを書いておけば、PE数に
「ほぼ」比例した性能向上が簡単に得られることに有ると思うので。
>昔の NUMA は、ローカルとリモートで 100 倍くらい速度が違いま
>した。それで、ソフトウェアの作り方を変えないと全然使えません
>でした。Sun の場合、今までの UMA 用のソフトエェアでもちゃん
>と使えて性能が出るなら、UMA と言ってもいいと思います。UMA と
>いっても、もともとキャッシュはアリで、それの速度の差は無視し
>ているのですから。
>
>NUMA って、うまいソフトウェアを作るのが難しいんですよね。
>Linda の tuple space を置くといいという話は聞いたことがある
>んのですけれど、どうなんでしょう。
nCubeとかHyperTreeとか、難しくて(=面白くて)、でもなかなか効果が
得られないんですよね。気が付くと、問題の方をマシンのトポロジに
合わせたものを捜して来るようになってしまう始末。本末転倒そのもの。
In article <m3u180x...@maedapc.cc.tsukuba.ac.jp>
ma...@cc.tsukuba.ac.jp writes:
>外部の回路で頑張れば,DP版でも2より多いプロセッサ数でマルチプロセッシ
>ングができそうですが…この辺は素人なので良く分かりません.また,MP版の
>資料には「4-way, 8-way, あるいはそれ以上のプロセッサ数」と書いてありま
>すが,Xeon MPで4よりプロセッサ数が多いSMPマシンって存在するんでしょう
>か?
思い出したのですが、昔PC-8801,PC-9801全盛期の頃、ウェストサイドという
フロッピーのコピーツールを売っている会社が有って、そこのはプロテクトが
掛かってて自動的にはなかなかコピーできないソフトをコピーするために
上手くコピーするためのパラメータファイルを、新しいソフトが出る度に
売ってました。で、とあるRS-232Cで対戦するゲームソフトのファイラー
にコピーのパラメータだけでなく、本来一対一で対戦するそのソフトを
多人数で対戦する為のRS-232Cケーブルの配線図がグラフィック文字で
描いてありました。あんな感じですかね。
#あのファイラ書いた人は今いずこ?
普通はそのコピーツールでメニューからそのパラメータファイルを選択する
だけなので、わざわざパラメータファイルをlessで開いたりしない限り
お目に掛からないコメントみたいな代物でしたが。
In article <YAS.03Au...@kirk.is.tsukuba.ac.jp>
y...@is.tsukuba.ac.jp writes:
>前に、8頭の Pentium III (550MHz)の SMP を使ったとがあるので
>すが、外付で何かしていたんでしょうね。ロックかけると急激に性
>能が低下しました。OSは、Linux 2.2.16 (RedHat 6.2)。
>
>なるほど。Xeon なら、4頭の SMP までは、簡単に組めるようになっ
>ているわけですね。
fj.sys.ibmpcで昔話題になりましたが、Xeonならどれでもというわけでは
ないようです。Pentium3 Xeonでも、4way以上のSMPが組めるのは550MHz,
700MHzのものだけです。他のPentium3 Xeonは、2way止まり。
Pentium4 Xeonも2way止まりで、HTを利用してやっと4スレッドという
ことではないかなあ。
>自分で SMP (4頭以上) を組み立てる、なんてことはできるんでしょ
>うか。8 個くらいは欲しいんだけれど。Dual までは、よくマザー
>ボードも見るのですが、4 というのは見たことがありません。
SuperMicroなんかだと有りますよ。Asusも一般向けではなく、企業
向けのカタログなんかには大抵載っています。関東ならPlathome
行けば、動いている実物が見れるかと。去年私が行った時も、
Itaniumの4頭でLinuxが動いていて、見るだけでなく触れるので
おもむろに top とか叩いて「へー」と眺めていました。
>> 遠い近いでレーテンシが変わっても(NUMAでも)SMPって言うんですかね.
>> まあ,NUMAとUMAを合わせてSMPなのかな.
>
>UMA (Uniform Memory Access), NUMA (Non-Uniform Memory
>Access)、Norma (No Remote Memory Access)というマルチプロセッ
>サの分類は、1988 年くらいの Mach の論文でよく出てきたもので
>す。それが最初かどうかはわからないけれど。OSを作る時には、
>そういう分類の仕方は便利です。UMA のことを最近は、SMP
>(Symmetric Multiprocessor) と言っているので、NUMA をSMP とは
>言わないでしょう。
>
>Symmetric と Uniform が違うと言われても困るし。
一般アプリを作るプログラマまで、マシンのトポロジ構成を意識するようでは
Symmetricとは呼べないと思います。SMPのメリットは、メモリやPEのトポロジ
を意識せずとも、単にマルチスレッドなプログラムを書いておけば、PE数に
「ほぼ」比例した性能向上が簡単に得られることに有ると思うので。
>昔の NUMA は、ローカルとリモートで 100 倍くらい速度が違いま
>した。それで、ソフトウェアの作り方を変えないと全然使えません
>でした。Sun の場合、今までの UMA 用のソフトエェアでもちゃん
>と使えて性能が出るなら、UMA と言ってもいいと思います。UMA と
>いっても、もともとキャッシュはアリで、それの速度の差は無視し
>ているのですから。
>
>NUMA って、うまいソフトウェアを作るのが難しいんですよね。
>Linda の tuple space を置くといいという話は聞いたことがある
>んのですけれど、どうなんでしょう。
nCubeとかHyperTreeとか、難しくて(=面白くて)、でもなかなか効果が
得られないんですよね。気が付くと、問題の方をマシンのトポロジに
合わせたものを捜して来るようになってしまう始末。本末転倒そのもの。
In article <m3u180x...@maedapc.cc.tsukuba.ac.jp>
ma...@cc.tsukuba.ac.jp writes:
>外部の回路で頑張れば,DP版でも2より多いプロセッサ数でマルチプロセッシ
>ングができそうですが…この辺は素人なので良く分かりません.また,MP版の
>資料には「4-way, 8-way, あるいはそれ以上のプロセッサ数」と書いてありま
>すが,Xeon MPで4よりプロセッサ数が多いSMPマシンって存在するんでしょう
>か?
思い出したのですが、昔PC-8801,PC-9801全盛期の頃、ウェストサイドという
> fj.sys.ibmpcで昔話題になりましたが、Xeonならどれでもというわけでは
> ないようです。Pentium3 Xeonでも、4way以上のSMPが組めるのは550MHz,
> 700MHzのものだけです。他のPentium3 Xeonは、2way止まり。
> Pentium4 Xeonも2way止まりで、HTを利用してやっと4スレッドという
> ことではないかなあ。
秋葉原などでPentium Xeonとして売られているものはDualまでの版ですね.
Pentium Xeon MPやItanium2なんかは手に入るのかな.Athlon MPもデュア
ル迄だし,Opteron も 2xxばっかりだし.
(初代Itanium(Merced)をジャンク屋で2980円とかで買った人がいるそうですが,
マザーは入手できなかったようです.)
> >自分で SMP (4頭以上) を組み立てる、なんてことはできるんでしょ
> >うか。8 個くらいは欲しいんだけれど。Dual までは、よくマザー
> >ボードも見るのですが、4 というのは見たことがありません。
> SuperMicroなんかだと有りますよ。Asusも一般向けではなく、企業
> 向けのカタログなんかには大抵載っています。
SupermicroのP4QH6とかは,検索してみると通販でも買えそうですね.20万を
優に越える値段だし,Xeon MPをどう入手するかという問題がありますが.
> >> 遠い近いでレーテンシが変わっても(NUMAでも)SMPって言うんですかね.
> >> まあ,NUMAとUMAを合わせてSMPなのかな.
> >
> >UMA (Uniform Memory Access), NUMA (Non-Uniform Memory
> >Access)、Norma (No Remote Memory Access)というマルチプロセッ
> >サの分類は、1988 年くらいの Mach の論文でよく出てきたもので
> >す。それが最初かどうかはわからないけれど。OSを作る時には、
> >そういう分類の仕方は便利です。UMA のことを最近は、SMP
> >(Symmetric Multiprocessor) と言っているので、NUMA をSMP とは
> >言わないでしょう。
> >
> >Symmetric と Uniform が違うと言われても困るし。
>
> 一般アプリを作るプログラマまで、マシンのトポロジ構成を意識するようでは
> Symmetricとは呼べないと思います。SMPのメリットは、メモリやPEのトポロジ
> を意識せずとも、単にマルチスレッドなプログラムを書いておけば、PE数に
> 「ほぼ」比例した性能向上が簡単に得られることに有ると思うので。
Symmetricでないマシンでは,たくさんあるうちの特定のCPUしか(ハード的に)
割り込み処理やI/Oができなかったのが,「どのCPUも同じ役割が出来る」とい
う意味でSMP と呼んでいたのでは? メモリのアクセスレーテンシとは関係ない
と思います.
ところで,Solaris 9にはMPO (Memory Placement Optimization)という機能が
入っていて,これを使ってスレッドやメモリの割り付け方を制御できるそうで
す.
http://www.sun.com/servers/wp/docs/mpo_v7_CUSTOMER.pdf
これを使うと,ランダムに割り付けた場合と比べて,メモリのバンド幅はマイ
クロベンチマークで最大4倍ほど向上するようですが,アプリケーションの性
能向上はせいぜい10%前後のようです.
(ベンチマークの数値が10%向上したら,宣伝上は大きいでしょうけど.)
今まで(Solaris 8まで)は,物理的構成を無視して配置していたので,がんばっ
てレーテンシの差が小さいアーキテクチャにしていたが,MPOができたので今
後はもっと階層化して楽にプロセッサ数を増やす…ってのはうがちすぎでしょ
うか.その方がベンチマークの数値(だけ)は向上しそうです.
# 単に増やすだけならクラスタで良いのかな.
> >外部の回路で頑張れば,DP版でも2より多いプロセッサ数でマルチプロセッシ
> >ングができそうですが…この辺は素人なので良く分かりません.また,MP版の
> >資料には「4-way, 8-way, あるいはそれ以上のプロセッサ数」と書いてありま
> >すが,Xeon MPで4よりプロセッサ数が多いSMPマシンって存在するんでしょう
> >か?
> 売ってました。で、とあるRS-232Cで対戦するゲームソフトのファイラー
> にコピーのパラメータだけでなく、本来一対一で対戦するそのソフトを
> 多人数で対戦する為のRS-232Cケーブルの配線図がグラフィック文字で
> 描いてありました。あんな感じですかね。
たしかに,なんとなくそんな感じかも.
でも,外づけのアービタってのは,昔は当たり前だったんじゃないでしょうか.
今やると,レーテンシがどうなるかとか,バススヌープがどうなるかとかは良
く分からんですが.いずれにせよ,チップセットを自作するのは,今や大手メー
カーにとっても敷居が高過ぎるでしょうね.
前田敦司
8章がShared Memory MIMD Archtecturesという章で,Shared Memory Computerの中
にSingle Address Space Memory Accessというカテゴリがあります。すべてのプロセ
サから同じメモリ空間が見えるマルチプロセサはこの分類に入ります。その中に
Physical Shared MemoryとVirtual(Distributed)Shared Memoryというサブカテゴ
リがあり,前者がUMA,後者は更にNUMA,CC-NUMA,COMAと細分されています。勿論,
これが唯一の分類法というわけではないのですが,一つの考え方です。そして,一般
的にはUMAをSMPと呼んでいると思います。
Intelのように共通バスのUMAは考えやすいのですが,最近のようにスイッチベース
になるとメモリチップからの読み出しパスの長さによって,論理的にはUMAでもアク
セス時間が違うようになっています。一方,昔のNUMAはコントロール回路が遅かった
のでローカルとリモートでアクセス時間が相当違い,意識してプログラムを書かない
と性能が出なかったのですが,最近では回路が速くなってリモートでもローカルの3
倍以内程度でアクセスできるようになり,ユーザから見て差が無くなってきていま
す。
実装上のUMAとCC-NUMAあるいはCOMAの大きな違いはキャッシュコヒーレンシの取り
方です。UMAの場合はUniformなので全プロセサにアドレスをブロードキャストしてス
ヌープします。一方,CC-NUMAではホームノードにテーブルを持ち,どのキャッシュ
ラインがどのノードに持っていかれたかを管理しており,スヌープをそれらのノード
だけに送るというやり方が一般的です。
全部のメモリアクセス要求を全部のプロセサに送るとN^2でトラフィックが増える
のでUMAでスケールを大きくするのは困難が大きく,最近の大規模システムは殆ど
CC-NUMAです。ということで,各社,あまりSMPとは言わなくなっていると思います。
SunなどはCC-NUMAのSF15KをScalable Multi Processorなどという紛らわしい名前で
呼んでいますが,流石にSymmetricというのは遠慮しているようです。
Ando_san
"MAEDA Atusi" <ma...@cc.tsukuba.ac.jp> wrote in message
news:m3ptiky...@maedapc.cc.tsukuba.ac.jp...
> 索引にはSMPあるいはSymmetric Multi Processor
> というのは含まれて居ません。
やっぱり"SMP"という言葉は,メモリアーキテクチャを表す言葉としては曖昧
ですよね.
> Physical Shared MemoryとVirtual(Distributed)Shared Memoryというサブカテゴ
> リがあり,前者がUMA,後者は更にNUMA,CC-NUMA,COMAと細分されています。勿論,
> これが唯一の分類法というわけではないのですが,一つの考え方です。
DSMというとNORMAも入れる考え方もありますよね(Software DSM).
> そして,一般
> 的にはUMAをSMPと呼んでいると思います。
...
> 昔のNUMAはコントロール回路が遅かった
> のでローカルとリモートでアクセス時間が相当違い,意識してプログラムを書かない
> と性能が出なかったのですが,最近では回路が速くなってリモートでもローカルの3
> 倍以内程度でアクセスできるようになり,ユーザから見て差が無くなってきていま
> す。
...
> 全部のメモリアクセス要求を全部のプロセサに送るとN^2でトラフィックが増える
> のでUMAでスケールを大きくするのは困難が大きく,最近の大規模システムは殆ど
> CC-NUMAです。ということで,各社,あまりSMPとは言わなくなっていると思います。
...
> SunなどはCC-NUMAのSF15KをScalable Multi Processorなどという紛らわしい名前で
> 呼んでいますが,流石にSymmetricというのは遠慮しているようです。
Symmetricというのは,元々の意味(割り込み・I/Oがどのプロセッサでも出来
る)としては合ってるんじゃないでしょうか.ただ,別の語感(Uniform)が染み
着いちゃってるので,避けた方が無難ですよね.
おおまかに言うと「SMPとは,もともとUMA(の一部)を指す言葉であったが,現
在は『メモリの配置をあまり意識しなくても性能が出る共有メモリ』くらいの
曖昧な意味で使われている言葉である」という感じですかね.
先に挙げた http://www.sun.com/servers/wp/docs/mpo_v7_CUSTOMER.pdf では,
The UltraSPARC III-processor-based Sun Fire server family uses common
technology and components to create efficient shared memory processing
(SMP) systems at different sizes and capacities. (p.2)
とかあります.紛らわしいなあ.
前田敦司
In article <m3vfsawo...@maedapc.cc.tsukuba.ac.jp>
MAEDA Atusi <maeda...@maedapc.cc.tsukuba.ac.jp> writes:
> Symmetricというのは,元々の意味(割り込み・I/Oがどのプロセッサでも出来
> る)としては合ってるんじゃないでしょうか.ただ,別の語感(Uniform)が染み
> 着いちゃってるので,避けた方が無難ですよね.
昔、Luna88k という共有メモリのマルチプロセッサを使っていまし
たが、割込みは、CPU#0 しか受付けなかったような気がします。タ
イマ割込みをのぞいて。(いや、標準の Mach じゃなくて、自分で
作った手抜きOSだったのかもしれない。)
Sequent Balance というのも使ったことがあるのですが、これは、
SLIC というハードウェアがついていて、一番負荷の軽い CPU に割
込みが行くようになっていました。最後の1個をカーネル用にとっ
ておくというのが、Sequent Dynix の定石でした。たとえば、12
CPU なら、アプリケーションでは、11 個だけ使うようにすると、
速かったです。
実は、4 CPU しか使ったことはないんだけど。
In article <bj25ja$q9p$1...@news511.nifty.com>
"ando_san" <ando...@nifty.com> writes:
> Intelのように共通バスのUMAは考えやすいのですが,最近のようにスイッチベース
> になるとメモリチップからの読み出しパスの長さによって,論理的にはUMAでもアク
> セス時間が違うようになっています。一方,昔のNUMAはコントロール回路が遅かった
> のでローカルとリモートでアクセス時間が相当違い,意識してプログラムを書かない
> と性能が出なかったのですが,最近では回路が速くなってリモートでもローカルの3
> 倍以内程度でアクセスできるようになり,ユーザから見て差が無くなってきていま
> す。
3倍か。昔は、100倍くらいだったから、すごいですね。3倍とい
うと、キャッシュとメモリの速度差より小さいですよね。
In article <bj25ja$q9p$1...@news511.nifty.com>
"ando_san" <ando...@nifty.com> writes:
> 実装上のUMAとCC-NUMAあるいはCOMAの大きな違いはキャッシュコヒーレンシの取り
> 方です。UMAの場合はUniformなので全プロセサにアドレスをブロードキャストしてス
> ヌープします。一方,CC-NUMAではホームノードにテーブルを持ち,どのキャッシュ
> ラインがどのノードに持っていかれたかを管理しており,スヌープをそれらのノード
> だけに送るというやり方が一般的です。
共有メモリの共有のセマンティクスは、どうなっているんでしょう
か。同期処理と一体化したようなもの(たとえばrelease
consistency)は、使われているんでしょうか。
Java をマルチスレッドで走らせて、ちゃんと走るんでしょうか。
In article <YAS.03Se...@kirk.is.tsukuba.ac.jp>, y...@is.tsukuba.ac.jp (Yasushi Shinjo) writes
> 昔、Luna88k という共有メモリのマルチプロセッサを使っていまし
> たが、割込みは、CPU#0 しか受付けなかったような気がします。タ
> イマ割込みをのぞいて。(いや、標準の Mach じゃなくて、自分で
> 作った手抜きOSだったのかもしれない。)
このあたりは、割込みコントローラの問題ですよね。Linux はどう
だったかな。割込みのベクタは両方のCPUで共有だったような気が
する。どっちにいってもだいじょうぶなように設計するのは割りと
簡単だし、OS的にも楽かな。
> ておくというのが、Sequent Dynix の定石でした。たとえば、12
> CPU なら、アプリケーションでは、11 個だけ使うようにすると、
> 速かったです。
一つあけておくってのは、Sun でも使えるテクニックだったと思い
ます。
> 3倍か。昔は、100倍くらいだったから、すごいですね。3倍とい
> うと、キャッシュとメモリの速度差より小さいですよね。
メインメモリがCPUから遠くなったからですよね。
でも、UMAは、しょせんスケーラビリティはないと思う。どうせ、
分散アルゴリズム的にいろいろやるならUMAである必要はないから。
配列でしかプログラムできない人達のためのものなんだと思います
ね。現実には、そういうアプリケーション(というか、数値計算)
が多いんでしょうけど。
> 共有メモリの共有のセマンティクスは、どうなっているんでしょう
> か。同期処理と一体化したようなもの(たとえばrelease
> consistency)は、使われているんでしょうか。
UMAっていう時には共有のセマンティクスはなくて、みんなで書き
込むとどうなるかわからないってものだと思います。
Sequent は、なんかlock機構が入っていたと記憶します。アクセス
する前に、なんかのマクロを呼ぶみたいな方法ですね。共有メモリ
に変なセマンティクスをいれてなんとかするってのは、僕はあんま
り良い方法だとは思わない。同期機構は分割統治を意識して、
少数で共有された多数の同期機構を用いるのが良いはずです。
分割手法のないロック機構はだめだと思う。
> Java をマルチスレッドで走らせて、ちゃんと走るんでしょうか。
それは、また、別な問題ですよね。ちゃんとってのがパフォーマンス
が出るかって問題だとすると言語的にも実装的にも難しいんですよね。
共有されているオブジェクトを Reference counting でGCするような
実装で、何も考えずにパフォーマンスが出るSMPを作れってのは、
ちょっと勝手すぎると思う。
-- Snip --
>
> > 共有メモリの共有のセマンティクスは、どうなっているんでしょう
> > か。同期処理と一体化したようなもの(たとえばrelease
> > consistency)は、使われているんでしょうか。
Memory consistency modelは,通常,CPUのアーキテクチャで規定されているの
で,共有メモリをUMAで実装するかCC-NUMAで実装するかで変えるということはないと
思います。弱い方に変えたりすると,昔,動いていたプログラムがミステリアスに動
かなくなったりして,大問題になります。
Sunの例でいうと,Memory consitencyはTotal Store Orderで,ストアは命令順に
実行,ロード同士の順序も命令順で,但し,ロードはストアを追い越して前に出られ
るという規則です。これを止めるにはバリア命令があり,バリアを越えて前後には移
動しないという仕様になっています。
AlphaとかPowerとかItaniumはWeak Consistencyで,原則的には命令に出てくる順
序と実行される順序は無関係です。明に順序を付ける場合はバリア命令を入れる必要
があります。
プロセサ間の同期を取る場合は,SWAPとかのアトミックにロードとストアをやる命
令があり,これでセマフォなどを作って排他制御するのが一般的ですが,TSOのよう
なある順序性が保証されている場合は,Dekker's Algorithmのようなやり方で同期を
とることも可能です。
>
> UMAっていう時には共有のセマンティクスはなくて、みんなで書き
> 込むとどうなるかわからないってものだと思います。
>
> Sequent は、なんかlock機構が入っていたと記憶します。アクセス
> する前に、なんかのマクロを呼ぶみたいな方法ですね。共有メモリ
> に変なセマンティクスをいれてなんとかするってのは、僕はあんま
> り良い方法だとは思わない。同期機構は分割統治を意識して、
> 少数で共有された多数の同期機構を用いるのが良いはずです。
> 分割手法のないロック機構はだめだと思う。
>
> > Java をマルチスレッドで走らせて、ちゃんと走るんでしょうか。
論理的には問題ない筈です。
>
> それは、また、別な問題ですよね。ちゃんとってのがパフォーマンス
> が出るかって問題だとすると言語的にも実装的にも難しいんですよね。
> 共有されているオブジェクトを Reference counting でGCするような
> 実装で、何も考えずにパフォーマンスが出るSMPを作れってのは、
> ちょっと勝手すぎると思う。
何も考えずにパフォーマンスが出るのが理想なのですが,現実はなかなかそうはい
きません。
Ando_san