GRAPE-DR 上の LINPACK

牧野淳一郎教授のコラムで、LINPACKと効率についての考察があったので、引用させていただく。
73. GRAPE-DR 上の LINPACK (2009/11/17 追加)

一応、 11/16 現在で、メモリ 16GB まで使って 410Gflops で、効率 50% 以上 になりました。この速度だとチップ1つ当りで SX-9, ATI Radion 4870 での実 測のどちらも上回り、世界最高性能を実現しています。GPU の数字は 2009/11 Top 500 での中国の天河の数字は 5120 GPU + 5120 Xeon で 563 Gflops、 Xeon+GPU 1 セットあたり 110 Gflops ですが、Xeon でも計算しているので GPU の部分は70-80Gflops 程度と思われます。
この、効率50% 前後、という数字をみて低いとか失敗だとかいいたい人がいる のは想像できますが、私の立場は元々、演算器は現在の普通の計算機ではもっ とも高価な部分ではないので、そこだけの効率を云々するのはあまり意味がな い、というものであることはこの文章の前のほうも読んだことがある人なら理 解していただけるかと思います。 GRAPE-DR で対象にするアプリケーションの 中では、LINPACK はもっともネットワークバンド幅や主記憶バンド幅を要求す るものです。このため、LINPACK で演算器のピーク性能が出るようにシステムを構成す ることは、他の多くのアプリケーションでは不必要な程度までネットワーク・主 記憶バンド幅・主記憶サイズといったものに資源を投入し、その結果システム としての消費電力も大きなものになることを意味し、あまり賢明な選択ではあ りません。

63. GRAPE-DR の現状 (2008/7/18)

たかが 512台のホスト計算機にもそれほどお金 を掛ける余裕がない辺りが苦しいところで、これはどうしても例えば LINPACK の実測効率を下げるほうに働きます。ホストのメモリの量、主記憶速度が直接 性能に影響するので、、、マルチノードでの LINPACK では、 GRAPE-DR カード 1枚当り大体 5GB/s の実効転送速度を必要とするので、2枚挿すと実効速度が名 目速度の6割としても15GB/s の名目速度が必要になり、 DDR2-800 2チャネルで は不足で 950MHz 以上で動作して欲しい、という話になります。逆に、 12.8GB/s だとそこだけで効率が 80% を超えることが困難だとわかるわけです。

MS、「Windows Azure」を2010年1月に正式提供へ

メモ: 2月の利用分から課金が開始される

MS、「Windows Azure」を2010年1月に正式提供へ--PDCで発表:ニュース - CNET Japan

Ozzie氏は、Microsoftのデータセンター内のサーバ上で動作するプログラムを開発者らが作成可能となるクラウドベースのOS「Windows Azure」の正式ローンチに関する計画を発表した。Windows Azureは、テクノロジプレビューの提供が2009年末まで続けられ、米国時間2010年1月1日に正式サービスへと切り替わる予定である。Microsoftは1月中に課金システムのチェックおよびテストを完了し、2月の利用分から課金が開始されることになる。

1PB 程度のストレージはどの程度のコストで組むことができるか

ちょっと前に人力検索に出ていた質問に関連して
牧野淳一郎教授も考察されていたので、コラムを引用させていただく。

業務用のファイルサーバを構築しようと思います。 つきましては、どのようなサーバシステムにすればよいか、全般的なご意見をうかがえればと存じます。 条件は、 ・最初は.. - 人力検索はてな


./note068.html

PCIe x8 が4枚くらいささるマザー ボードを使えば、これでディスクが 128台、8台毎に RAID6 にする構成でも 1.5TB ディスクを作るなら 144TB になり、これを7台で1PB を超えることにな ります。

この構成だと、1組みあたりコストは

 1.5 TB ディスク 1.2万 128台        154万
ポートマルチプライア 1万 32個 32万
RR2532 raid カード 5万 4枚 20万
ホストPC 5万くらい?
電源ユニット 2万くらい 8個 16万
合計 230万くらい
ディスク1台当り 1.80万
となって1500万円くらいで 1PB のストレージになります。但し、このシステ ムの最大の弱点は、ネットワークです。まあ、それでも、PC それぞれに 10GbE のカードをつければ、100万円程度の追加コストで 70Gbps にはなるの で、 T2K システムくらいの性能はハードウェアとしては出ることになります。 少し違う例としてポートマルチプライアを使わないで多ポートの raid カード を使うことにすると

 1.5 TB ディスク 1.2万 64台        77万
RR2340 raid カード 5万 4枚 20万
ホストPC 5万くらい?
電源ユニット 2万くらい 4個 8万
合計 110万くらい
ディスク1台当り 1.712万
で、ノード数が増えるのですがこっちのほうが少し安いです。オンボードSATA ポートが8あるマザーでマルチプライアをつけると

 1.5 TB ディスク 1.2万 40台        48万
ポートマルチプライア 1万 8個 8万

ホストPC 5万くらい?
電源ユニット 2万くらい 3個 6万
合計 67万くらい
ディスク1台当り 1.675万

となってさらにほんの少し安くなります。但し、性能的には、Raid カードを 複数つける構成のほうが余裕はあると思われます。

Gordon Bell C/P 賞

牧野研究室出身者が受賞したということで、牧野淳一郎先生によるコラムを引用させていただく。
./note077.html

GPU での、実用に使えるような重力多体計算スキーム、 具体的には独立時間刻みやツリー法で性能を出す、という話は前にも書いたよ うに世界中で色々な人がやっていますが、濱田君や似鳥君が世界をリードして いるといっても間違いではなく、特に似鳥君はケンブリッジ大学やアムステル ダム大学を始めとして世界のトップレベルの研究グループにコードやノウハウ を提供しています。つまり、リード、というのが、単に先に進んでいる、とい う意味だけではなく、実際に指導的位置にあるわけです。

再帰関数には @tailrec アノテーションを

再帰関数を書くときのメモ。

再帰関数には @tailrec アノテーションを - イトウ アスカ blog

Scala 2.8では、@scala.annotaiton.tailrecアノテーションが追加されたそうです。これを末尾再帰最適化を期待するメソッドにつけとくと、最適化されないパターンだったときにコンパイラがエラーを吐いてくれるそうです。

Scaladoc for scala.annotation.tailrec

A method annotation which verifies that the method will be compiled with tail call optimization. If it is present, the compiler will issue an error if the method cannot be optimized into a loop.

継続的な計算機開発への取組・提案

スーパーコンピュータに関する牧野淳一郎教授の資料が分かりやすく、興味深かった。

• 継続的な計算機開発への取組・提案 牧野 淳一郎 国立天文台 - science technology記録4 - Yahoo!ブログ

http://www.nsc.riken.jp/sympo2009/09/slide/E/makino.pdf
• 計算機科学との連携
• 継続的な計算機開発への取組・提案
ということで、まずは「連携」のほうから。
牧野淳一郎
国立天文台

もうちょっと細かい教訓
• 「スパコン開発が計算機開発を推進」という考え方は時代遅れ
– 汎用プロセッサならx86 に勝てない(Intel 自身すら勝てない)
– ベクトルプロセッサは全く時代遅れ
– つまり: アクセラレータ以外の解はそもそもなかった
• とはいえ、「アクセラレータが正解」だったのは5-10 年前。5-10 年先
にできるものが何であるべきかは別問題。例えば、TSV とかProximity
Communication とかが実用になるなら、、、
• そういう要素技術開発からするのは正解か?というと、、、

ヒッグス粒子がダークマターと同じものであるという新理論

ダークマターについてまた復習したい。
謎の2粒子は正体同じ!?阪大教授が新宇宙理論 : ニュース : 宇宙 : YOMIURI ONLINE(読売新聞)


ノーベル賞を受賞した南部陽一郎博士の理論からその存在が予測されたヒッグス粒子が、宇宙を満たす謎の暗黒物質ダークマター)と同じものであるという新理論を、大阪大の細谷裕教授がまとめた。

 “二つの粒子”は、物理学の最重要テーマで、世界中で発見を競っている。暗黒物質は安定していて壊れないが、ヒッグスは現在の「標準理論」ではすぐに壊れるとされており、新理論はこれまでの定説を覆す。証明されれば宇宙は私たちの感覚を超えて5次元以上あることになり、宇宙観を大きく変える。

 ヒッグスは、質量の起源とされ、普段は姿を現さないが、他の粒子の動きを妨げることで、質量が生まれるとされる。一方、衛星の観測などから宇宙は、光を出さず安定した暗黒物質で満ちていると予想されている。細谷教授は、宇宙が時間と空間の4次元ではなく、5次元以上であると考え、様々な粒子が力を及ぼしあう理論を考えた。その結果「ヒッグスは崩壊せず、電荷を持たない安定した存在」となった。

 欧州にある世界最大の加速器(LHC)では最大の課題としてヒッグスの検出実験が行われる。ヒッグスが不安定なら、崩壊時に観測が可能だが、細谷理論のように安定だと観測できない。ただ、新たな実験手法で検証は可能という。

「ヒッグス粒子」と「ダークマター」は同じもの?新宇宙理論誕生! - アイラブサイエンス

ヒッグス場とヒッグス粒子 ヒッグス粒子とはヒッグス場を 説明するために考え出された。ヒッグス場とは、1964年にエディンバラ大学のピーター・ウェア・ヒッグスによって提唱された、素粒子の質量獲得に関する 理論に現れる場についての仮説である。ヒッグス場によって質量を獲得するメカニズムをヒッグス機構と呼ぶ。

 ヒッグス機構では、宇宙の初期の状態においてはすべての素粒子は自由に動きまわることができ質量がなかったが、自発的対称性の破れが生じて真空に 相転移が起こり、真空にヒッグス場の真空期待値が生じることによってほとんどの素粒子がそれに当たって抵抗を受けることになったとする。

 これが素粒子の動きにくさ、すなわち質量となる。質量の大きさとは宇宙全体に広がったヒッグス場と物質との相互作用の強さであり、ヒッグス場というプールの中に物質が沈んでいるから質量を獲得できると見なすのである。

 ヒッグス粒子加速器LHC 光子はヒッグス場からの抵抗を受けないため相転移後の宇宙でも自由に動きまわることができ質量がゼロであると考える。では、ヒッグス場は本当に存在するのだろうか?

 電磁場が存在すれば光子があるように、ヒッグズ場が存在すればヒッグス粒子が最低1種類あるはず。ヒッグス粒子の性質は理論でよく予言されているので、どのような方法で発見するかはわかっている。

 これまでの実験でまだ発見されていないので、ヒッグス粒子は114 GeV より重いはず。理論の予言もまた間接的実験結果も、ヒッグス粒子は 1000 GeV (1兆電子ボルト)より低い領域に存在すると強く示唆している。

 とくに 200 GeV より低い事がかなりの程度の確率で示唆されている。このエネルギー領域には次世代の加速器LHC(スイスで建設中、2007年完成予定)やILC(計画中)で到達できるので、ここ10年以内にヒッグス粒子は発見される可能性が非常に高い。