SVMと並列処理

以下コメント欄より
しかしSVMも最近は速いらしい - 射撃しつつ前転

NIPS'07にSVMを並列化する話がありましたが、30台ぐらいまでは線形でスケールしてましたけど、500台規模になると250台より性能が落ちるみたいです(Table 2)。

マルチコア(1ノード, 16コア)程度だと適当にスケールするけど、本当に大規模な並列分散環境でやろうとすると、きついという事ですかね。

ただボトルネックがCommunication & Synchronization Costという事なので、MyrinetやInfinibandなどスパコンセンターで使われるようなネットワークを使えば大丈夫なのかもしれません(論文にネットワーク構成が書いてないですけど、たぶん通常の1G Etherとか)。単純な計算時間自体はスケールしているように見えます(Figure 1)。