2008-05-01から1ヶ月間の記事一覧

Is Amazon’s Dynamo not DHT ?

Overlay Network (Japanese) | Google グループ OracleのCoherence、IBMのObjectGridは、よく似たクラスタ・ネットワーク上の分散Cacheのシステムです。基本は、Key/Valueマップをネット上に拡大したものです。これらのクラスタのCache技術は、実装としては…

Consitent Hashing

steps to phantasien 普通のデータベースは書込みのタイミングで一貫性を保証しようとし, 衝突があった場合はその書込み要求を拒否する. 一方の Dynamo は "always writable" という目標を持っており, 書き込みの失敗は許されない. だから衝突のあるデータも…

Roma、Fairyについてひとことふたこと

古橋貞之の日記 個々のデータのサイズがある程度均一で、個々のデータに対するアクセスがある程度均一で、ノードの数よりデータの数の方がずっと多いなら、「ランダムにばらまく」で均等に分散(容量と負荷の分散)ができる。具体的な実装に踏み込めば、デー…

ポスト検索の道は何が切り開くのか:グーグルキラーを探す

web

CNET Japan Freebaseが大きなブレイクスルーになる可能性はある。 いつか調べる。

Google Sets より高精度の用語集合拡張器 SEAL

web

カーネギーメロン大学コンピュータサイエンス学部から送るPh.D.学生日記。 さて、友人が言語非依存版Google Setのようなものをつくり、さらに精度を比較実験したところ 英語ではGoogle Setよりだいぶいいものを作ってしまったので、ご紹介します。 「用語集…

Webでの単語共起を調べるサイト

web

たつをの ChangeLog ヤフー検索を用いてWebでの単語共起を調べるサイト 「Web単語共起」(http://yapi.ta2o.net/tangokyouki/) を作りました。 非常に面白い。

次のグーグルはどこか?

web

CNET Japan 例えば、Endecaという企業は、数あるサービスの1つとして、カスタマイズされた企業向け検索エンジンを提供している。Microsoftの新興企業チームの検索担当マネージャー兼事業開発担当ディレクターのDon Dodge氏によると、Endecaの2007年の予想売…

情報の洪水で注意力は細切れに--ソフトウェアでどう支援できるか

CNET Japan TODOISTはここでわれわれが必要と考えるものに近い。仕事を日付と優先順位に分解する。 TODOISTを使ってみよう。

楽天OSは画餅か否か?

日々戯言 単一のアプリケーションで4TByteものファイルデータをメモリにおく需要なんてほとんどありません。もし4Tもファイルがメモリ上に展開されていないとパフォーマンスが発揮できないのだとしたらアプリケーションのアーキテクチャが悪いのです。その中…

Amazon’s Dynamo is awesome!

たけまる Dynamo のベースになっている Chord という技術は,1億ノードでも動作するように設計されている.このため,各ノードがすべてのデータの在処を記憶するのではなく,分散させておく.しかし,Dynamo の場合はもう少し規模が小さい (おそらく,数百〜…