pig latin論文メモ

UDF: user-defined function
例: URLの集合を受け取り、pagerankの上位10件を返す関数top10()
関数top10()を用いたクエリの例:


groups = GROUP urls BY category;
output = FOREACH groups GENERATE
category, top10(urls);
のような書き方ができる。

javaで記述される。今後はC/C++, Java, Perl and Pythonで書けるようにする。


COGROUP: ほぼJOIN文