なんだかSQLチューニングなことをやっているのですが。
『Web検索していると「WHERE 〜 IN 」を使うより EXIST を使ったほうが速い』なんていう文章をよく見るのだが、手元の PostgreSQL で実行すると WHERE IN のほうが速いぞ。 状況にもよるが。
おいおい、詳しいことを調べて書いてみようっと。
昨日の MapReduce の話を聞いて、Google や Yahoo検索のような大規模Webサイトの実装方法が何となくわかってきたぞ。 hadoop でほぼ無限大のテーブルとストレージを準備して、あとは形態素解析とかページランク相当のものをつくったりとか。 詳細はまた書こうっと。