トップ «前の日記(Mon Sep 29 2008) 最新 次の日記(Wed Oct 01 2008)» 編集

よこいまさる日記



Tue Sep 30 2008 [長年日記]

MapReduce @ クラウド研究会

竹嵜さんにご招待いただいてクラウド研究会に参加しました。

今回のネタは丸山先生のMapReduce。 Googleの論文からはじまり、Map, GroupBy (Shuffling), Reduce の各部分で何をするのかといった内容とか、この環境での Fault tolerant とか。

昔のY社にいたときには、大量のログを分析するとか、大量にあるテキストを処理するとか、そういうネタがあって MapReduce な環境がほしかったんだけど、最近だとそれほどの量のデータを扱う仕事がないからなぁ。。 仕事がないのなら仕事を作り上げればいいんだろうけど。

あとは「どんな状況の時にMapReduceが使えるのか」なんていう話があったのだが、僕的には「大量のデータがあって、それをバッチ処理なりで回すといった使い方には使いやすいんじゃないか」なんて思うんですけどね。

久しぶりに大規模データの取り扱いなネタのお話で、楽しかったです。

本日のツッコミ(全2件) [ツッコミを入れる]
okachan (Wed Oct 01 2008 23:57)

おもしろそうー<br>仕事としてるのは責任大きいけど<br>興味としては聞いてみたいなー

まさる (Thu Oct 02 2008 01:50)

昔 okachan が「sort|uniq ってやると out of memory って出るんだけど」とか言っていた頃が懐かしい。 あの手のでかいデータを自由に加工できる環境ってすばらしいですよ。 現役時代に欲しかった、あったらもっといろいろできたのに、なんて思います。


2000|10|
2002|01|02|03|04|05|06|07|08|09|10|11|12|
2003|01|02|03|04|05|06|07|08|09|10|11|12|
2004|01|02|03|04|05|06|07|08|09|10|11|12|
2005|01|02|03|04|05|06|07|08|09|10|11|12|
2006|01|02|03|04|05|06|07|08|09|10|11|12|
2007|01|02|03|04|05|06|07|08|09|10|11|12|
2008|01|02|03|04|05|06|07|08|09|10|11|12|
2009|01|02|03|04|05|06|07|08|09|10|11|12|
2010|01|02|03|04|05|06|07|08|09|10|11|12|
2011|01|02|03|04|05|06|07|08|09|10|11|12|
2012|01|02|03|04|05|