スキップしてメイン コンテンツに移動

ElasticSearchのCluster機能を試す

ElasticSearchとは、の修正
昨日僕はElasticSearchを「検索エンジン」と書きましたが、正確に言うと「全文検索エンジンであるLuceneを使用した、全文検索システム」です。

Luceneとは
Apache Software Foundationで開発されている全文検索エンジンで、Javaのクロスライブラリとして提供されています。

Solrとは
Apache Software Foundationで、Luceneのサブプロジェクトとして開発されている、全文検索システムです。Luceneを検索エンジンとして使用しており、もちろんJavaで書かれています。

ElasticSearchとSolrの比較
ものすごくざっくり言っちゃうと、ElasticSearchはRESTfulで全てがJSONです、ということ...なのかな
ElasticSearchにあるclustering機能はSolr4で採用されたSolrCloud機能でカバーされたようだし、細かいことは色々あるんだろうけど、簡易的な使い方に絞って言えばRESTfulなのはとても便利だと思います。

本題
今回はElasticSearchのCluster機能を試してみたいと思います。



Cluster設定
/etc/elasticsearch/elasticsearch.ymlで細かい設定が出来ますが、このファイルの冒頭には以下のように記載されています。
Most of the time, these defaults are just fine for running a production cluster.
ということで細かい設定せずにこのままいっちゃいます。

まず、ElasticSearchをセットアップした2台のEC2を用意し、セキュリティグループで9200/tcp、9300/tcpのInboundをオープンします。

初期状態のノードAのクラスタの状態は以下の通りです。
$ curl localhost:9200/_cluster/nodes/_local
{"ok":true,"cluster_name":"elasticsearch","nodes":{"-saA5swFSpWxPlnGV9kGcQ":{"name":"Shocker","transport_address":"inet[/172.31.2.129:9300]","hostname":"ip-172-31-2-129","version":"0.90.5","http_address":"inet[/172.31.2.129:9200]"}}}
$ sudo cat /var/log/elasticsearch.log
[2013-10-29 00:53:20,943][INFO ][node                     ] [Shocker] version[0.90.5], pid[4321], build[c8714e8/2013-09-17T13:09:46Z]
[2013-10-29 00:53:20,944][INFO ][node                     ] [Shocker] initializing ...
[2013-10-29 00:53:20,952][INFO ][plugins                  ] [Shocker] loaded [], sites []
[2013-10-29 00:53:24,308][INFO ][node                     ] [Shocker] initialized
[2013-10-29 00:53:24,309][INFO ][node                     ] [Shocker] starting ...
[2013-10-29 00:53:24,520][INFO ][transport                ] [Shocker] bound_address {inet[/0:0:0:0:0:0:0:0:9300]}, publish_address {inet[/172.31.2.129:9300]}
[2013-10-29 00:53:27,564][INFO ][cluster.service          ] [Shocker] new_master [Shocker][-saA5swFSpWxPlnGV9kGcQ][inet[/172.31.2.129:9300]], reason: zen-disco-join (elected_as_master)
[2013-10-29 00:53:27,614][INFO ][discovery                ] [Shocker] elasticsearch/-saA5swFSpWxPlnGV9kGcQ
[2013-10-29 00:53:27,642][INFO ][http                     ] [Shocker] bound_address {inet[/0:0:0:0:0:0:0:0:9200]}, publish_address {inet[/172.31.2.129:9200]}
[2013-10-29 00:53:27,642][INFO ][node                     ] [Shocker] started
[2013-10-29 00:53:27,668][INFO ][gateway                  ] [Shocker] recovered [0] indices into cluster_state
同じく初期状態のノードBのクラスタの状態は以下の通りです。
$ curl localhost:9200/_cluster/nodes/_local
{"ok":true,"cluster_name":"elasticsearch","nodes":{"sHxbUNgxRieV2z9Pyt9ZVA":{"name":"Mister Machine","transport_address":"inet[/172.31.8.224:9300]","hostname":"ip-172-31-8-224","version":"0.90.5","http_address":"inet[/172.31.8.224:9200]"}}}
$ sudo cat /var/log/elasticsearch.log
[2013-10-29 02:20:24,468][INFO ][node                     ] [Mister Machine] version[0.90.5], pid[1346], build[c8714e8/2013-09-17T13:09:46Z]
[2013-10-29 02:20:24,469][INFO ][node                     ] [Mister Machine] initializing ...
[2013-10-29 02:20:24,476][INFO ][plugins                  ] [Mister Machine] loaded [], sites []
[2013-10-29 02:20:28,881][INFO ][node                     ] [Mister Machine] initialized
[2013-10-29 02:20:28,882][INFO ][node                     ] [Mister Machine] starting ...
[2013-10-29 02:20:29,161][INFO ][transport                ] [Mister Machine] bound_address {inet[/0:0:0:0:0:0:0:0:9300]}, publish_address {inet[/172.31.8.224:9300]}
[2013-10-29 02:20:32,240][INFO ][cluster.service          ] [Mister Machine] new_master [Mister Machine][sHxbUNgxRieV2z9Pyt9ZVA][inet[/172.31.8.224:9300]], reason: zen-disco-join (elected_as_master)
[2013-10-29 02:20:32,292][INFO ][discovery                ] [Mister Machine] elasticsearch/sHxbUNgxRieV2z9Pyt9ZVA
[2013-10-29 02:20:32,321][INFO ][http                     ] [Mister Machine] bound_address {inet[/0:0:0:0:0:0:0:0:9200]}, publish_address {inet[/172.31.8.224:9200]}
[2013-10-29 02:20:32,322][INFO ][node                     ] [Mister Machine] started
[2013-10-29 02:20:32,356][INFO ][gateway                  ] [Mister Machine] recovered [0] indices into cluster_state

同一サブネットで、同一クラスタ名("elasticsearch")なのに、それぞれが別のクラスタのマスタになっています。何故でしょう?

そこでdiscoveryの挙動について調べてみます。elasticsearch.ymlに以下の記載がありました。
# Discovery infrastructure ensures nodes can be found within a cluster
# and master node is elected. Multicast discovery is the default.
Discoveryはデフォルトではマルチキャストを使ってmaster nodeを検索しに行くようです。

しかしAmazon Virtual Private Cloud FAQ
Q: Amazon VPC は、マルチキャストまたはブロードキャストをサポートしますか?
いいえ。
と記載されています...Amazon VPCではmulticast discoveryは使えません。AWS Cloud Plugin for ElasticSearchにも辿り着いたのですが、やはりVPCではうまく動作しませんでした。

それではunicast discoveryを使った構成で構築してみます
ノードA、ノードB共に、elasticsearch.yamlを修正し、multicast discoveryを無効化し、unicast対象のmaster nodeとなるホストを記載します。ここではノードAとノードBのIPアドレスを記載しました。
$ sudo vi /etc/elasticsearch/elasticsearch.yml
discovery.zen.ping.multicast.enabled: false
discovery.zen.ping.unicast.hosts: ["172.31.2.129","172.31.8.224"]
ではノードAでサービスを起動してみます。なお[***.log]の***の部分はcluster nameになります。
$ sudo service elasticsearch start
$ cat /var/log/elasticsearch/elasticsearch.log
[2013-10-29 05:11:24,797][INFO ][node                     ] [Stranger] version[0.90.5], pid[21630], build[c8714e8/2013-09-17T13:09:46Z]
[2013-10-29 05:11:24,797][INFO ][node                     ] [Stranger] initializing ...
[2013-10-29 05:11:24,815][INFO ][plugins                  ] [Stranger] loaded [cloud-aws], sites []
[2013-10-29 05:11:28,382][INFO ][node                     ] [Stranger] initialized
[2013-10-29 05:11:28,382][INFO ][node                     ] [Stranger] starting ...
[2013-10-29 05:11:28,566][INFO ][transport                ] [Stranger] bound_address {inet[/0:0:0:0:0:0:0:0:9300]}, publish_address {inet[/172.31.2.129:9300]}
[2013-10-29 05:11:31,615][INFO ][cluster.service          ] [Stranger] new_master [Stranger][LajRpjtATZma4sBlgz96NQ][inet[/172.31.2.129:9300]], reason: zen-disco-join (elected_as_master)
[2013-10-29 05:11:31,631][INFO ][discovery                ] [Stranger] elasticsearch/LajRpjtATZma4sBlgz96NQ
[2013-10-29 05:11:31,661][INFO ][http                     ] [Stranger] bound_address {inet[/0:0:0:0:0:0:0:0:9200]}, publish_address {inet[/172.31.2.129:9200]}
[2013-10-29 05:11:31,661][INFO ][node                     ] [Stranger] started
[2013-10-29 05:11:32,643][INFO ][gateway                  ] [Stranger] recovered [1] indices into cluster_state
ノードAがmasterとして起動しました。

次にノードBのサービスを再起動します。
$ sudo service elasticsearch start
$ cat /var/log/elasticsearch/elasticsearch.log
[2013-10-29 05:11:59,093][INFO ][node                     ] [Smuggler I] version[0.90.5], pid[18229], build[c8714e8/2013-09-17T13:09:46Z]
[2013-10-29 05:11:59,094][INFO ][node                     ] [Smuggler I] initializing ...
[2013-10-29 05:11:59,111][INFO ][plugins                  ] [Smuggler I] loaded [cloud-aws], sites []
[2013-10-29 05:12:02,621][INFO ][node                     ] [Smuggler I] initialized
[2013-10-29 05:12:02,621][INFO ][node                     ] [Smuggler I] starting ...
[2013-10-29 05:12:02,796][INFO ][transport                ] [Smuggler I] bound_address {inet[/0:0:0:0:0:0:0:0:9300]}, publish_address {inet[/172.31.8.224:9300]}
[2013-10-29 05:12:05,886][INFO ][cluster.service          ] [Smuggler I] detected_master [Stranger][LajRpjtATZma4sBlgz96NQ][inet[/172.31.2.129:9300]], added {[Stranger][LajRpjtATZma4sBlgz96NQ][inet[/172.31.2.129:9300]],}, reason: zen-disco-receive(from master [[Stranger][LajRpjtATZma4sBlgz96NQ][inet[/172.31.2.129:9300]]])
[2013-10-29 05:12:05,918][INFO ][discovery                ] [Smuggler I] elasticsearch/S6ZtXTxAS_2c-1q9NuGOQQ
[2013-10-29 05:12:05,929][INFO ][http                     ] [Smuggler I] bound_address {inet[/0:0:0:0:0:0:0:0:9200]}, publish_address {inet[/172.31.8.224:9200]}
[2013-10-29 05:12:05,930][INFO ][node                     ] [Smuggler I] started
ノードA(Stranger)をMasterとして発見しました。

ノードAのログを見ると、ノードB(Smuggler I)がクラスタに追加されたことがわかります。
[2013-10-29 05:12:05,868][INFO ][cluster.service          ] [Stranger] added {[Smuggler I][S6ZtXTxAS_2c-1q9NuGOQQ][inet[/172.31.8.224:9300]],}, reason: zen-disco-receive(join from node[[Smuggler I][S6ZtXTxAS_2c-1q9NuGOQQ][inet[/172.31.8.224:9300]]])
では動作確認です
ノードAでXPUTしてデータを登録します。
$ curl -XPUT http://localhost:9200/cltest/test/1 -d '
>  {
>    "title" : "test",
>    "text"  : "node A"
>  }'
{"ok":true,"_index":"cltest","_type":"test","_id":"1","_version":1}
次にノードBでXGETしてデータを抽出してみます。
$ curl -XGET http://localhost:9200/cltest/test/_search -d '
>  {
>    "query":
>    { "match":{"title":"test"}}
>  }'
{"took":86,"timed_out":false,"_shards":{"total":5,"successful":5,"failed":0},"hits":{"total":1,"max_score":0.30685282,"hits":[{"_index":"cltest","_type":"test","_id":"1","_score":0.30685282, "_source" :
 {
   "title" : "test",
   "text"  : "node A"
 }}]}}
ということでちゃんと分散されました。各ノードをELB配下において、master nodeを複数のAZに分散して配置しておけば、非master nodeをScale Outさせることで可用性が確保できそうです。

感想
とにかく日本語での情報が少ない...海外のWebサイトを翻訳しつつ試したので、間違いやもっと良い方法があるのかも知れません。とにかくちゃんとクラスタとして動作したのでとりあえず満足しました。
あとこのElasticSearchが勝手に付けるノード名は一体何なんだろう。スターウォーズかなぁ。




Elasticsearch Server: Create a Fast, Scalable, and Flexible Search Solution With the Emerging Open Source Search Server, ElasticsearchElasticsearch Server: Create a Fast, Scalable, and Flexible Search Solution With the Emerging Open Source Search Server, Elasticsearch
Rafal Kuc,Marek Rogozinski

Packt Publishing
売り上げランキング : 71370

Amazonで詳しく見る by AZlink

コメント

このブログの人気の投稿

自走する組織に必要なのはルールではなくガイドライン

ということをいつも心がけている、という話です。 僕が組織のマネジメント職を20年ほどやらせてもらっている上で、いつも意識しているのは権限移譲とセルフマネジメントです。この辺の話は過去のブログにも書きました。 管理職のためのエンジニア組織構築マニュアル 管理職のための役職引退マニュアル 現場に口を出さないマネージャーの作り方 つまり「権限と裁量を同時に移譲し、責任感を持ってプロアクティブに仕事をしてもらいながらも、メンバーの良いところを更に引き出して高いパフォーマンスを出してもらう」ことこそが、マネジメント職のやるべきことだと思っています。 そのために僕がいつも権限移譲の際に伝えるのは、ルールではなくガイドラインです。ルールは規則や規定といった決まりごとなので「やること」「やってはいけないこと」が書かれたものです。ガイドラインは大まかな指針なので「方向性」「やったほうがいいこと」「やらないほうがいいこと」が書かれたものです。 ルールを提示した場合、そのとおりにすれば過去の実績からある程度の成功は見込めるものの、状況に応じた柔軟な判断が出来ませんし、メンバーの考えや意見が行動に反映されません。メンバーはルール通りの行動しか出来ず、結果としてルールを作成した人以上の成果は出せなくなってしまいます。 ガイドラインの場合、会社として望ましいと考える方向性だけが書かれているので、状況に応じた柔軟な判断も出来ますし、メンバーが考えるより良いやり方や行動を取り入れることが出来ます。ガイドラインを作成した人以上の良いアイデアがあればガイドラインをアップデートすることも出来ます。 これは権限移譲だけでなく、育成においても同様だと僕は考えます。1から10まで決まりきったカリキュラムをやらせることも時には(あるいは人によっては)必要だけれど、本当に価値のある育成は、メンバーに目指してほしい姿を伝え、現在とのギャップを一緒に認識し、そのギャップを埋めるための多種多様な方法を伝えて、その上で本人が取捨選択して自分自身で学習していく。企業や上長はそのサポートを行う。というのが、最も成長出来る育成方法だと思います。 学習する組織 ― システム思考で未来を創造する posted with AmaQuick at 2

「許可を得るな、謝罪せよ」が意図していること

 弊社ではセルフマネジメントとアウトプットファーストを行動指針として掲げていますが、セルフマネジメントを象徴する言葉としてよく使われるのが 「許可を得るな、謝罪せよ」 です。 細かい話は 以前ブログにした のでそちらを読んで頂くとして、この言葉が意味するのは「アクションするのにいちいち許可を得る必要はない。許可を取る時間が無駄。やっていいですかじゃなくてやりましたと言えばいい。その結果間違っていれば謝れば良いだけ」です。 何故この方針を取るのか、この方針によってどのような結果を期待しているのか、を改めて整理したいと思います。 アクションのスピードを上げたい これは上述した意味の通りで、何らかの施策や企画があるときに、上長の許可を取るために資料を作ったり、打ち合わせしたり、下調べをしたり、という時間が無駄だからです。 この考え方の前提として「小さな失敗を早くたくさんする」というのがあります。どんな施策も企画も、正解なんて誰にもわからないし、やり方次第で変わるものです。アイデアの時点であーだこーだ言うより、実際に手を動かしてやってみて、その結果から継続の判断を行うことで、リスクを小さく、コストも小さく、たくさんアクションすることが出来ます。 モチベーションを持って取り組んでもらいたい 何でもそうですけど、人に言われたことをそのままやるより、自分で考えたことを自分のやり方でやるほうが、面白いです。僕が仕事をする上で、または僕がピープルマネジメントする上で、一番重要視しているのは、面白いかどうか、です。 担当者がモチベーションのないままやって成功することなんて(ほとんど)ありません。その施策や企画の実施に一番モチベーションがあるのはそれを考えた人なので、その人に主導してもらうのが一番成功率が高いです。 主体性を持って取り組んでもらいたい モチベーションと同様に、担当者が主体性のないままやって成功することなんて(ほとんど)ありません。その施策/企画を自分ごととして捉え、だからこそ知恵を絞って、全力を発揮する、つまり主体性を持って取り組むことが、一番成功率が高いです。そしてもちろん、一番主体性を持てるのはそれを考えた人です。 なお、主体性と責任は違います。前述の通り「小さな失敗を早くたくさんする」ためには、失敗に対して責任を追求するのではなく、結果と知見を追求する、という文化が

組織を構成するビルダー、フォロワー、ワーカーについて

僕の経験上、新しい事業体を立ち上げたときの組織構成は大きく3つに分かれる。というか3つのタイプを必要とする。なお、ここではそもそもパフォーマンスが出ない人を含めていない。 その事業を成功させることに高いモチベーションがあり、その結果の責任も積極的に取るタイプ。会社の創業者とか新部門の責任者とか、立ち上げメンバーがコレに当たる。 もともとはその事業に対して特にモチベーションが無いんだけど、事業を担当することによって深くコミットし、結果としてモチベーションが高くなるタイプ。 事業に対するモチベーションが無いからコミットもしないんだけど、担当する業務はしっかりとこなすタイプ。 1をビルダー、2をフォロワー、3をワーカーとこの記事では呼称する。 事業が立ち上がったばかりの組織構成として、ビルダーは当然少ない。可能な限りフォロワーを増やすことを僕はお薦めする。事業のスタート時期というのは不足していたりそもそも無かったりすることがたくさんあり、それらをプロアクティブに拾い続けて解決するためにはモチベーションが必要だからだ。この時期の組織では、業務に対して合うスキルセットの人を採用する(=ワーカー)より、企業理念や事業ビジョンにコミットしてくれる人(フォロワー)を採用したほうがスピードが上がる。ワーカーがあまりに多いと作業指示が無いゆえの作業待ちが発生し、スピードが上がらない。比率的には1:6:3くらい。 事業がある程度立ち上がって順調に拡大するフェーズになると、今度はフォロワーをどうやってビルダーに成長させるか、ワーカーをどうやってフォロワーに成長させるか、が課題になる。このくらいのフェーズではマネジメント教育とかコーチング研修なんかが必要になる。企業理念や事業ビジョンを更に明確にし、言い続け、常に意識させる作業が必要になる。 そして、ある程度事業の形が出来てくると、ふわふわした仕事が少なくなるので、ワーカーを業務に対してアサインしやすくなる。こうなると2:4:4くらいの比率でも上手くいく。それでもワーカーを過半数以上にするのは僕はおすすめしない。事業にコミットしない人が増えると組織全体が「コミットしないのが当たり前」「コミットしない人が評価されて不公平」みたいな空気感が生まれちゃうことが多い。なので過半数以上は事業にコミットする人で固めたほうが良い。 つまり、組織の責任者は「