スキップしてメイン コンテンツに移動

ElasticSearchのCluster機能を試す

ElasticSearchとは、の修正
昨日僕はElasticSearchを「検索エンジン」と書きましたが、正確に言うと「全文検索エンジンであるLuceneを使用した、全文検索システム」です。

Luceneとは
Apache Software Foundationで開発されている全文検索エンジンで、Javaのクロスライブラリとして提供されています。

Solrとは
Apache Software Foundationで、Luceneのサブプロジェクトとして開発されている、全文検索システムです。Luceneを検索エンジンとして使用しており、もちろんJavaで書かれています。

ElasticSearchとSolrの比較
ものすごくざっくり言っちゃうと、ElasticSearchはRESTfulで全てがJSONです、ということ...なのかな
ElasticSearchにあるclustering機能はSolr4で採用されたSolrCloud機能でカバーされたようだし、細かいことは色々あるんだろうけど、簡易的な使い方に絞って言えばRESTfulなのはとても便利だと思います。

本題
今回はElasticSearchのCluster機能を試してみたいと思います。



Cluster設定
/etc/elasticsearch/elasticsearch.ymlで細かい設定が出来ますが、このファイルの冒頭には以下のように記載されています。
Most of the time, these defaults are just fine for running a production cluster.
ということで細かい設定せずにこのままいっちゃいます。

まず、ElasticSearchをセットアップした2台のEC2を用意し、セキュリティグループで9200/tcp、9300/tcpのInboundをオープンします。

初期状態のノードAのクラスタの状態は以下の通りです。
$ curl localhost:9200/_cluster/nodes/_local
{"ok":true,"cluster_name":"elasticsearch","nodes":{"-saA5swFSpWxPlnGV9kGcQ":{"name":"Shocker","transport_address":"inet[/172.31.2.129:9300]","hostname":"ip-172-31-2-129","version":"0.90.5","http_address":"inet[/172.31.2.129:9200]"}}}
$ sudo cat /var/log/elasticsearch.log
[2013-10-29 00:53:20,943][INFO ][node                     ] [Shocker] version[0.90.5], pid[4321], build[c8714e8/2013-09-17T13:09:46Z]
[2013-10-29 00:53:20,944][INFO ][node                     ] [Shocker] initializing ...
[2013-10-29 00:53:20,952][INFO ][plugins                  ] [Shocker] loaded [], sites []
[2013-10-29 00:53:24,308][INFO ][node                     ] [Shocker] initialized
[2013-10-29 00:53:24,309][INFO ][node                     ] [Shocker] starting ...
[2013-10-29 00:53:24,520][INFO ][transport                ] [Shocker] bound_address {inet[/0:0:0:0:0:0:0:0:9300]}, publish_address {inet[/172.31.2.129:9300]}
[2013-10-29 00:53:27,564][INFO ][cluster.service          ] [Shocker] new_master [Shocker][-saA5swFSpWxPlnGV9kGcQ][inet[/172.31.2.129:9300]], reason: zen-disco-join (elected_as_master)
[2013-10-29 00:53:27,614][INFO ][discovery                ] [Shocker] elasticsearch/-saA5swFSpWxPlnGV9kGcQ
[2013-10-29 00:53:27,642][INFO ][http                     ] [Shocker] bound_address {inet[/0:0:0:0:0:0:0:0:9200]}, publish_address {inet[/172.31.2.129:9200]}
[2013-10-29 00:53:27,642][INFO ][node                     ] [Shocker] started
[2013-10-29 00:53:27,668][INFO ][gateway                  ] [Shocker] recovered [0] indices into cluster_state
同じく初期状態のノードBのクラスタの状態は以下の通りです。
$ curl localhost:9200/_cluster/nodes/_local
{"ok":true,"cluster_name":"elasticsearch","nodes":{"sHxbUNgxRieV2z9Pyt9ZVA":{"name":"Mister Machine","transport_address":"inet[/172.31.8.224:9300]","hostname":"ip-172-31-8-224","version":"0.90.5","http_address":"inet[/172.31.8.224:9200]"}}}
$ sudo cat /var/log/elasticsearch.log
[2013-10-29 02:20:24,468][INFO ][node                     ] [Mister Machine] version[0.90.5], pid[1346], build[c8714e8/2013-09-17T13:09:46Z]
[2013-10-29 02:20:24,469][INFO ][node                     ] [Mister Machine] initializing ...
[2013-10-29 02:20:24,476][INFO ][plugins                  ] [Mister Machine] loaded [], sites []
[2013-10-29 02:20:28,881][INFO ][node                     ] [Mister Machine] initialized
[2013-10-29 02:20:28,882][INFO ][node                     ] [Mister Machine] starting ...
[2013-10-29 02:20:29,161][INFO ][transport                ] [Mister Machine] bound_address {inet[/0:0:0:0:0:0:0:0:9300]}, publish_address {inet[/172.31.8.224:9300]}
[2013-10-29 02:20:32,240][INFO ][cluster.service          ] [Mister Machine] new_master [Mister Machine][sHxbUNgxRieV2z9Pyt9ZVA][inet[/172.31.8.224:9300]], reason: zen-disco-join (elected_as_master)
[2013-10-29 02:20:32,292][INFO ][discovery                ] [Mister Machine] elasticsearch/sHxbUNgxRieV2z9Pyt9ZVA
[2013-10-29 02:20:32,321][INFO ][http                     ] [Mister Machine] bound_address {inet[/0:0:0:0:0:0:0:0:9200]}, publish_address {inet[/172.31.8.224:9200]}
[2013-10-29 02:20:32,322][INFO ][node                     ] [Mister Machine] started
[2013-10-29 02:20:32,356][INFO ][gateway                  ] [Mister Machine] recovered [0] indices into cluster_state

同一サブネットで、同一クラスタ名("elasticsearch")なのに、それぞれが別のクラスタのマスタになっています。何故でしょう?

そこでdiscoveryの挙動について調べてみます。elasticsearch.ymlに以下の記載がありました。
# Discovery infrastructure ensures nodes can be found within a cluster
# and master node is elected. Multicast discovery is the default.
Discoveryはデフォルトではマルチキャストを使ってmaster nodeを検索しに行くようです。

しかしAmazon Virtual Private Cloud FAQ
Q: Amazon VPC は、マルチキャストまたはブロードキャストをサポートしますか?
いいえ。
と記載されています...Amazon VPCではmulticast discoveryは使えません。AWS Cloud Plugin for ElasticSearchにも辿り着いたのですが、やはりVPCではうまく動作しませんでした。

それではunicast discoveryを使った構成で構築してみます
ノードA、ノードB共に、elasticsearch.yamlを修正し、multicast discoveryを無効化し、unicast対象のmaster nodeとなるホストを記載します。ここではノードAとノードBのIPアドレスを記載しました。
$ sudo vi /etc/elasticsearch/elasticsearch.yml
discovery.zen.ping.multicast.enabled: false
discovery.zen.ping.unicast.hosts: ["172.31.2.129","172.31.8.224"]
ではノードAでサービスを起動してみます。なお[***.log]の***の部分はcluster nameになります。
$ sudo service elasticsearch start
$ cat /var/log/elasticsearch/elasticsearch.log
[2013-10-29 05:11:24,797][INFO ][node                     ] [Stranger] version[0.90.5], pid[21630], build[c8714e8/2013-09-17T13:09:46Z]
[2013-10-29 05:11:24,797][INFO ][node                     ] [Stranger] initializing ...
[2013-10-29 05:11:24,815][INFO ][plugins                  ] [Stranger] loaded [cloud-aws], sites []
[2013-10-29 05:11:28,382][INFO ][node                     ] [Stranger] initialized
[2013-10-29 05:11:28,382][INFO ][node                     ] [Stranger] starting ...
[2013-10-29 05:11:28,566][INFO ][transport                ] [Stranger] bound_address {inet[/0:0:0:0:0:0:0:0:9300]}, publish_address {inet[/172.31.2.129:9300]}
[2013-10-29 05:11:31,615][INFO ][cluster.service          ] [Stranger] new_master [Stranger][LajRpjtATZma4sBlgz96NQ][inet[/172.31.2.129:9300]], reason: zen-disco-join (elected_as_master)
[2013-10-29 05:11:31,631][INFO ][discovery                ] [Stranger] elasticsearch/LajRpjtATZma4sBlgz96NQ
[2013-10-29 05:11:31,661][INFO ][http                     ] [Stranger] bound_address {inet[/0:0:0:0:0:0:0:0:9200]}, publish_address {inet[/172.31.2.129:9200]}
[2013-10-29 05:11:31,661][INFO ][node                     ] [Stranger] started
[2013-10-29 05:11:32,643][INFO ][gateway                  ] [Stranger] recovered [1] indices into cluster_state
ノードAがmasterとして起動しました。

次にノードBのサービスを再起動します。
$ sudo service elasticsearch start
$ cat /var/log/elasticsearch/elasticsearch.log
[2013-10-29 05:11:59,093][INFO ][node                     ] [Smuggler I] version[0.90.5], pid[18229], build[c8714e8/2013-09-17T13:09:46Z]
[2013-10-29 05:11:59,094][INFO ][node                     ] [Smuggler I] initializing ...
[2013-10-29 05:11:59,111][INFO ][plugins                  ] [Smuggler I] loaded [cloud-aws], sites []
[2013-10-29 05:12:02,621][INFO ][node                     ] [Smuggler I] initialized
[2013-10-29 05:12:02,621][INFO ][node                     ] [Smuggler I] starting ...
[2013-10-29 05:12:02,796][INFO ][transport                ] [Smuggler I] bound_address {inet[/0:0:0:0:0:0:0:0:9300]}, publish_address {inet[/172.31.8.224:9300]}
[2013-10-29 05:12:05,886][INFO ][cluster.service          ] [Smuggler I] detected_master [Stranger][LajRpjtATZma4sBlgz96NQ][inet[/172.31.2.129:9300]], added {[Stranger][LajRpjtATZma4sBlgz96NQ][inet[/172.31.2.129:9300]],}, reason: zen-disco-receive(from master [[Stranger][LajRpjtATZma4sBlgz96NQ][inet[/172.31.2.129:9300]]])
[2013-10-29 05:12:05,918][INFO ][discovery                ] [Smuggler I] elasticsearch/S6ZtXTxAS_2c-1q9NuGOQQ
[2013-10-29 05:12:05,929][INFO ][http                     ] [Smuggler I] bound_address {inet[/0:0:0:0:0:0:0:0:9200]}, publish_address {inet[/172.31.8.224:9200]}
[2013-10-29 05:12:05,930][INFO ][node                     ] [Smuggler I] started
ノードA(Stranger)をMasterとして発見しました。

ノードAのログを見ると、ノードB(Smuggler I)がクラスタに追加されたことがわかります。
[2013-10-29 05:12:05,868][INFO ][cluster.service          ] [Stranger] added {[Smuggler I][S6ZtXTxAS_2c-1q9NuGOQQ][inet[/172.31.8.224:9300]],}, reason: zen-disco-receive(join from node[[Smuggler I][S6ZtXTxAS_2c-1q9NuGOQQ][inet[/172.31.8.224:9300]]])
では動作確認です
ノードAでXPUTしてデータを登録します。
$ curl -XPUT http://localhost:9200/cltest/test/1 -d '
>  {
>    "title" : "test",
>    "text"  : "node A"
>  }'
{"ok":true,"_index":"cltest","_type":"test","_id":"1","_version":1}
次にノードBでXGETしてデータを抽出してみます。
$ curl -XGET http://localhost:9200/cltest/test/_search -d '
>  {
>    "query":
>    { "match":{"title":"test"}}
>  }'
{"took":86,"timed_out":false,"_shards":{"total":5,"successful":5,"failed":0},"hits":{"total":1,"max_score":0.30685282,"hits":[{"_index":"cltest","_type":"test","_id":"1","_score":0.30685282, "_source" :
 {
   "title" : "test",
   "text"  : "node A"
 }}]}}
ということでちゃんと分散されました。各ノードをELB配下において、master nodeを複数のAZに分散して配置しておけば、非master nodeをScale Outさせることで可用性が確保できそうです。

感想
とにかく日本語での情報が少ない...海外のWebサイトを翻訳しつつ試したので、間違いやもっと良い方法があるのかも知れません。とにかくちゃんとクラスタとして動作したのでとりあえず満足しました。
あとこのElasticSearchが勝手に付けるノード名は一体何なんだろう。スターウォーズかなぁ。




Elasticsearch Server: Create a Fast, Scalable, and Flexible Search Solution With the Emerging Open Source Search Server, ElasticsearchElasticsearch Server: Create a Fast, Scalable, and Flexible Search Solution With the Emerging Open Source Search Server, Elasticsearch
Rafal Kuc,Marek Rogozinski

Packt Publishing
売り上げランキング : 71370

Amazonで詳しく見る by AZlink

このブログの人気の投稿

初めての給与交渉で意識するべき6つのポイント

本記事は、社会人となって1〜3年目くらいの方が、給与アップのためにどのように考え、どのようにアクションするべきなのかを、僕の経験を踏まえてまとめたものです。 背景として、僕が初めて働いたIT企業は、年棒制で給与交渉は各自が行うものであり、年次で成果レポートと希望する年収額を会社に提示し、それが査定されて翌年の年俸が確定する、という制度でした。なので僕自身は若い頃からずっと給与交渉をし続けています。 大前提:給与とは与えられるものではなく勝ち取るものである 給与は勝手に上がるものではありません。自分の努力や成果を誰か(=会社や上長)が適切に判断し公平に給与を払ってくれる、なんてことはありません。何故なら多くの仕事は定量的なだけでは評価できず、そこに定性的な判断を必要とするからです。そして人間に公平で完璧な意思決定を求めるのはそもそも無理です。人間は感情的で、多くのバイアスを持ち、その時々のコンディションで常に意思決定が歪みます。だからこそ、定性的な評価に関する成果は、被評価者自身が自らアピールしないと評価者に正しく伝わりません(ただしアピールしたところで正しく伝わらないこともあります) もちろん定量的なだけで評価できる仕事は世の中にはあるし、その場合は給与はその成果に比例して決まり、人間の判断は必要としません。でもそうではない、定性的な評価が含まれる仕事をしているのであれば、自ら自分が何をし、どのような成果を出したのかを、きちんと会社に伝え、その分の給与を要求する、というアクションが必要になります。 大前提:給与は会社が儲かっていないと上がらない これもまぁ当たり前ですよね。会社は利益が出てるから社員に投資できる=社員の給与を上げられるわけで、利益が出てなかったらその個人がどんなに頑張ったところで給与は上がりません。何故なら給与を上げるための原資が無いからです。 だから、利益が無い会社に所属しているのであれば、給与交渉はそもそも無駄です。だって交渉しても上がるわけないし。その場合は、給与アップが必須なのであれば転職を検討するしかないし、給与アップしなくてもメリットがあるのであればその会社に在籍し続ける、という選択が必要になります。 目標と現状のギャップを把握する 具体的な希望も無く「給与上げてください」と言うのは給与交渉ではありません。これだと会社もどのくらい上げてほ

40代の減量戦略 〜体重-14kg、体脂肪率-12%を実現した具体的な方法〜

コロナ禍はもちろん辛い時期ではあったけど、生活習慣が良い方へ大きく変わた時期でもあった。具体的には食生活がほぼ自炊になり、酒量が減り、ジム通いを再開し、マラソン大会にも定期的に参加した。そんな中で一念発起し、きちんと減量に取り組んで、体重75kg→61kg(-14kg)、体脂肪率25%→13%(-12%)を実現した。 具体的な体重遷移は以下。2020年12月がMAXの75kg、その後減量とリバウンドを繰り返しつつ70kg前後を推移、2022年後半で一気に落とし、2023年1月30日時点で61kgとなった。 そこで、その具体的な方法をお伝えしたい。減量とは3つの要素の組み合わせだ。 食事 運動 休養 この順番はそのまま優先順位でもある。それぞれについて以下に説明する。 0.プロにアドバイスをもらう 3つの要素と言ったがあれは嘘だ。すまない。もっと重要なことがある。それはプロにアドバイスをもらうことだ。 WHO NOT HOWという本がある。 WHO NOT HOW 「どうやるか」ではなく「誰とやるか」  posted with AmaQuick at 2023.01.21 ディスカヴァー・トゥエンティワン (2022-05-27T00:00:01Z) ダン・サリヴァン(著), ベンジャミン・ハーディ(著), 森由 美子(翻訳) Amazon.co.jpで詳細を見る 要約すると、起業家や経営者がやるべきことはビジネスを成功させることだけれど、人は皆スーパーマンではなく、得意なことと不得意なことがあるんだから、得意なことは得意な人に一任することが大事なんだよ、という内容の本。 これは減量についても同じ。本を読んだりYoutubeで動画を見て、実際に減量出来たのであればそれはそれで構わないし、そういう人はこのブログ投稿を読まないだろう。 自分で学んで、自分でチャレンジして、それでも減量出来ないのであれば、素直に投資してプロのアドバイスをもらったほうが効率が良い。具体的にはパーソナルトレーナーだ。パーソナルトレーナーは運動生理学やスポーツ栄養学などについて学び実践してきた人

最近、僕と妻の仲が良い

SNSでは書きましたが、先日長女が大学を卒業し、同時に結婚しました。僕には3人の子供がいるのですが、これで1人は結婚して家を出て、もう1人は就職して家を出て、残りは高校1年生(4月から2年生)の次男のみとなりました。 で。子どもたちが自立していく状況になってから、僕と妻の関係性が良くなりました。元々良かったんですけど、なんというか、更に仲良くなってきたんですよね。 これってなんでだろう...って考えてたんですが夫婦の状況の変化によるものなんだろうと思います。 結婚した当初は恋愛感情が関係性の大きな理由になります(これは恋愛結婚の場合なので、お見合いや相談所経由での結婚の場合は違うのかも知れません) 子供が出来て子育てが始まると、子供を含めた家族をいかに良い形で運営するか、そして外圧から以下に守るか、が関係のベースになります。 そして子供が自立していくと、そこにはまた夫婦二人が残ります。そうすると、これから一緒に老いて、そして死んでいこう、という覚悟が定まるんですよね。 僕も若い頃は老いってあんまり分からなかったんですが、いざ自分が中年になると、いろんな老いを感じます。肉体的には白髪や顔の皺や老眼といったものから、体力の減少、筋肉の付きづらさ、脂肪の落ちづらさ、などなど。精神的には感情の揺れ幅が少なくなって、怒ったり悲しんだりといった発露をしなくなったり。 当然その先には死があるわけです。今この老いかけの時期から死まで長ければ50年くらいあるんですが、子どもたちが自立しつつある今となっては、そこを一緒に過ごすのは僕にとっては妻しかいないし、妻にとっても僕しかいない。それが「これから一緒に老いて、そして死んでいこう、という覚悟」となり、そしてお互いに関係性を良くしよう、よく保とう、というモチベーションになるんだな、と思っています。 そんなわけで、最近僕と妻は仲が良いです。というノロケでした!!以上!!! 妻は俺の嫁 posted with AmaQuick at 2023.03.25 smokeymonkey (2013-10-15T15:00:06.000Z) smokeymonkey(著) Amazon.c