スキップしてメイン コンテンツに移動

mecab-rubyを使ってみる

(1)MeCab本体のインストール。今回は既にインストール済みでした。

$ sudo aptitude install mecab mecab-ipadic mecab-jumandic mecab-utils

(2)mecab-rubyをコンパイルするのにg++が必要なのでインストール。

$ sudo aptitude install g++

(3)mecabのVersion確認。

$ mecab -v
mecab of 0.93

(2)SourceForgeからmecab-ruby-0.93.tar.gzをダウンロードして展開。

$ sudo tar xvzf mecab-ruby-0.93.tar.gz
$ cd ./mecab-ruby-0.93

インストール。

$ ruby extconf.rb
checking for main() in -lmecab... yes
checking for main() in -lstdc++... yes
checking for mecab.h... yes
creating Makefile
$ make
g++ -I. -I. -I/usr/lib/ruby/1.8/i486-linux -I. -DHAVE_MECAB_H -fPIC -Wall -g -fno-strict-aliasing -O2 -fPIC -c MeCab_wrap.cpp
gcc -shared -rdynamic -Wl,-export-dynamic -L"/usr/lib" -o MeCab.so MeCab_wrap.o -lruby1.8 -lstdc++ -lmecab -lpthread -ldl -lcrypt -lm -lc
$ sudo make install
/usr/bin/install -c -m 0755 MeCab.so /usr/local/lib/site_ruby/1.8/i486-linux

(4)テストスクリプトを実行してみる。
中身を見ようとcatしたら文字化けしたので文字コードを確認。

$ nkf -g test.rb
EUC-JP

EUCかぁ。Etch上で動かすのでUTF-8に変換する。

$ nkf -w8 test.rb > test2.rb
$ cat test2.rb

#!/usr/bin/ruby

require 'MeCab'
sentence = "太郎はこの本を二郎を見た女性に渡した。"

begin

print MeCab::VERSION, "\n"
c = MeCab::Tagger.new(ARGV.join(" "))

puts c.parse(sentence)

n = c.parseToNode(sentence)

while n do
print n.surface, "\t", n.feature, "\t", n.cost, "\n"
n = n.next
end
print "EOS\n";

rescue
print "RuntimeError: ", $!, "\n";
end


(5)実行してみる。

$ ruby ./test2.rb
0.93
太郎 名詞,固有名詞,人名,名,*,*,太郎,タロウ,タロー
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
この 連体詞,*,*,*,*,*,この,コノ,コノ
本 名詞,一般,*,*,*,*,本,ホン,ホン
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
二郎 名詞,固有名詞,一般,*,*,*,二郎,ニロウ,ニロー
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
見 動詞,自立,*,*,一段,連用形,見る,ミ,ミ
た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
女性 名詞,一般,*,*,*,*,女性,ジョセイ,ジョセイ
に 助詞,格助詞,一般,*,*,*,に,ニ,ニ
渡し 動詞,自立,*,*,五段・サ行,連用形,渡す,ワタシ,ワタシ
た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
。 記号,句点,*,*,*,*,。,。,。
EOS
BOS/EOS,*,*,*,*,*,*,*,* 0
太郎 名詞,固有名詞,人名,名,*,*,太郎,タロウ,タロー 8308
は 助詞,係助詞,*,*,*,*,は,ハ,ワ 9237
この 連体詞,*,*,*,*,*,この,コノ,コノ 9346
本 名詞,一般,*,*,*,*,本,ホン,ホン 13811
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ 13094
二郎 名詞,固有名詞,一般,*,*,*,二郎,ニロウ,ニロー 18835
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ 19322
見 動詞,自立,*,*,一段,連用形,見る,ミ,ミ 23338
た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ 20625
女性 名詞,一般,*,*,*,*,女性,ジョセイ,ジョセイ 23008
に 助詞,格助詞,一般,*,*,*,に,ニ,ニ 22871
渡し 動詞,自立,*,*,五段・サ行,連用形,渡す,ワタシ,ワタシ 25639
た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ 25006
。 記号,句点,*,*,*,*,。,。,。 21081
BOS/EOS,*,*,*,*,*,*,*,* 19505
EOS


今回、Bloggerにソースを貼り付けるにあたって以下を参考にしました。Thanks!
すぐに忘れる脳みそのためのメモ: Blogger でソースコードに色付けをする - google-code-prettify

このブログの人気の投稿

初めての給与交渉で意識するべき6つのポイント

本記事は、社会人となって1〜3年目くらいの方が、給与アップのためにどのように考え、どのようにアクションするべきなのかを、僕の経験を踏まえてまとめたものです。 背景として、僕が初めて働いたIT企業は、年棒制で給与交渉は各自が行うものであり、年次で成果レポートと希望する年収額を会社に提示し、それが査定されて翌年の年俸が確定する、という制度でした。なので僕自身は若い頃からずっと給与交渉をし続けています。 大前提:給与とは与えられるものではなく勝ち取るものである 給与は勝手に上がるものではありません。自分の努力や成果を誰か(=会社や上長)が適切に判断し公平に給与を払ってくれる、なんてことはありません。何故なら多くの仕事は定量的なだけでは評価できず、そこに定性的な判断を必要とするからです。そして人間に公平で完璧な意思決定を求めるのはそもそも無理です。人間は感情的で、多くのバイアスを持ち、その時々のコンディションで常に意思決定が歪みます。だからこそ、定性的な評価に関する成果は、被評価者自身が自らアピールしないと評価者に正しく伝わりません(ただしアピールしたところで正しく伝わらないこともあります) もちろん定量的なだけで評価できる仕事は世の中にはあるし、その場合は給与はその成果に比例して決まり、人間の判断は必要としません。でもそうではない、定性的な評価が含まれる仕事をしているのであれば、自ら自分が何をし、どのような成果を出したのかを、きちんと会社に伝え、その分の給与を要求する、というアクションが必要になります。 大前提:給与は会社が儲かっていないと上がらない これもまぁ当たり前ですよね。会社は利益が出てるから社員に投資できる=社員の給与を上げられるわけで、利益が出てなかったらその個人がどんなに頑張ったところで給与は上がりません。何故なら給与を上げるための原資が無いからです。 だから、利益が無い会社に所属しているのであれば、給与交渉はそもそも無駄です。だって交渉しても上がるわけないし。その場合は、給与アップが必須なのであれば転職を検討するしかないし、給与アップしなくてもメリットがあるのであればその会社に在籍し続ける、という選択が必要になります。 目標と現状のギャップを把握する 具体的な希望も無く「給与上げてください」と言うのは給与交渉ではありません。これだと会社もどのくらい上げてほ

40代の減量戦略 〜体重-14kg、体脂肪率-12%を実現した具体的な方法〜

コロナ禍はもちろん辛い時期ではあったけど、生活習慣が良い方へ大きく変わた時期でもあった。具体的には食生活がほぼ自炊になり、酒量が減り、ジム通いを再開し、マラソン大会にも定期的に参加した。そんな中で一念発起し、きちんと減量に取り組んで、体重75kg→61kg(-14kg)、体脂肪率25%→13%(-12%)を実現した。 具体的な体重遷移は以下。2020年12月がMAXの75kg、その後減量とリバウンドを繰り返しつつ70kg前後を推移、2022年後半で一気に落とし、2023年1月30日時点で61kgとなった。 そこで、その具体的な方法をお伝えしたい。減量とは3つの要素の組み合わせだ。 食事 運動 休養 この順番はそのまま優先順位でもある。それぞれについて以下に説明する。 0.プロにアドバイスをもらう 3つの要素と言ったがあれは嘘だ。すまない。もっと重要なことがある。それはプロにアドバイスをもらうことだ。 WHO NOT HOWという本がある。 WHO NOT HOW 「どうやるか」ではなく「誰とやるか」  posted with AmaQuick at 2023.01.21 ディスカヴァー・トゥエンティワン (2022-05-27T00:00:01Z) ダン・サリヴァン(著), ベンジャミン・ハーディ(著), 森由 美子(翻訳) Amazon.co.jpで詳細を見る 要約すると、起業家や経営者がやるべきことはビジネスを成功させることだけれど、人は皆スーパーマンではなく、得意なことと不得意なことがあるんだから、得意なことは得意な人に一任することが大事なんだよ、という内容の本。 これは減量についても同じ。本を読んだりYoutubeで動画を見て、実際に減量出来たのであればそれはそれで構わないし、そういう人はこのブログ投稿を読まないだろう。 自分で学んで、自分でチャレンジして、それでも減量出来ないのであれば、素直に投資してプロのアドバイスをもらったほうが効率が良い。具体的にはパーソナルトレーナーだ。パーソナルトレーナーは運動生理学やスポーツ栄養学などについて学び実践してきた人

最近、僕と妻の仲が良い

SNSでは書きましたが、先日長女が大学を卒業し、同時に結婚しました。僕には3人の子供がいるのですが、これで1人は結婚して家を出て、もう1人は就職して家を出て、残りは高校1年生(4月から2年生)の次男のみとなりました。 で。子どもたちが自立していく状況になってから、僕と妻の関係性が良くなりました。元々良かったんですけど、なんというか、更に仲良くなってきたんですよね。 これってなんでだろう...って考えてたんですが夫婦の状況の変化によるものなんだろうと思います。 結婚した当初は恋愛感情が関係性の大きな理由になります(これは恋愛結婚の場合なので、お見合いや相談所経由での結婚の場合は違うのかも知れません) 子供が出来て子育てが始まると、子供を含めた家族をいかに良い形で運営するか、そして外圧から以下に守るか、が関係のベースになります。 そして子供が自立していくと、そこにはまた夫婦二人が残ります。そうすると、これから一緒に老いて、そして死んでいこう、という覚悟が定まるんですよね。 僕も若い頃は老いってあんまり分からなかったんですが、いざ自分が中年になると、いろんな老いを感じます。肉体的には白髪や顔の皺や老眼といったものから、体力の減少、筋肉の付きづらさ、脂肪の落ちづらさ、などなど。精神的には感情の揺れ幅が少なくなって、怒ったり悲しんだりといった発露をしなくなったり。 当然その先には死があるわけです。今この老いかけの時期から死まで長ければ50年くらいあるんですが、子どもたちが自立しつつある今となっては、そこを一緒に過ごすのは僕にとっては妻しかいないし、妻にとっても僕しかいない。それが「これから一緒に老いて、そして死んでいこう、という覚悟」となり、そしてお互いに関係性を良くしよう、よく保とう、というモチベーションになるんだな、と思っています。 そんなわけで、最近僕と妻は仲が良いです。というノロケでした!!以上!!! 妻は俺の嫁 posted with AmaQuick at 2023.03.25 smokeymonkey (2013-10-15T15:00:06.000Z) smokeymonkey(著) Amazon.c