機械学習関連の記事を読みあさっていたところ、オライリーから word2vecによる自然言語処理 という書籍が出ていることを知った。ちょっと面白そうだなーと思って、とりあえず word2vec を触ってみることにした。環境はMBA(OS X Yosemite)。 まずは公式サイトからsvn checkoutしてくる。 $ svn checkout http://word2vec.googlecode.com/svn/trunk/ $ cd ./trunk/ $ ls LICENSE demo-word.sh README.txt distance.c compute-accuracy.c makefile demo-analogy.sh questions-phrases.txt demo-classes.sh questions-words.txt demo-phrase-accuracy.sh word-analogy.c demo-phrases.sh word2phrase.c demo-train-big-model-v1.sh word2vec.c demo-word-accuracy.sh で、make。 $ make gcc word2vec.c -o word2vec -lm -pthread -O3 -march=native -Wall -funroll-loops -Wno-unused-result gcc word2phrase.c -o word2phrase -lm -pthread -O3 -march=native -Wall -funroll-loops -Wno-unused-result gcc distance.c -o distance -lm -pthread -O3 -march=native -Wall -funroll-loops -Wno-unused-result distance.c:18:10: fatal error: 'malloc.h' file not found #include