MeCab に正式対応した日本語全文検索システム Namazu 2.0.15 リリース

  http://www.namazu.org/pipermail/namazu-devel-ja/2006-January/000943.html

  MeCab が正式対応になった Namazu がリリース.

--use-mecab

  オプションで分かち書きに MeCab を使うことが出来る.
  早速,PHP のマニュアルが更新されていたのでベンチマークもかねてインデックスを更新してみた.

- --use-mecab オプションなし

$ mknmz --media-type=text/html ...
検索対象のファイルを調べています...
5646個のファイルがインデックス作成の対象として見つかりました
 :
インデックスを書き出しています...
[基本]
日付:                Fri Feb 10 00:18:58 2006
追加された文書の数:  5,646
サイズ (bytes):      30,073,188
合計の文書数:        5,646
追加キーワード数:    119,771
合計キーワード数:    119,771
わかち書き:          /usr/local/bin/kakasi -ieuc -oeuc -w
経過時間 (秒):       7,819
ファイル/秒:         0.72
システム:            solaris
Perl:                5.008004

Namazu:              2.0.15

- --use-mecab オプションあり

$ mknmz --use-mecab --media-type=text/html ...
検索対象のファイルを調べています...
5646個のファイルがインデックス作成の対象として見つかりました
 :
インデックスを書き出しています...
[基本]
日付:                Fri Feb 10 14:57:16 2006
追加された文書の数:  5,646
サイズ (bytes):      30,073,188
合計の文書数:        5,646
追加キーワード数:    111,902
合計キーワード数:    111,902
わかち書き:          /usr/local/bin/mecab -Owakati -b 8192
経過時間 (秒):       9,504
ファイル/秒:         0.59
システム:            solaris
Perl:                5.008004

Namazu:              2.0.15

  ・・あれ?こんなに遅いの?なんか間違ったかな?