MeCab に正式対応した日本語全文検索システム Namazu 2.0.15 リリース
2006-01-31-2
http://www.namazu.org/pipermail/namazu-devel-ja/2006-January/000943.html
MeCab が正式対応になった Namazu がリリース.
--use-mecab
オプションで分かち書きに MeCab を使うことが出来る.
早速,PHP のマニュアルが更新されていたのでベンチマークもかねてインデックスを更新してみた.
- --use-mecab オプションなし
$ mknmz --media-type=text/html ...
検索対象のファイルを調べています...
5646個のファイルがインデックス作成の対象として見つかりました
:
インデックスを書き出しています...
[基本]
日付: Fri Feb 10 00:18:58 2006
追加された文書の数: 5,646
サイズ (bytes): 30,073,188
合計の文書数: 5,646
追加キーワード数: 119,771
合計キーワード数: 119,771
わかち書き: /usr/local/bin/kakasi -ieuc -oeuc -w
経過時間 (秒): 7,819
ファイル/秒: 0.72
システム: solaris
Perl: 5.008004
Namazu: 2.0.15
- --use-mecab オプションあり
$ mknmz --use-mecab --media-type=text/html ...
検索対象のファイルを調べています...
5646個のファイルがインデックス作成の対象として見つかりました
:
インデックスを書き出しています...
[基本]
日付: Fri Feb 10 14:57:16 2006
追加された文書の数: 5,646
サイズ (bytes): 30,073,188
合計の文書数: 5,646
追加キーワード数: 111,902
合計キーワード数: 111,902
わかち書き: /usr/local/bin/mecab -Owakati -b 8192
経過時間 (秒): 9,504
ファイル/秒: 0.59
システム: solaris
Perl: 5.008004
Namazu: 2.0.15
・・あれ?こんなに遅いの?なんか間違ったかな?