grepの日本語版 AND、OR検索が可能
GNU grepに挑戦してみました。多くの単純検索で勝っています。
また、技術的には旧手法ではありますが−f 検索も、同等のものが出来たと考えています。 unixでは、AND検索は'|'で繋いで、順に絞り込むのが常識ですが、汎用検索のためには同時に絞る必要があると考えました。'−a'オプションは本家に無い新設です。
'−av'の結果では悩んでしまいましたが...'−i'オプション時、漢字環境では漢字英数字も検索の対象としました。SJIS環境1バイトの検索では、漢字第2バイトも抽出されてしまいます。本家はBUGとは考えていないでしょうが、日本語grepを言う以上、除外するのが当然でしょう。日本郵政公社の郵便番号簿CSVファイルをダウンロードしてjgrepにて検索して見ました。全国版で12万件の検索が標準で0.24秒、grep 2.5.1では12秒かかっています。