Namazu

検索式を使って自由自在に全文検索

2009年8月6日

Namazuの検索式をマスターする

単一単語検索

調べたい単語を一つ指定して検索する。

namazu

AND検索

スペースで区切られた複数の単語を含む文書を検索する。スペースの代わりに and を使ってもいい。

Linux and Netscape

OR検索

or で区切った複数の単語うち、どちらかを含む文書を検索する。

Linux or FreeBSD

NOT検索

ある単語を含み、ある単語を含まない文書を検索する。単語と単語の間に not を挿む。

Linux not UNIX

グループ化

AND検索、OR検索、NOT検索をカッコでグループ化できる。カッコの両端のスペースを忘れないようにね。

( Linux or FreeBSD ) and Netscape not Windows

フレーズ検索

2語以上からなる複合語を検索する。 "..." と2重引用符で、あるいは {...} と中括弧で囲む。ところで、フレーズ検索はときどきマッチングで誤ることがあるそうだ。

{GNU Emacs}

部分一致検索

部分一致検索には前方一致、中間一致、後方一致の 3種類がある。

前方一致検索
inter* (inter から始まる単語を含む文書を検索)
中間一致検索
*text* (text を内包する単語を含む文書を検索)
後方一致検索
*net (net で終わる単語を含む文書を検索)

正規表現検索

検索するキーワードを正規表現で指定する。正規表現は /.../ のようにスラッシュ記号で囲むこと。正規表現の書式は Perl とほぼ同じだ。

/<a href="[^"]">/

フィールド指定の検索

Subject:, From:, Message-Id: といったフィールドを指定して検索する。特にMail/News のファイルを扱う際に効果を発揮する。

  • +subject:Linux
    (Subject: に Linuxが含まれる文書)
  • +subject:"GNU Emacs"
    (Subject: に GNU Emacsが含まれる文書)
  • +from:foo@bar.jp
    (From: に foo@bar.jp が含まれる文書)
  • +message-id:<199801240555.OAA18737@foo.bar.jp>
    (Message-Id を指定)

特記事項

  • アルファベットの大文字・小文字の区別はしない。
  • 日本語の複合語は形態素単位に分割し、それらをフレーズ検索する。
  • JIS X 0208 (いわゆる全角文字) の英数字と記号の一部 (ASCIIと重複しているもの) は ASCII (いわゆる半角文字) として処理。
  • 記号を含む語の検索ができます。例: TCP/IP。 ただし、記号の処理は完全ではないので TCP and IP のように分割してAND検索をかけた方が取りこぼしがない(その代わり余計なファイルまでヒットしてしま う可能性がある)。
  • and, or, not を単語として検索したいときはそれぞれ、 "..." と2重引用符で、 あるいは {...} と中括弧で囲む。

Comment

コメントを残す

メールアドレスが公開されることはありません。

リズムファクトリーはホームページの制作会社です。
ホームページ制作に関するご要望・ご相談はこちらからどうぞ。