WebDoc !
Edition de documentation en ligne
Logo
Syntaxe de recherche Xapian

[ Index ] - [ Imprimer ] - [ Edit ] - [ Retour ]

Syntaxe de recherche Xapian

Ce document décrit la syntaxe des requêtes prises en charge par le moteur de recherche Xapian. La syntaxe est conçue pour être semblable à d'autres moteurs de recherche basés sur le Web (Google...), de sorte que leurs utilisateurs familiers ne seront pas dépaysés, les autres se formeront à une syntaxe "utile".

Les opérateurs

(Pour être reconnus par le moteur de recherche, les opérateurs doivent être saisis en majuscule)

AND

( en français "ET" )

expression1 AND expression2 recherchera des documents qui sont contiennent les deux expressions.


OR

( en français "OU" )

expression1 OR expression2 recherchera des documents qui sont contiennent l'une ou l'autre des 2 expressions.


NOT

( en français "PAS" )

expression1 NOT expression2 recherchera des documents qui contiennent seulement expression1 et pas expression2.
NOT expression recherchera les documents qui ne contiennent pas expression.


XOR

( en français "L'UN OU L'AUTRE MAIS PAS LES DEUX" )

expression1 XOR expression2 recherchera des documents qui contiennent l'une ou l'autre des expressions, mais pas les deux. XOR est probablement le plus ésotérique...


'+' et '-'

Un groupe de mots avec certains marqués + et - va rechercher les documents contenant tous les mots marqués +, mais aucun des mots marqués -.
La présence des mots non marqués avec + ou - contribueront au classement des documents.
Vous pouvez également utiliser + et - sur des phrases (voir plus bas la notion de "phrase exacte").


Expressions entre parenthèses

Vous pouvez contrôler la priorité des opérateurs (+, -, AND, NOT, XOR, OR) en utilisant des parenthèses.
Dans la requête un OR deux AND trois le AND a priorité, la requête peut donc s'écrire un OR (deux AND trois). Vous pouvez modifier la priorité à l'aide des parenthèses: (un OR deux) AND trois.

La priorité par défaut (du plus fort au plus faible) est:
+, - (égal)
AND, NOT (égal)
XOR
OR


NEAR

( en français "PRÈS" )

mot1 NEAR mot2 NEAR mot3 recherchera les documents contenant ces 3 mots séparés par 10 mots maximum les uns des autres. Vous pouvez définir le seuil de séparation maximum des mots à n en utilisant NEAR/n comme ceci: mot1 NEAR/6 mot2.


ADJ

( en français "ADJACENT" )

ADJ se comporte comme NEAR mais ne recherchera que les documents où les mots apparaissent dans le même ordre que dans la requête. Donc, mot1 ADJ mot2 ADJ mot3 ne recherchera que les documents contenant ces trois mots dans cet ordre et à moins de 10 mots les uns des autres. Vous pouvez définir le seuil de séparation maximum des mots à n en utilisant ADJ/n comme ceci: mot1 ADJ/6 mot2.


Recherches de "phrase exacte"

Une phrase entourée de guillemets ("ma phrase") recherchera des documents contenant la phrase exacte.
Les mots composés seront également traités comme des phrases, de même que des cas tels que les noms de fichiers et adresses e-mail (par exemple /etc/passwd ou president@whitehouse.gov).


Caractère joker '*'

Le moteur de recherche prend en charge le caractère joker *, qui correspond à un certain nombre de caractères de suite, de sorte que instal* pourra correspondre à installer, installation, etc.

Cette fonction est désactivée par défaut - il faut ajouter la fontion $set{flag_wildcard,1} au QueryParser pour la rendre effective.
Vous pouvez limiter le nombre d'occurrences pour lesquelles un joker sera étendu (Xapian::QueryParser::set_max_wildcard_expansion()) mais la valeur par défaut est de ne pas limiter son étendue.


Pour aller plus loin...
- Requête partiellement entrée, recherche dans un champ probabiliste, recherche de noms propres, recherches "Range" (intervalle), synonymes, etc.
https://xapian.org/docs/omega/omegascript.html
https://xapian.org/docs/queryparser.html

[ Index ] - [ Imprimer ] - [ Edit ] - [ Retour ]

webdoc v.1.0

Valid HTML ! CSS Valide !