recoll : recherche de fichier avec interface graphique

On peut aussi l'utiliser en CLI (mais ouvre l'interface graphique): recoll -q mot-recherché

En PJ doc en anglais, la version online est à https://fossies.org/linux/recoll/doc/user/index.html.
En francais, hyper basique: http://doc.ubuntu-fr.org/recoll

la base

Recoll utilise les infos d'indexation Xapian. On peux l'intégrer à unity avec la lens "recoll-lens" mais tout reste dans le dash (moins pratique, à voir).

La recherche n'est pas sensible à la casse, ni aux accents. Guillements pour chaine exacte.
SI RCH EN MAJUSCULE -> désactive l'expension stem.

 

utiliser les wildcard (* ?)

* et ? sont habituels. [abc] = 1 car (soit a, soit b, soit c) et [0-9] 1 chiffre
^et $   "^someterm"o10  -> someterm doit etre dans les 10 1er caractères

Ex: author:*@domain.com

on peux les combiner: somefield:"^someterm"o10 or somefield:someterm$

 

Dans la recherche simple: ESC puis espace ouvre une fenetre qui propose de compléter les mots.

L'icone loupe (ou Outils > Recherche avancée) permet d'utiliser des filtres Recoll: filtres de recherche

La fenetre des résultats

SHIFT+Clic dans les résultats pour avoir plusieurs fenetres.

Clic droit / sauver sous: enregistre - pratique pour récup des PJ email
                / rech similaire: récup des termes significatifs du doc et les colle en rech simple
               / doc parent: on a la PJ, on recherche l'email qui la contient
               / fenetre snippet : apparait pour doc avec saut de page (pdf, ps...) et affiche le résultat avec n de page

ajout de col: clic droit en-tete

2 facons de rechercher dans le préview

recherche incrémentale de texte: / ou CTRL+F ou souris. F3 pour aller à occurence suivante.

en parcourant les listes de match (entre le doc et la requete recoll qui l'a trouvé).
 - Si la zone de saisie est vide, et qu'on clic "suivant" alors on va au match suivant (surligné)
 - En choisissant une recherche dans la liste et qu'on clic sur suivant (ou prec) on ira au match choisit. A la différence de la recherche de texte, des occurences non exactes seront trouvées (à cause des wildcards ou stemming)

On repasse en mode recherche texte dès qu'on édite la zone de saisie.

3 facons d'indéxer

manuelle (à la demande) recollindex, ou à heure fixe ou encore mis à jour au démarage. Se configure à la 1ere ouverture.

Options:

  • -z efface l'index alors que -Z force l'indéxation sans l'effacer avant (on peux continuer à rechercher pendant l'indéxation)
  • -c confdir pour maj index avec un autre dossier de conf (celui par défaut est def par variable RECOLL_CONFDIR)
  • -i  permet d'indexer une liste de fichiers (mais pas ceux des sous-dossiers, meme s'il ajoute ces entrées de dossier dans son index)
    -f permet d'oublier la conf par défaut (paramètres des fichiers recherchés).
    Avec les 2 (-if) on peut lancer une sélection perso de fichiers, sur une partie du système de fichiers, en ajoutant cette "racine" à la liste skippedPaths.
    Ex:  find . -name indexable.txt -print | recollindex -if
  • -m indexe en temps réel

Notions avancées

Outils d'exploration de terme

Il gère les modifications de racines (stemming). Mais si l'on ne se souvient pas d'un terme, on peux utiliser cet outil, qui a plusieurs modes opératoires:

  • wildcard
  • expressions régulières (ex: mot[0-9]+) sont implicitement balisée du début (ie en cherchant "press" on trouvera aussi "pression")
  • stem expansion
  • spell/phonetic si Aspell spelling est installé

indexes multiples

Utilité: Pour des disques amovibles, si certaines partitions n'ont qu'un type de fichier (ex: mp3), ou encore faciliter la recherche sur une partie du fs (filtre "dir" de la rech avancée). Gain de perf en utilisant des indexes externes.

Ex simple (pour 1 user): ~  et  /usr/shared/doc

Par défaut, l'index prend ~ (conf par défaut de recoll) et on souhaite créer un autre index pour /usr/shared/doc
Il faut créer le rep de conf (dans ~) pour ce nouvel index, puis l'ajouter en externe.

Pour un index partagé entre plusieurs utilisateurs, voir doc (variable d'env RECOLL_EXTRA_DBS).

Exemple simple de multi-indéxation
mkdir .recoll-sharedoc
touch .recoll-sharedoc/recoll.conf
création conf pour nouvel index
cd .recoll-sharedoc
echo "topdirs = /usr/share/doc" > recoll.conf
recoll -c ~/.recoll-sharedoc

Soit on fait la conf à la main

Soit avec GUI (cancel pour lancer l'éditeur de conf)

recollindex -c ~/.recoll-sharedoc Puis, on lance la 1ere indexation (si GUI, ca se lance tout seul, sinon passer cette commande)
crontab -e
45 20 * * * recollindex -c ~/.recoll-sharedoc
Conf de cron (option) à 20h45
Preferences->External index
et clic "browse" pour choisir
 ~/.recoll-sharedoc/xapiandb
clic add index
Choix index externe

Source: https://bitbucket.org/medoc/recoll/wiki/MultipleIndexes mais la doc totale est à https://fossies.org/linux/recoll/doc/user/RCL.INDEXING.CONFIG.html#RCL.I...

 

https://bitbucket.org/medoc/recoll/wiki/FaqsAndHowTos

Note: "stemming" se dit en francais "racinisation ou désuffixation"

Doc tek: 
Fichier attachéTaille
PDF icon recoll_user_manual.pdf342.12 Ko