recoll : recherche de fichier avec interface graphique
On peut aussi l'utiliser en CLI (mais ouvre l'interface graphique): recoll -q mot-recherché
En PJ doc en anglais, la version online est à https://fossies.org/linux/recoll/doc/user/index.html.
En francais, hyper basique: http://doc.ubuntu-fr.org/recoll
la base
Recoll utilise les infos d'indexation Xapian. On peux l'intégrer à unity avec la lens "recoll-lens" mais tout reste dans le dash (moins pratique, à voir).
La recherche n'est pas sensible à la casse, ni aux accents. Guillements pour chaine exacte.
SI RCH EN MAJUSCULE -> désactive l'expension stem.
utiliser les wildcard (* ?)
* et ? sont habituels. [abc] = 1 car (soit a, soit b, soit c) et [0-9] 1 chiffre
^et $ "^someterm"o10
-> someterm doit etre dans les 10 1er caractères
Ex: author:*@domain.com
on peux les combiner: somefield:"^someterm"o10
or somefield:someterm$
Dans la recherche simple: ESC puis espace ouvre une fenetre qui propose de compléter les mots.
L'icone loupe (ou Outils > Recherche avancée) permet d'utiliser des filtres
La fenetre des résultats
SHIFT+Clic dans les résultats pour avoir plusieurs fenetres.
Clic droit / sauver sous: enregistre - pratique pour récup des PJ email
/ rech similaire: récup des termes significatifs du doc et les colle en rech simple
/ doc parent: on a la PJ, on recherche l'email qui la contient
/ fenetre snippet : apparait pour doc avec saut de page (pdf, ps...) et affiche le résultat avec n de page
ajout de col: clic droit en-tete
2 facons de rechercher dans le préview
recherche incrémentale de texte: / ou CTRL+F ou souris. F3 pour aller à occurence suivante.
en parcourant les listes de match (entre le doc et la requete recoll qui l'a trouvé).
- Si la zone de saisie est vide, et qu'on clic "suivant" alors on va au match suivant (surligné)
- En choisissant une recherche dans la liste et qu'on clic sur suivant (ou prec) on ira au match choisit. A la différence de la recherche de texte, des occurences non exactes seront trouvées (à cause des wildcards ou stemming)
On repasse en mode recherche texte dès qu'on édite la zone de saisie.
3 facons d'indéxer
manuelle (à la demande) recollindex
, ou à heure fixe ou encore mis à jour au démarage. Se configure à la 1ere ouverture.
Options:
- -z efface l'index alors que -Z force l'indéxation sans l'effacer avant (on peux continuer à rechercher pendant l'indéxation)
-
-c confdir pour maj index avec un autre dossier de conf (celui par défaut est def par variable
RECOLL_CONFDIR
) -
-i permet d'indexer une liste de fichiers (mais pas ceux des sous-dossiers, meme s'il ajoute ces entrées de dossier dans son index)
-f permet d'oublier la conf par défaut (paramètres des fichiers recherchés).
Avec les 2 (-if) on peut lancer une sélection perso de fichiers, sur une partie du système de fichiers, en ajoutant cette "racine" à la listeskippedPaths
.
Ex: find . -name indexable.txt -print | recollindex -if - -m indexe en temps réel
Notions avancées
Outils d'exploration de terme
Il gère les modifications de racines (stemming). Mais si l'on ne se souvient pas d'un terme, on peux utiliser cet outil, qui a plusieurs modes opératoires:
- wildcard
- expressions régulières (ex: mot[0-9]+) sont implicitement balisée du début (ie en cherchant "press" on trouvera aussi "pression")
- stem expansion
- spell/phonetic si Aspell spelling est installé
indexes multiples
Utilité: Pour des disques amovibles, si certaines partitions n'ont qu'un type de fichier (ex: mp3), ou encore faciliter la recherche sur une partie du fs (filtre "dir" de la rech avancée). Gain de perf en utilisant des indexes externes.
Ex simple (pour 1 user): ~ et /usr/shared/doc
Par défaut, l'index prend ~ (conf par défaut de recoll) et on souhaite créer un autre index pour /usr/shared/doc
Il faut créer le rep de conf (dans ~) pour ce nouvel index, puis l'ajouter en externe.
Pour un index partagé entre plusieurs utilisateurs, voir doc (variable d'env RECOLL_EXTRA_DBS).
mkdir .recoll-sharedoc touch .recoll-sharedoc/recoll.conf |
création conf pour nouvel index |
cd .recoll-sharedoc echo "topdirs = /usr/share/doc" > recoll.conf recoll -c ~/.recoll-sharedoc |
Soit on fait la conf à la main Soit avec GUI (cancel pour lancer l'éditeur de conf) |
recollindex -c ~/.recoll-sharedoc | Puis, on lance la 1ere indexation (si GUI, ca se lance tout seul, sinon passer cette commande) |
crontab -e 45 20 * * * recollindex -c ~/.recoll-sharedoc |
Conf de cron (option) à 20h45 |
Preferences->External index et clic "browse" pour choisir ~/.recoll-sharedoc/xapiandb clic add index |
Choix index externe |
Source: https://bitbucket.org/medoc/recoll/wiki/MultipleIndexes mais la doc totale est à https://fossies.org/linux/recoll/doc/user/RCL.INDEXING.CONFIG.html#RCL.I...
https://bitbucket.org/medoc/recoll/wiki/FaqsAndHowTos
Note: "stemming" se dit en francais "racinisation ou désuffixation"
Attachment | Size |
---|---|
recoll_user_manual.pdf | 342.12 KB |