Recoll-Lens o como realizar búsquedas de texto en Ubuntu

Recoll es una herramienta de búsqueda de archivos basada en texto, es decir, busca los archivos por el contenido de los mismos, indexando gran cantidad de tipos de archivos incluyendo LibreOffice/OpenOffice, MS Office, PostScript, archivos de audio, en función de sus etiquetas, así como imágenes, también basándose en sus etiquetas. Además, Recoll, permite realizar búsquedas avanzadas, ya sea por el autor, por el tamaño del archivo, por el formato del mismo, por su ubicación, así como realizar consultas utilizando operadores booleanos.

Creo que esto ya lo he dicho en alguna que otra ocasión, y es que dado lo caótico del orden de mis directorios y archivos, localizar un documento, siempre se termina convirtiendo en una búsqueda, que de normal viene determinado por el título del documento, que a veces, y solo a veces puede facilitar la extensión del archivo en cuestión, pero no siempre.

No conocía en absoluto el proyecto Recoll, pero gracias a WebUpd8, se me ha abierto un nuevo campo de posibilidades en la inmersión en mi caótico orden de directorios, archivos y documentos.

Recoll

Cuando instalas Recoll, realiza una indexación de todos tus archivos, para posteriormente realizar búsquedas en los mismos. Se trata de una herramienta de fácil instalación (lo puedes hacer vía PPA), con pocas dependencias, sin demonios, ni servidores web, ni nada por el estilo. Tiene una interfaz implementada en Qt, además de su propio comando para utilizar con el terminal. Es capaz de buscar en una gran variedad de tipos de documentos, correos electrónicos, y en los adjuntos a los correos electrónicos, además de manejar archivos comprimidos (gzip y bzip2). Dispone de un potente sistema de consulta, con la posibilidad de utilizar comodines, búsquedas booleanas “and”,”or”,.., por extensión o tipo de archivo, por directorio, etc. Además, se trata de una aplicación multilenguaje y trabaja con caracteres Unicode, lo cual es un gran alivio, porque por lo menos a mi esto siempre me trae de cabeza. Además de todo esto, Recoll, tiene una amplia documentación, con un completo manual de usuario y las páginas de ayuda correspondientes para cada comando.

Recoll-Lens o como realizar búsquedas de texto en Ubuntu

Algunos de los tipos soportados por Recoll son los siguientes, aunque puedes consultar la lista completa en Recoll:

  • archivos de texto
  • archivos HTML
  • maildir y mailbox (Mozilla, Thunderbird y Evolution)
  • Scribus
  • las páginas Man (necesitará groff)
  • Abiword
  • Microsoft Office Open XML
  • OpenOffice
  • SVG
  • Gnumeric
  • pdf (utilizando el comando pdftotext)
  • msword (utilizando antiword)
  • Powerpoint y Excel (utilizando las utilidades catdoc)
  • CHM (la ayuda de Microsoft) con Python, pychm y chmlib.
  • Archivos Zip
  • Archivos Rar (para esto necesitará el modulo de Python rarfile y la utilidad unrar)
  • iCalendar(.ics)
  • RTF
  • TeX
  • dvi
  • djvu
  • las etiquetas de archvo de audio
  • las etiquetas de imágenes (exif)

Recoll-Lens

Pero además de las posibilidades que aporta Recoll, si utilizamos Ubuntu con Unity, podemos instalar Recoll-Lens, que es la Lente que nos permitirá realizar las búsquedas directamente desde el Dash o tablero, con la simplicidad y funcionalidad que esto nos aporta.

Recoll-Lens o como realizar búsquedas de texto en Ubuntu

Instalación

Para instalar Recoll y Recoll Lens, tienes que añadir el siguiente repositorio y actualizar:

sudo add-apt-repository ppa:recoll-backports/recoll-1.15-on && sudo apt-get update

Una vez añadido el repositorio puedes instalar tanto Recoll como Recoll-Lens, desde la línea de comandos:

sudo apt-get install recoll recoll-lens

Conclusión

Se trata de una herramienta muy potente para la búsqueda de documentos en función de su contenido, lo que ayuda considerablemente, sobre todo si no tienes un orden en los documentos guardados, dado que una búsqueda se puede convertir en toda una odisea.

 

Más información: Recoll

Fuente: WebUpd8 | atareao

¿Quién está en línea?

Hay 28230 invitados y ningún miembro en línea