[Sequanux-ml] COMPTAGE DE MOTS

Émile CARRY emile.carry at sequanux.org
Ven 17 Avr 11:52:57 CEST 2015


Le 17/04/2015 11:02, SDS a écrit :
> Bonjour, j'aurais besoin d'un logiciel qui fasse un comptage de type de mots,
> par exemple combien de fois le mot patriotisme apparaît dans un discours, etc.

tout dépend du format du fichier de départ.

Si c'est un fichier text, en ligne de commande ce sera par exemple :
grep -o patriotisme fichier.txt|wc -l

le grep -o donne les occurrences du mot recherché (et l'affiche sur une ligne)
et le wc -l compte le nbr de ligne...

Si c'est un fichier libreoffice, il doit bien y avoir une fonction de comptage
de mot (on me confirme)

si c'est un pdf, on peut déjà le convertir en texte avec par exemple pdftotext
(paquet poppler-utils sous debian) et du coup revient au cas du fichier texte.

et il doit y avoir encore plein de solutions à coup de python et autres...

> Existe-t-il un logiciel tout fait et en plus gratuit ?

Et libre...

Bonne journée

mil



Plus d'informations sur la liste de diffusion Sequanux-ml