Présentation

  • : Avoir le pouvoir de pouvoir avoir le pouvoir !
  • : # CADRE : Master 1 PluriTAL (Paris 3, Paris 10, Inalco) - Projet encadré # MECENES : Rachid BELMOUHOUB, Jean-Michel DAUBE, Serge FLEURY # TOILE SUPPORT : page web # PEINTURE : web multilingue # PINCEAUX : scripts bash # THEME : extraction de contextes multilingues du mot "pouvoir"
  • Contact
  • Retour à la page d'accueil

Recherche

Vendredi 25 décembre 2009 5 25 /12 /Déc /2009 14:16
Salut !


Petit problème à résoudre en cours...

Je voudrais supprimer à l'aide d'une commande et d'une boucle toutes les images et leurs extensions des fichiers contexte.txt afin qu'elles n'apparaissent pas dans les nuages.

Je suis allée chercher du côté d'EGREP mais EGREP match la ligne contenant le motif et non pas le motif seul et je ne trouve pas l'option de la commande qui irait chercher le motif uniquement.
Idem, je suis partie du côté de SED aussi pour voir si je ne pouvais pas ajouter un saut de ligne autour du motif pour pouvoir utiliser EGREP, mais là j'ai carrément du mal à comprendre ce que me dit le manuel...

Je suis sûre qu'il y a un moyen !! Mais pour l'instant je tatônne et je n'y vois pas grand chose...

RESOLU (4 heures plus tard...)


Voici ce que nous avons dans le script pour nettoyer le contexte.txt :
on a rajouté la commande SED juste après le résultat de la commande EGREP grâce à un PIPE, histoire de nettoyer le contenu du fichier contexte.txt dès sa création.

egrep -i -A 2 -B 2 "\bability\b" ../DUMP/Anglais/sens1/$i.txt | sed "s/\.gif/ /g" | sed "s/\.jpg/ /g" | sed "s/\.jpeg/ /g" > ../CONTEXTES/Anglais/sens1/$i.txt;

 

On est obligé de faire plusieurs PIPE et SED à la suite les uns des autres parce que j'ai essayé avec un motif du genre

SED "s/[\.[gif]|[jpg]]/ /g"

 

Et ça ne marche pas du tout...

 

Pfiou...la suite maintenant !

 

RESOLU BIS

Dans Wordle, on peut supprimer n'importe quel élément en faisant clic-droit... donc on peut supprimer toutes les occurrences de "blabla.gif" par exemple en 2 clics !!! !!! !!!

 

 

Par PluriTAL-BT
Ecrire un commentaire - Voir les 0 commentaires
Retour à l'accueil
 
Créer un blog gratuit sur over-blog.com - Contact - C.G.U. - Rémunération en droits d'auteur - Signaler un abus