String Services

Ensemble de modules utiles pour la manipulation de chaînes de caractères.

Exemple des regular expressions

Les regular expressions (ou regexp) sont des chaînes de caractères codifiées décrivant des ensembles de chaînes de caractères « de base ».

Elles permettent de retrouver rapidement un ensemble de caractères dans une chaîne.

[1]:
# On importe le module
import re
[2]:
# On cherche un flottant dans une chaine de caractères
chaine = 'La valeur de pi à 10 décimales près est 3.1415926536. Très intéressant, non?'
re_float = '\d+.\d+'
valeur_pi = re.search(re_float,chaine)
valeur_pi.group()
[2]:
'3.1415926536'
[3]:
# On extrait tous les mots d'une phrase
chaine = 'Mais qui+ a::mis -le%$¨bazard!!dans~~cette789chaine?'
re_word = '[a-zA-Z\?]+'
mots = re.findall(re_word,chaine)
mots
[3]:
['Mais', 'qui', 'a', 'mis', 'le', 'bazard', 'dans', 'cette', 'chaine?']
[4]:
# On peut remplacer une séquence par une autre
chaine = 'Farid est vraiment mon animateur préféré.'
print(chaine)
chaine = re.sub('Farid','Théophile',chaine)
print(chaine)
Farid est vraiment mon animateur préféré.
Théophile est vraiment mon animateur préféré.

Les regexp prennent tout leur intérêt dans le traitement de grandes chaînes de caractères.

Elles sont notamment utiles pour accéder rapidement à une donnée précise dans un gros fichier.

Exercices