13.1 Liste des caractères d'échappement
Caractères d'échappement sont apparus à l’aube de l’informatique comme un moyen d’insérer des codes de contrôle dans les chaînes de texte. Historiquement, ils étaient utilisés pour contrôler les dispositifs tels que les imprimantes et les téléscripteurs, permettant d'insérer des commandes telles que le saut de ligne ou le retour chariot directement dans les flux de données.
Avec l'évolution de la programmation, ces caractères sont devenus une partie
des langages de programmation standard, y compris C, d’où ils ont été
transférés en Python et d'autres langages. En Python, les caractères
d’échappement sont désignés par un antislash \
, suivi d'un caractère
déterminant leur fonction, par exemple \n
pour une nouvelle ligne.
Les caractères d'échappement en Python jouent un rôle clé dans le traitement des chaînes, permettant d'insérer des caractères spéciaux qui seraient autrement difficiles ou impossibles à inclure directement dans les chaînes.
Voici un tableau avec les plus populaires d'entre eux
Caractère d'échappement | Description |
---|---|
\\ |
Antislash. |
\' |
Guillemet simple. |
\" |
Guillemet double. |
\n |
Nouvelle ligne. |
\r |
Retour chariot. |
\t |
Tabulation horizontale. |
\b |
Backspace, supprime le caractère précédent. |
\f |
Saut de page. |
\a |
Signal sonore. |
Le saut de page et le signal sonore viennent du temps où le texte était imprimé sur une imprimante ou un télétype. Mais, comme on dit, on ne peut pas retirer un mot d'une chanson.
Par exemple, la tabulation horizontale est couramment utilisée pour aligner le code.
13.2 Insertion de caractères Unicode
Au début de l'informatique, les ordinateurs ne pouvaient travailler qu'avec des chaînes contenant des lettres latines, des chiffres et quelques signes. Le premier ensemble de caractères (le codage ASCII) comprenait seulement 128 caractères, y compris des commandes de contrôle comme « saut de page » :)
L'idée du Unicode a émergé seulement en 1987, lorsque Joe Becker de Xerox et Lee Collins d'Apple ont commencé à discuter de la possibilité de créer un nouveau système de codage de caractères qui pourrait supporter toutes les écritures du monde.
Ils envisageaient Unicode comme un système à 16 bits, permettant l'utilisation de 65 536 caractères uniques, ce qui, pensaient-ils, suffirait à couvrir tous les scripts connus. Mais évidemment, ce n'était pas le cas :)
Avec le temps, Unicode s'est élargi pour inclure non seulement plus de « scripts linguistiques », mais aussi un vaste ensemble de caractères, d'emojis et de textes historiques. Unicode 13.0, publié en mars 2020, contient plus de 143 000 caractères, couvrant plus de 150 « scripts » et une multitude d'ensembles de caractères, en faisant un système de codage complexe pour l'ère numérique.
Unicode a été ajouté à Python dans la version 2.0, sortie en octobre 2000. Ce changement important a permis à Python de mieux supporter les langues et caractères internationaux, simplifiant le développement d'applications internationales.
Le codage des fichiers de code Python supporte Unicode, vous pouvez donc insérer dans le texte des caractères dans n'importe quelle langue :
print("Come to the Dark Side") # Anglais
print("Ven al Lado Oscuro") # Espagnol
print("Komm auf die dunkle Seite") # Allemand
print("暗黒面に来なさい") # Japonais
print("来到黑暗面") # Chinois
Insérer un caractère Unicode dans le texte par son numéro est possible en utilisant le codage hexadécimal :
Caractère d'échappement | Description |
---|---|
\\uXXXX | Caractère Unicode avec une valeur hexadécimale 16 bits XXXX. |
\\UXXXXXXXX | Caractère Unicode avec une valeur hexadécimale 32 bits XXXXXXXX. |
13.3 Insertion d'emojis
Insérer des emojis dans du texte et du code en Python peut être un moyen amusant d'améliorer la perception visuelle et le contenu émotionnel des messages. Les emojis sont des caractères Unicode, et peuvent être ajoutés directement dans les chaînes de données Python.
Les emojis en Python utilisent la norme Unicode qui inclut des milliers de caractères, y compris de nombreux emojis. Chaque emoji a un numéro Unicode unique, ce qui permet de l’insérer dans le texte.
Exemples d'insertion d'emojis
Pour insérer un emoji, il suffit de le copier d'internet et de le coller dans le texte
# Exemple d'affichage d'un emoji
print(" 😀 ") # affiche 😀
Exemples d'insertion d'emojis avec Unicode
Pour insérer un emoji, il suffit de connaître son code et de l'utiliser dans
une chaîne avec un préfixe u
:
# Exemple d'affichage d'un emoji
print(u"\U0001F600") # 😀
Travail avec des bibliothèques
Il existe des bibliothèques, comme emoji, qui simplifient le travail avec les emojis :
# Utilisation de la bibliothèque emoji
from emoji import emojize
print(emojize(":grinning_face:"))
Les emojis sont largement utilisés dans les applications mobiles et web, et Python ne fait pas exception. Ils peuvent ajouter de la clarté et une expressivité émotionnelle dans les chatbots, forums, commentaires et autres types d'interaction utilisateur.
GO TO FULL VERSION