13.1 Escape 字符列表
Escape 字符 是在计算机技术发展的早期时期出现的,用于在文本字符串中插入控制代码。 从历史上看,它们用于控制诸如打印机和电传打字机等设备,允许将换行或回车等命令直接插入到数据流中。
随着编程的进步,这些字符成为标准编程语言的一部分,包括 C,然后传递到 Python 和其他语言中。在
Python 中,escape 字符用反斜杠 \
表示,后跟表示其功能的字符,例如 \n
表示换行。
在 Python 中,escape 字符在字符串处理方面发挥着关键作用,允许插入特殊字符,否则这些字符将很难或不可能直接包含在字符串中。
以下是一些最流行的 escape 字符表
Escape 字符 | 描述 |
---|---|
\\ |
反斜杠。 |
\' |
单引号。 |
\" |
双引号。 |
\n |
换行。 |
\r |
回车。 |
\t |
水平制表符。 |
\b |
退格,删除前一个字符。 |
\f |
换页。 |
\a |
响铃。 |
换页和响铃这些东西都来自于打印机或电传打字机的时代。但,俗话说,好记性不如烂笔头。
而像水平制表符之类的东西,今天也经常用于代码对齐。
13.2 插入 Unicode 字符
自从计算机被发明以来,它们最初只能处理包含拉丁字母、数字、数字和一些符号的字符串。第一个字符集(ASCII 编码)仅包括 128 个字符,包括控制符“换页” :)
Unicode 的想法直到 1987 年才出现,当时 Xerox 的乔·贝克尔和 Apple 的李·柯林斯开始讨论创建新字符编码系统的可能性,该系统能够支持世界上所有的书写系统。
他们将 Unicode 设想为一个 16 位系统,允许使用 65,536 个唯一字符,他们认为这足以覆盖所有已知的书写系统。但事实证明当然不是这样 :)
随着时间的推移,Unicode 扩展了,不仅包括更多的“语言书写系统”,还包括一个庞大的字符集、表情符号和历史文本。Unicode 13.0 于 2020 年 3 月发布,包含超过 143,000 个字符,涵盖超过 150 种“书写系统”和许多字符集,使其成为数字时代的复杂编码系统。
Unicode 在 2000 年 10 月发布的 Python 2.0 版本中被添加。这一重大变化使 Python 可以更好地支持国际语言和字符,简化国际应用程序的开发。
Python 代码文件的编码支持 Unicode,因此你可以在文本中插入任何语言的字符:
print("Come to the Dark Side") # 英语
print("Ven al Lado Oscuro") # 西班牙语
print("Komm auf die dunkle Seite") # 德语
print("暗黒面に来なさい") # 日语
print("来到黑暗面") # 中文
可以使用 16 进制编码通过其编号插入 Unicode 字符:
Escape 字符 | 描述 |
---|---|
\\uXXXX | 具有 16 位十六进制值 XXXX 的 Unicode 字符。 |
\\UXXXXXXXX | 具有 32 位十六进制值 XXXXXXXX 的 Unicode 字符。 |
13.3 插入表情符号
在 Python 文本和代码中插入表情符号或 emoji 可以是改善消息的视觉效果和情感内容的一种有趣方式。表情符号是 Unicode 字符,可以直接添加到 Python 字符串数据中。
在 Python 中,表情符号使用 Unicode 标准,其中包括数千个符号,包括许多表情符号。每个表情符号都有一个唯一的 Unicode 编号,可以插入到文本中。
插入表情符号的示例
要插入表情符号,只需从互联网复制并粘贴到文本中即可
# 表情符号输出示例
print(" 😀 ") # 输出 😀
使用 Unicode 插入表情符号的示例
要插入表情符号,只需知道其代码并使用带有 u
前缀的字符串即可:
# 表情符号输出示例
print(u"\U0001F600") # 😀
与库一起使用
有一些库,比如 emoji,将处理表情符号变得更简单:
# 使用 emoji 库
from emoji import emojize
print(emojize(":grinning_face:"))
表情符号在移动和 Web 应用程序中广泛使用,Python 也不例外。它们可以为聊天机器人、论坛、评论和其他类型的用户交互增加清晰度和情感表达。
GO TO FULL VERSION