Raphael +
  • Stay hungry, Stay foolish.
  • albus.zly@gmail.com
    albus12138

    Python正则表达式

    0x00 正则表达式简介

    正则表达式是对字符串进行操作的一种逻辑公式,是用预先定义好的一些特定的字符组合组成一个”规则”字符串,来对目标字符串进行匹配、过滤。在编程过程中有广泛应用,python有内建的re模块提供正则表达式的功能。

    这里直接引用百度百科对正则表达式中的通用符号进行说明。

    0x01 re模块属性和方法

    flags:

    methods:

    re.split('\W+', 'Words, words, words.')
    # ['Words', 'words', 'words', '']
    
    # 加括号后会将为匹配字符都加入列表中
    re.split('(\W+)', 'Words, words, words.')
    # ['Words', ', ', 'words', ', ', 'words', '.', '']
    
    # maxsplit如果不为0则只截取出规定个数的子串
    re.split('\W+', 'Words, words, words.', 1)
    # ['Words', 'words, words.']

    注意:自3.1版本起支持flags,自3.5版本起不接受空正则表达式,如:"^$"

    0x02 返回对象的属性和方法

    最后附上官方文档

    Blog

    Coding

    Bookmarks