glob
--- Unix 风格路径名模式扩展¶
源代码: Lib/glob.py
glob
模块会按照 Unix shell 所使用的规则找出所有匹配特定模式的路径名称,但返回结果的顺序是不确定的。 波浪号扩展不会生效,但 *
, ?
以及用 []
表示的字符范围将被正确地匹配。 这是通过配合使用 os.scandir()
和 fnmatch.fnmatch()
函数来实现的,而不是通过实际发起调用子 shell。
请注意以点号 (.
) 打头的文件只能用同样以点号打头的模式来匹配,这不同于 fnmatch.fnmatch()
或 pathlib.Path.glob()
。 (对于波浪号和 shell 变量扩展,请使用 os.path.expanduser()
和 os.path.expandvars()
。)
对于字面值匹配,请将原字符用方括号括起来。 例如,'[?]'
将匹配字符 '?'
。
The glob
module defines the following functions:
- glob.glob(pathname, *, root_dir=None, dir_fd=None, recursive=False, include_hidden=False)¶
返回一个匹配 pathname 的可能为空的路径名列表,其中的元素必须为包含路径信息的字符串。 pathname 可以是绝对路径 (如
/usr/src/Python-1.5/Makefile
) 或相对路径 (如../../Tools/*/*.gif
),并可包含 shell 风格的通配符。 无效的符号链接也将包括在结果中 (如像在 shell 中一样)。 结果是否排序取决于具体文件系统。 如果某个符合条件的文件在调用此函数期间被移除或添加,是否包括该文件的路径是没有规定的。如果 root_dir 不为
None
,则它应当是指明要搜索的根目录的 path-like object。 它用在glob()
上与在调用它之前改变当前目录有相同的效果。 如果 pathname 为相对路径,结果将包含相对于 root_dir 的路径。本函数带有 dir_fd 参数,支持 基于目录描述符的相对路径。
如果 recursive 为真值,则模式 "
**
" 将匹配目录中的任何文件以及零个或多个目录、子目录和符号链接。 如果模式加了一个os.sep
或os.altsep
则将不匹配文件。如果 include_hidden 为真值,"
**
" 模式将匹配隐藏目录。引发一个 审计事件
glob.glob
附带参数pathname
,recursive
。引发一个 审计事件
glob.glob/2
,附带参数pathname
,recursive
,root_dir
,dir_fd
。备注
在一个较大的目录树中使用 "
**
" 模式可能会消耗非常多的时间。在 3.5 版本发生变更: 支持使用 "
**
" 的递归 glob。在 3.10 版本发生变更: 添加了 root_dir 和 dir_fd 形参。
在 3.11 版本发生变更: 增加了 include_hidden 形参。
- glob.iglob(pathname, *, root_dir=None, dir_fd=None, recursive=False, include_hidden=False)¶
返回一个 iterator,它会产生与
glob()
相同的结果,但不会实际地同时保存它们。引发一个 审计事件
glob.glob
附带参数pathname
,recursive
。引发一个 审计事件
glob.glob/2
,附带参数pathname
,recursive
,root_dir
,dir_fd
。在 3.5 版本发生变更: 支持使用 "
**
" 的递归 glob。在 3.10 版本发生变更: 添加了 root_dir 和 dir_fd 形参。
在 3.11 版本发生变更: 增加了 include_hidden 形参。
- glob.escape(pathname)¶
转义所有特殊字符 (
'?'
,'*'
和'['
)。 这适用于当你想要匹配可能带有特殊字符的任意字符串字面值的情况。 在 drive/UNC 共享点中的特殊字符不会被转义,例如在 Windows 上escape('//?/c:/Quo vadis?.txt')
将返回'//?/c:/Quo vadis[?].txt'
。在 3.4 版本加入.
- glob.translate(pathname, *, recursive=False, include_hidden=False, seps=None)¶
Convert the given path specification to a regular expression for use with
re.match()
. The path specification can contain shell-style wildcards.For example:
>>> import glob, re >>> >>> regex = glob.translate('**/*.txt', recursive=True, include_hidden=True) >>> regex '(?s:(?:.+/)?[^/]*\\.txt)\\Z' >>> reobj = re.compile(regex) >>> reobj.match('foo/bar/baz.txt') <re.Match object; span=(0, 15), match='foo/bar/baz.txt'>
Path separators and segments are meaningful to this function, unlike
fnmatch.translate()
. By default wildcards do not match path separators, and*
pattern segments match precisely one path segment.If recursive is true, the pattern segment "
**
" will match any number of path segments. If "**
" occurs in any position other than a full pattern segment,ValueError
is raised.If include_hidden is true, wildcards can match path segments that start with a dot (
.
).A sequence of path separators may be supplied to the seps argument. If not given,
os.sep
andaltsep
(if available) are used.参见
pathlib.PurePath.match()
andpathlib.Path.glob()
methods, which call this function to implement pattern matching and globbing.在 3.13 版本加入.
Examples¶
Consider a directory containing the following files:
1.gif
, 2.txt
, card.gif
and a subdirectory sub
which contains only the file 3.txt
. glob()
will produce
the following results. Notice how any leading components of the path are
preserved.
>>> import glob
>>> glob.glob('./[0-9].*')
['./1.gif', './2.txt']
>>> glob.glob('*.gif')
['1.gif', 'card.gif']
>>> glob.glob('?.gif')
['1.gif']
>>> glob.glob('**/*.txt', recursive=True)
['2.txt', 'sub/3.txt']
>>> glob.glob('./**/', recursive=True)
['./', './sub/']
如果目录包含以 .
打头的文件,它们默认将不会被匹配。 例如,考虑一个包含 card.gif
和 .card.gif
的目录:
>>> import glob
>>> glob.glob('*.gif')
['card.gif']
>>> glob.glob('.c*')
['.card.gif']
参见
The fnmatch
module offers shell-style filename (not path) expansion.
参见
pathlib
模块提供高级路径对象。