• 5.13 获取文件夹中的文件列表
    • 问题
    • 解决方案
    • 讨论

    5.13 获取文件夹中的文件列表

    问题

    你想获取文件系统中某个目录下的所有文件列表。

    解决方案

    使用 os.listdir() 函数来获取某个目录中的文件列表:

    1. import os
    2. names = os.listdir('somedir')

    结果会返回目录中所有文件列表,包括所有文件,子目录,符号链接等等。如果你需要通过某种方式过滤数据,可以考虑结合 os.path 库中的一些函数来使用列表推导。比如:

    1. import os.path
    2.  
    3. # Get all regular files
    4. names = [name for name in os.listdir('somedir')
    5. if os.path.isfile(os.path.join('somedir', name))]
    6.  
    7. # Get all dirs
    8. dirnames = [name for name in os.listdir('somedir')
    9. if os.path.isdir(os.path.join('somedir', name))]

    字符串的 startswith()endswith() 方法对于过滤一个目录的内容也是很有用的。比如:

    1. pyfiles = [name for name in os.listdir('somedir')
    2. if name.endswith('.py')]

    对于文件名的匹配,你可能会考虑使用 globfnmatch 模块。比如:

    1. import glob
    2. pyfiles = glob.glob('somedir/*.py')
    3.  
    4. from fnmatch import fnmatch
    5. pyfiles = [name for name in os.listdir('somedir')
    6. if fnmatch(name, '*.py')]

    讨论

    获取目录中的列表是很容易的,但是其返回结果只是目录中实体名列表而已。如果你还想获取其他的元信息,比如文件大小,修改时间等等,你或许还需要使用到 os.path 模块中的函数或着 os.stat() 函数来收集数据。比如:

    1. # Example of getting a directory listing
    2.  
    3. import os
    4. import os.path
    5. import glob
    6.  
    7. pyfiles = glob.glob('*.py')
    8.  
    9. # Get file sizes and modification dates
    10. name_sz_date = [(name, os.path.getsize(name), os.path.getmtime(name))
    11. for name in pyfiles]
    12. for name, size, mtime in name_sz_date:
    13. print(name, size, mtime)
    14.  
    15. # Alternative: Get file metadata
    16. file_metadata = [(name, os.stat(name)) for name in pyfiles]
    17. for name, meta in file_metadata:
    18. print(name, meta.st_size, meta.st_mtime)

    最后还有一点要注意的就是,有时候在处理文件名编码问题时候可能会出现一些问题。通常来讲,函数 os.listdir() 返回的实体列表会根据系统默认的文件名编码来解码。但是有时候也会碰到一些不能正常解码的文件名。关于文件名的处理问题,在5.14和5.15小节有更详细的讲解。

    原文:

    http://python3-cookbook.readthedocs.io/zh_CN/latest/c05/p13_get_directory_listing.html