1624

是否有从文件名中提取扩展名的功能?

4

27 回答 27

2405

是的。使用os.path.splitext(参见Python 2.X 文档Python 3.X 文档):

>>> import os
>>> filename, file_extension = os.path.splitext('/path/to/somefile.ext')
>>> filename
'/path/to/somefile'
>>> file_extension
'.ext'

与大多数手动字符串拆分尝试不同,os.path.splitext它将正确地/a/b.c/d视为没有扩展名而不是有扩展名.c/d,并且它将被.bashrc视为没有扩展名而不是有扩展名.bashrc

>>> os.path.splitext('/a/b.c/d')
('/a/b.c/d', '')
>>> os.path.splitext('.bashrc')
('.bashrc', '')
于 2009-02-12T14:12:46.010 回答
469
import os.path
extension = os.path.splitext(filename)[1]
于 2009-02-12T14:15:07.893 回答
456

3.4 版中的新功能。

import pathlib

print(pathlib.Path('yourPath.example').suffix) # '.example'

我很惊讶还没有人提到pathlibpathlib太棒了!

如果您需要所有后缀(例如,如果您有.tar.gz),.suffixes将返回它们的列表!

于 2016-02-03T21:41:25.727 回答
134
import os.path
extension = os.path.splitext(filename)[1][1:]

仅获取扩展名的文本,而不获取点。

于 2011-08-26T09:37:47.917 回答
99

对于简单的用例,一种选择可能是从点拆分:

>>> filename = "example.jpeg"
>>> filename.split(".")[-1]
'jpeg'

文件没有扩展名时没有错误:

>>> "filename".split(".")[-1]
'filename'

但是你必须小心:

>>> "png".split(".")[-1]
'png'    # But file doesn't have an extension

也不适用于 Unix 系统中的隐藏文件:

>>> ".bashrc".split(".")[-1]
'bashrc'    # But this is not an extension

对于一般用途,更喜欢os.path.splitext

于 2012-04-09T18:48:16.173 回答
42

值得在其中添加一个较低的值,这样您就不会想知道为什么 JPG 没有出现在您的列表中。

os.path.splitext(filename)[1][1:].strip().lower()
于 2012-12-28T07:25:49.757 回答
21

上述任何解决方案都有效,但在 linux 上,我发现扩展字符串末尾有一个换行符,这将阻止匹配成功。将strip()方法添加到末尾。例如:

import os.path
extension = os.path.splitext(filename)[1][1:].strip() 
于 2011-10-10T22:48:43.463 回答
20

使用 splitext 时,带有双扩展名的文件会出现问题(例如file.tar.gz,file.tar.bz2等)

>>> fileName, fileExtension = os.path.splitext('/path/to/somefile.tar.gz')
>>> fileExtension 
'.gz'

但应该是:.tar.gz

可能的解决方案在这里

于 2013-02-05T00:19:54.070 回答
20

你可以在 pathlib 模块中找到一些很棒的东西(在 python 3.x 中可用)。

import pathlib
x = pathlib.PurePosixPath("C:\\Path\\To\\File\\myfile.txt").suffix
print(x)

# Output 
'.txt'
于 2018-08-11T19:23:28.080 回答
16

只是join所有pathlib suffixes

>>> x = 'file/path/archive.tar.gz'
>>> y = 'file/path/text.txt'
>>> ''.join(pathlib.Path(x).suffixes)
'.tar.gz'
>>> ''.join(pathlib.Path(y).suffixes)
'.txt'
于 2018-08-12T15:05:56.387 回答
15

虽然这是一个老话题,但我想知道为什么在这种情况下没有提到一个非常简单的 python api,称为 rpartition:

要获取给定文件绝对路径的扩展名,您只需键入:

filepath.rpartition('.')[-1]

例子:

path = '/home/jersey/remote/data/test.csv'
print path.rpartition('.')[-1]

会给你:'csv'

于 2017-02-27T03:53:05.390 回答
11

很惊讶这还没有被提及:

import os
fn = '/some/path/a.tar.gz'

basename = os.path.basename(fn)  # os independent
Out[] a.tar.gz

base = basename.split('.')[0]
Out[] a

ext = '.'.join(basename.split('.')[1:])   # <-- main part

# if you want a leading '.', and if no result `None`:
ext = '.' + ext if ext else None
Out[] .tar.gz

好处:

  • 对于我能想到的任何事情都可以按预期工作
  • 没有模块
  • 没有正则表达式
  • 跨平台
  • 易于扩展(例如,扩展没有前导点,只有扩展的最后一部分)

作为函数:

def get_extension(filename):
    basename = os.path.basename(filename)  # os independent
    ext = '.'.join(basename.split('.')[1:])
    return '.' + ext if ext else None
于 2015-12-20T00:24:08.017 回答
11

您可以在 asplit上使用 a filename

f_extns = filename.split(".")
print ("The extension of the file is : " + repr(f_extns[-1]))

这不需要额外的库

于 2018-03-15T18:34:13.143 回答
10
filename='ext.tar.gz'
extension = filename[filename.rfind('.'):]
于 2014-02-18T10:55:57.560 回答
6

这是一种直接的字符串表示技术:我看到很多解决方案都提到了,但我认为大多数都在关注拆分。但是,Split 在每次出现“。”时都会执行此操作。. 您宁愿寻找的是分区。

string = "folder/to_path/filename.ext"
extension = string.rpartition(".")[-1]
于 2018-04-18T11:06:25.417 回答
5

右拆分的另一种解决方案:

# to get extension only

s = 'test.ext'

if '.' in s: ext = s.rsplit('.', 1)[1]

# or, to get file name and extension

def split_filepath(s):
    """
    get filename and extension from filepath 
    filepath -> (filename, extension)
    """
    if not '.' in s: return (s, '')
    r = s.rsplit('.', 1)
    return (r[0], r[1])
于 2014-01-03T07:32:02.133 回答
5

即使这个问题已经得到解答,我也会在正则表达式中添加解决方案。

>>> import re
>>> file_suffix = ".*(\..*)"
>>> result = re.search(file_suffix, "somefile.ext")
>>> result.group(1)
'.ext'
于 2017-10-30T08:42:15.677 回答
5

您可以使用以下代码拆分文件名和扩展名。

    import os.path
    filenamewithext = os.path.basename(filepath)
    filename, ext = os.path.splitext(filenamewithext)
    #print file name
    print(filename)
    #print file extension
    print(ext)
于 2021-10-11T11:46:17.680 回答
5

在 Python 中从文件名中提取扩展名

Python 操作系统模块 splitext()

splitext()函数将文件路径拆分为具有两个值的元组——根和扩展名。

import os
# unpacking the tuple
file_name, file_extension = os.path.splitext("/Users/Username/abc.txt")
print(file_name)
print(file_extension)

使用 Pathlib 模块获取文件扩展名

Pathlib 模块获取文件扩展名

import pathlib
pathlib.Path("/Users/pankaj/abc.txt").suffix
#output:'.txt'
于 2021-11-23T02:31:01.840 回答
2

一个真正的单线,如果你喜欢正则表达式。即使你有额外的“。”也没关系。在中间

import re

file_ext = re.search(r"\.([^.]+)$", filename).group(1)

结果见这里:点击这里

于 2020-03-09T02:01:21.150 回答
1

试试这个:

files = ['file.jpeg','file.tar.gz','file.png','file.foo.bar','file.etc']
pen_ext = ['foo', 'tar', 'bar', 'etc']

for file in files: #1
    if (file.split(".")[-2] in pen_ext): #2
        ext =  file.split(".")[-2]+"."+file.split(".")[-1]#3
    else:
        ext = file.split(".")[-1] #4
    print (ext) #5
  1. 获取列表中的所有文件名
  2. 拆分文件名并检查倒数第二个扩展名,它是否在 pen_ext 列表中?
  3. 如果是,则将其与最后一个扩展名加入并将其设置为文件的扩展名
  4. 如果不是,那么只需将最后一个扩展名作为文件的扩展名
  5. 然后检查一下
于 2020-04-20T23:50:07.987 回答
0

对于有趣的...只需将扩展名收集在一个字典中,然后在一个文件夹中跟踪所有这些扩展名。然后只需拉出您想要的扩展名。

import os

search = {}

for f in os.listdir(os.getcwd()):
    fn, fe = os.path.splitext(f)
    try:
        search[fe].append(f)
    except:
        search[fe]=[f,]

extensions = ('.png','.jpg')
for ex in extensions:
    found = search.get(ex,'')
    if found:
        print(found)
于 2020-02-14T16:42:59.273 回答
-2
# try this, it works for anything, any length of extension
# e.g www.google.com/downloads/file1.gz.rs -> .gz.rs

import os.path

class LinkChecker:

    @staticmethod
    def get_link_extension(link: str)->str:
        if link is None or link == "":
            return ""
        else:
            paths = os.path.splitext(link)
            ext = paths[1]
            new_link = paths[0]
            if ext != "":
                return LinkChecker.get_link_extension(new_link) + ext
            else:
                return ""
于 2015-04-01T16:56:27.933 回答
-2

这是在一行中同时获取文件名和扩展名的最简单方法

fName, ext = 'C:/folder name/Flower.jpeg'.split('/')[-1].split('.')

>>> print(fName)
Flower
>>> print(ext)
jpeg

与其他解决方案不同,您不需要为此导入任何包。

于 2020-01-04T10:07:17.943 回答
-3
def NewFileName(fichier):
    cpt = 0
    fic , *ext =  fichier.split('.')
    ext = '.'.join(ext)
    while os.path.isfile(fichier):
        cpt += 1
        fichier = '{0}-({1}).{2}'.format(fic, cpt, ext)
    return fichier
于 2015-11-06T20:24:11.197 回答
-3
a = ".bashrc"
b = "text.txt"
extension_a = a.split(".")
extension_b = b.split(".")
print(extension_a[-1])  # bashrc
print(extension_b[-1])  # txt
于 2021-02-15T09:15:26.307 回答
-5
name_only=file_name[:filename.index(".")

这将为您提供直到第一个“。”的文件名,这将是最常见的。

于 2014-08-22T19:19:24.640 回答