文章目录
-
- 前言
- 12. Python文件操作
-
- 12.1 文件的打开、写入、关闭
- 12.2 主访问模式的特点(r、w、a)
- 12.3 读取函数(read、readlines、readline)
- 12.4 访问模式的特点(r+、w+、a+)
- 12.5 文件的定位读写(tell函数、seek函数)
- 12.6 文件备份
- 12.7 文件和文件夹的操作
- 12.8 批量重命名
- 12.9 小总结
前言
准备在这篇中将Python基础部分完结,敬请期待,未完待续…
12. Python文件操作
文件模式
模式 | 描述 |
---|---|
r | 以只读方式打开文件。文件的指针将会放在文件的开头。这时默认模式 |
rb | 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这时默认格式 |
r+ | 打开一个文件用于读写。文件指针将会放在文件的开头。 |
rb+ | 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。 |
w | 打开一个文件用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件 |
wb | 以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 |
w+ | 打开一个文件用于读写。如果该文件已存在则打开文件,并从头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件 |
wb+ | 以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 |
a | 打开一个文件用于追加。如果该文件已存在,文件指针会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入 |
ab | 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有的内容之后。如果该文件不存在,创建新文件进行写入。 |
a+ | 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写 |
ab+ | 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。 |
巧记文件模式
''' 1. 如果是带b的,不管是r和b配合,还是w、a和b配合,但凡是带b的,都是以二进制格式操作文件 2. 但凡是带+号的,都是可读可写模式。 3. r+ 、rb+、w+都是可读可写有什么区别吗??? 所有的访问模式,它的基础特点都要遵循与主访问模式(r、w、a)。比如:rb、r+、rb+都是基于r访问模式拓展开来。 举个栗子: 比如说r,只读方式打开,如果文件不存在,会报错。如果rb、r+、rb+去打开一个文件,不论是读写还是二进制读写,只要文件不存在,但凡带r的都报错。 比如说w访问模式的,不管是wb、w+、wb+,如果打开一个文件,文件不存在,则新建文件。这就可以说明w+和r+的区别了。 注意: 1. 文件指针:相当于光标的位置,光标后的内容可以读取出来,光标前的内容读取不出来。文件指针关系着文件写入和读取数据的内容。 2. a访问模式,以a为基准的访问模式,文件指针都是在结尾,因为在后面才开始追加。 3. 文件操作不仅有三种主访问模式(r、w、a),依赖这三种主访问模式,还可以拓展好几种访问模式。 '''
12.1 文件的打开、写入、关闭
上栗子,一看就懂:
''' 在python,使用open函数,可以打开已经存在的文件,或者创建一个新文件。 语法:open(name, mode) name:是要打开的目标文件名的字符串(可以包含文件所在的具体路径) mode: 设置打开文件的模式(访问模式):只读、写入、追加等。 '''
# 1. 打开open()
f = open('test.txt','w') # 如果这个文件不存在,则新建此文件
# 2. 读写操作 write() read()
f.write('aaa')
# 3. 关闭 close()
f.close()
''' 总结: 1.文件操作的作用是把一些内容(数据)存储起来,可以让程序下一次执行的时候直接使用,而不必重新制作一份,省事省力. 2.这里的关闭相当于就是保存了。如果文件不关闭,这个文件将一直占用计算机内存,内存消耗比较大的,对于计算机来说,内存消耗大,内存占用量大,风险比较高了. 3. 注意:可以只打开和关闭文件,不进行任何读写操作 '''
12.2 主访问模式的特点(r、w、a)
主访问模式(r、w、a)
# 主访问模式的特点,基础访问模式的特点(r、w、a)
''' 实验目标: 1. 访问模式对文档的影响 2. 访问模式对wirte()的影响 3. 访问模式是否可以省略 '''
=========================================================================
r: 如果文件不存在,报错:不支持写入操作,表示只读
f = open('test.txt1', 'r') # 因为是读操作,没有这个文件,所以报错
f.write('aa') # 报错,因为是只读模式,不能写入
# 下面的才能正常执行
f = open('test.txt','r')
f.close()
==========================================================================
# w:只写,如果文件不存在,新建文件,执行写入。如果不存在则会会覆盖原有内容
f = open('1.txt', 'w') # 如果没有1.txt这个文件,则会新建这个文件
f.write('bbb') # 1.txt文件中的内容是aaa,现在变成了bbb
f.close()
==========================================================================
# a:追加,如果文件不存在,新建文件,在写入内容。如果文件存在,在原有内容基础上,追加新内容
f = open('1.txt','a')
# f = open('2.txt','a') # 如果文件不存在,则新建文件
f.write('helloworld')
f.close()
=========================================================================
# 访问模式参数是否可以省略,如果省略表示访问模式为r
# f = open('100.txt') # 找不到文件,报错
f = open('1.txt') # 这个时候不报错了
f.close()
12.3 读取函数(read、readlines、readline)
read()
''' read() 文件对象.read(num) num表示要从文件中读取的数据的长度(单位是字节),如果不写参数,则读取所有内容 '''
f = open('test.txt','r')
# 文章内容如果换行,底层有\n,会有字节占位,导致read书写参数读取出来的眼睛看到的个数和参数不匹配
# read不写参数表示读取所有:
# print(f.read()) # read不写参数,表示读取所有
print(f.read(10))
readlines()
''' readlines()可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行的数据为一个元素 '''
f = open('test.txt','r')
con = f.readlines()
print(con) # 输出['aaaaa\n', 'bbbbb\n', 'ccccc\n', 'ddddd'] \n是换行符的意思
f.close()
readline()
''' readline()一次读取一行内容 '''
f = open('test.txt','r')
con = f.readline()
print(con) # aaaaa 这是test.txt文件内容的第一行
con = f.readline()
print(con) # bbbbb 这时test.txt文件内容的第二行
f.close()
12.4 访问模式的特点(r+、w+、a+)
除了主访问模式外(r、w、a),说一下其他的访问模式(r+、w+、a+)
""" 带加号的访问模式对文件的影响,以及文件指针对数据读取的影响 测试目标: 1.r+ 和 w+ a+的区别 2.文件指针对数据读取的影响 """
# r+:r没有该文件则报错;文件指针在开头,所以能读取出来数据
f = open('test.txt','r+')
print(f.read()) #
f.close()
# w+: 没有该文件会新建文件:w特点:文件指针在开头,用新内容覆盖原内容
# f = open('test1.txt','w+') # 如果没有该文件则新建文件
# 用新内容把原内容覆盖掉,这里只进行了读取,没有调用write写入,那就代表写入的是空的,空的内容把有数据的内容给覆盖掉了
f = open('test.txt','w+') # 此时test文件里的内容被清空,因为被覆盖了
con = f.read()
print(con)
f.close()
# a+:没有该文件会新建文件:文件指针在结尾,无法读取数据(文件指针后面没有数据)
f = open('test100.txt','a+') # 没有test100.txt这个文件
f = open('test.txt','a+')
con = f.read() # 文件指针在结尾,无法读取数据(文件指针后面没有数据)
print(con)
f.close()
12.5 文件的定位读写(tell函数、seek函数)
telll():返回文件指针的当前位置
直接上栗子,一看就懂:
# dong.txt文件中的内容是:hello,world
file = open("dong.txt", "r")
words = file.read(4)
print(f'读取的数据是:{words}') # hell
# 查找当前位置
position = file.tell()
print(f'当前位置是:{position}') # 4
words = file.read(5)
print(f'读取的数据是:{words}') # o,wor
position = file.tell()
print(f'当前位置是:{position}') # 9
seek():从指定位置开始读取或者写入文件的数据
''' 语法:文件对象.seek(偏移量,起始位置) 起始位置:0 文件开头 1 当前位置 2 文件结尾 作用:用来移动文件指针 目标: 1. r模式 :改变文件指针位置,改变读取数据开始位置或把文件指针放结尾(无法读取数据) 2. o模式 : 改变文件指针位置,做到可以读取出来数据 '''
# test.txt文件的内容是:aaaaa
f = open('test.txt', 'r+')
# 1. 改变读取数据开始位置
# f.seek(2,0) # 从第三个a开始读取
f.seek(0,2) # 指针到了文件结尾,读取不出来数据
con = f.read()
print(con)
# 把文件指针放结尾(无法读取数据)
# f.seek(0, 2)
# 2. a 改变文件指针位置,做到可以读取出来数据
f.seek(0,0) # 这时指针跑到了开头,这时可以读出数据
# f.seek(0) # 如果是两个0,可以省略写一个0
con = f.read()
print(con)
f.close()
12.6 文件备份
根据前面的知识,来进行文件备份。中间有一步进行了优化:
# 1. 用户输入目标文件
old_name = input('请输入您要备份的文件名:')
print(old_name)
# 2. 规划备份文件的名字
# 2.1 提取后缀 -- 找到名字中的点 -- 名字和后缀分离 -- 最右侧的点才是后缀的点 -- 字符串查找某个字串rfind
index = old_name.find('.')
# 4. 进行优化:有效文件才备份 .txt这个文件名就不是有效的
if index > 0:
# 提取后缀
postfix = old_name[index:]
# 2.2 组织新名字 = 原名字 + [备份] + 后缀
# 原名字就是字符串的一部分字串 -- 切片[开始:结束:步长]
print(old_name[:index]) # 开始从0开始,可以省略不用写
print(old_name[index:]) # 因为提取到最后,所以后面可以省略
# new_name = old_name[:index] + '[备份]' + old_name[index:]
new_name = old_name[:index] + '[备份]' + postfix # 如果用户输入的文件名不符合,则会报错
print(new_name)
# 3. 备份文件导入数据(数据和源文件一样)
# 对于计算机来讲,我们存储什么,对于底层,他都是以二进制形式做的存储以及操作,用二进制打开没有问题的。
# 3.1 打开原文件和备份原文件
old_f = open(old_name, 'rb')
new_f = open(new_name,'wb')
# 3.2 原文件读取,备份文件写入
# 如果不确定目标文件大小,循环读取写入,当读取出来的数据没有了,终止循环
while True:
con = old_f.read(1024)
if len(con) == 0:
# 表示读取完成了
break
new_f.write(con)
# 3.3 关闭文件
old_f.close()
new_f.close()
12.7 文件和文件夹的操作
使用os模块的一些方法,来进行文件和文件夹的操作
''' 在python中要操作文件和文件夹的话,要借助模块,要借助os模块。 1. 导入模块os 2. 使用模块内功能 '''
import os # 导入模块,借助os模块里面的相关功能。使用os模块相关功能:os.函数名()
# 1. rename(目标文件,新文件名): 重命名
# rename的第一个参数其实是路径,因为这里直接在当前目录下,所以直接写的文件名
# os.rename('1.txt','1000.txt') # 此时文件已经改名
# 2. remove(目标文件名)
# os.remove('1000.txt') # 此时1000.txt文件已经删除,如果要删除的文件不存在则会报错
# 3. mkdir(文件夹名字):创建文件夹 也可以带路径的文件夹名字
# os.mkdir('aa') # 创建文件夹成功
# 4.rmdir(文件夹名字): 删除文件夹
# os.rmdir('aa') # 删除成功
# 5. getcwd():返回当前文件所在目录路径
print(os.getcwd()) # 输出 D:\PycharmProjects\pythonProject11
# 6. chdir(目录)改变目录路径
# os.mkdir('aa') # 创建aa文件夹
# 需求:在aa里面创建bb文件夹:1. 切换目录到aa 2.在aa文件夹中创建bb
# os.chdir('aa') # 切换到aa文件夹
# os.mkdir('bb') # 在文件夹中创建bb
# 7. listdir(目录): 获取某个文件夹下所有文件,返回一个列表
# print(os.listdir()) # 如果没有填写目录,那么显示当前文件所在的文件夹下所有文件
# print(os.listdir('aa')) # 获取aa文件夹下所有的数据
# 8. rename(目标文件名,新文件名) -- 重命名文件夹 aa重命名为aaaa
os.rename('aa','aaaa')
12.8 批量重命名
看个栗子,就懂了,用到了循环
# 需求1:把code文件夹所有文件重命名 Python xxxx
import os
# 1. 找到所有文件:获取code文件夹的目录列表 -- listdir()
file_list = os.listdir()
print(file_list)
# 2. 构造名字
for i in file_list:
new_name = 'Python_' + i
# 3.重命名
os.rename(i, new_name) # 改名成功
文件夹重命名进行优化,用flag来控制文件名的修改
# 需求2:删除Python_ 重命名:1.构造条件的数据 2.书写if
import os
# 构造条件的数据
flag = 2
# 1. 找到所有文件:获取code文件夹的目录列表 -- listdir()
file_list = os.listdir()
print(file_list)
# 2. 构造名字
for i in file_list:
if flag == 1:
new_name = 'Python_' + i
elif flag == 2:
# 删除数据
num = len('Python_')
new_name = i[num:]
# 3.重命名
os.rename(i, new_name) # 改名成功
12.9 小总结
文件操作小总结
''' r文件指针在开头,能读取出来数据 w文件指针在开头,会把原内容覆盖掉 a文件指针在结尾,向右读取不出来数据,想要a模式能读取出来数据,用seek()改变文件指针位置 可以重命名文件也可以重命名文件夹 '''
""" 文件操作步骤 打开:文件对象 = open(目标文件,访问模式) 操作: 1.读 文件对象.read() 文件对象.readlines() 文件对象.readline() 2.写 文件对象.write() 改变指针:seek() 关闭: 文件对象.close 主访问模式 w:写,文件不存在则新建该文件 r:读,文件不存在则报错 a:追加 文件和文件夹操作 重命名:os.rename 可以重命名文件也可以重命名文件夹 获取当前目录路径:os.getcwd() 获取目录列表:os.listdir() """