python函数——pickle中的dump以及load

时间:2022-07-24
本文章向大家介绍python函数——pickle中的dump以及load,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

0.前言

最近在看一些深度学习的开源代码,发现很多作者使用pickle模块,查了一些资料,与之相关的解释说是序列化反序列化,通俗一点来说就相对于游戏中的存档读档

1. Pickle

Pickle模块将任意一个Python对象转换成一系统字节。 Pickle模块有2个常用的函数方法,一个叫做dump(),另一个叫做load() dump()就是序列化操作,也就是存档 load()就是反序列化操作,也就是读档 下面一一介绍

2. dump()-序列化-存档

2.1 dump语法

Code.2.1 dump()语法

>>>import pickle
>>>pickle.dump(对象, 文件,[使用协议])

对象:就是你要存的东西,类型可以是list、string以及其他任何类型 文件:就是要将对象存储的目标文件 使用协议:有3种,索引0为ASCII,1是旧式2进制,2是新式2进制协议,不同之处在于后者更高效一些,默认的话dump方法使用0做协议。

2.2 示例

Code.2.2 dump()示例 部分代码

tokenizer = Tokenizer()
tokenizer.fit_on_texts(train[0] + train[1] + dev[0] + dev[1] + test[0] + test[1])
with open('./new_tokenizer_v5.pickle', 'wb') as handle:
	pickle.dump(tokenizer, handle)

上面代码主要看最后一行,就是将tokenizer对象存储至new_tokenizer_v5.pickle文件中

3. load()-反序列化-读档

3.1 load 语法

Code.3.1 load()语法

pickle.load(文件)

3.2 load 示例

Code.3.2 load()示例 部分代码

tokenizer = pickle.load(open('./new_tokenizer_v5.pickle', 'rb'))