python函数——pickle中的dump以及load

0.前言

最近在看一些深度学习的开源代码，发现很多作者使用pickle模块，查了一些资料，与之相关的解释说是序列化与反序列化，通俗一点来说就相对于游戏中的存档和读档

1. Pickle

Pickle模块将任意一个Python对象转换成一系统字节。 Pickle模块有2个常用的函数方法，一个叫做dump()，另一个叫做load() dump()就是序列化操作，也就是存档 load()就是反序列化操作，也就是读档下面一一介绍

2. dump()-序列化-存档

2.1 dump语法

Code.2.1 dump()语法

>>>import pickle
>>>pickle.dump(对象, 文件，[使用协议])

对象：就是你要存的东西，类型可以是list、string以及其他任何类型文件：就是要将对象存储的目标文件 使用协议：有3种，索引0为ASCII，1是旧式2进制，2是新式2进制协议，不同之处在于后者更高效一些，默认的话dump方法使用0做协议。

2.2 示例

Code.2.2 dump()示例部分代码

tokenizer = Tokenizer()
tokenizer.fit_on_texts(train[0] + train[1] + dev[0] + dev[1] + test[0] + test[1])
with open('./new_tokenizer_v5.pickle', 'wb') as handle:
	pickle.dump(tokenizer, handle)

上面代码主要看最后一行，就是将tokenizer对象存储至new_tokenizer_v5.pickle文件中

3. load()-反序列化-读档

3.1 load 语法

Code.3.1 load()语法

pickle.load(文件)

3.2 load 示例

Code.3.2 load()示例部分代码

tokenizer = pickle.load(open('./new_tokenizer_v5.pickle', 'rb'))