什么是 Python 中的 Pickling 和 Unpickling?

简介

在 Python 中，我们经常需要对对象进行序列化和反序列化，以实现数据的存储和传输。其中，Pickling 和 Unpickling 就是 Python 中最常见的序列化和反序列化方式。Pickling（打包）是将 Python 对象序列化为二进制格式，Unpickling（解包）则是将该二进制数据反序列化为 Python 对象。本文将详细介绍 Pickling 和 Unpickling 的原理和使用方法。

Pickling

使用 Pickling 将 Python 对象序列化为二进制格式，方便进行数据存储和传输，常见的使用场景有：

缓存数据：将数据缓存到文件或数据库中，下次使用时直接从缓存中读取，避免重新生成数据；
进程间通信：子进程将数据序列化后通过队列传递给父进程进行处理；
网络传输：将数据序列化后通过网络传输给其他机器。

Pickling 使用的是 pickle 模块，可以将 Python 的任何对象序列化。下面是一个简单的示例代码：

import pickle

data = {'name': 'Eric', 'age': 20, 'gender': 'male'}
data_serialized = pickle.dumps(data)

with open('data.pkl', 'wb') as f:
    f.write(data_serialized)

上述代码中，我们定义了一个字典 data 并使用 pickle.dumps 将其序列化为二进制格式，然后将序列化后的数据存储到文件中，使用的是文件流 with open('data.pkl', 'wb') as f，其中 'wb' 表示写二进制数据。执行上述代码后，会生成一个名为 data.pkl 的文件，保存了序列化后的数据。我们可以使用以下代码将其反序列化：

with open('data.pkl', 'rb') as f:
    data_deserialized = pickle.load(f)

print(data_deserialized)

上述代码中，我们使用 pickle.load 从文件中读取序列化后的数据，并将其反序列化为 Python 对象。然后打印出反序列化后的 Python 对象。执行以下代码后，会输出字典 data：

{'name': 'Eric', 'age': 20, 'gender': 'male'}

Unpickling

使用 Unpickling 将二进制格式的数据反序列化为 Python 对象。常见的使用场景是对之前使用 Pickling 序列化的数据进行反序列化，例如从文件或网络中读取数据。下面是一个简单的示例代码：

import pickle

with open('data.pkl', 'rb') as f:
    data_deserialized = pickle.load(f)

print(data_deserialized)

上述代码中，我们打开 data.pkl 文件，并使用 pickle.load 将其反序列化为 Python 对象，然后打印输出。这个文件在之前的 Pickling 中已经生成过了。执行以上代码，会输出字典 data：

{'name': 'Eric', 'age': 20, 'gender': 'male'}

注意事项

在使用 Pickling 和 Unpickling 的过程中需要注意以下几点：

操作系统的限制：某些操作系统可能不支持序列化对象，例如 Windows 中的文件句柄和网络套接字。
Python 版本兼容：不同版本的 Python 可能不兼容，序列化的 Python 对象只能在同一版本的 Python 中进行反序列化。
安全风险：不要从不信任的来源反序列化数据，这可能导致严重的安全漏洞和攻击。

结论

在本文中，我们介绍了 Python 中 Pickling 和 Unpickling 的原理和使用方法。通过 Pickling，我们可以将 Python 对象序列化为二进制格式，方便进行数据存储和传输；通过 Unpickling，我们可以将之前序列化的数据反序列化为 Python 对象。同时，我们也需要注意使用 Pickling 和 Unpickling 的时候需要考虑操作系统、Python 版本兼容和安全风险等问题。了解和掌握 Pickling 和 Unpickling 对于 Python 开发人员来说是非常重要的。