Dill：Python中增強版的pickle

作者：費弗里 2022-09-21 10:50:43

通常我們都是用標準庫pickle進行這項操作，但其功能單一，且針對很多常見的Python對象如lambda函數無法進行序列化。而今天我要給大家介紹的庫dill就可以看作增強版的pickle。

大家好我是費老師，相信不少讀者朋友們都在Python?中利用pickle?進行過序列化操作，而所謂的序列化，指的是將程序運行時在內存中產生的變量對象，轉換為二進制類型的易存儲可傳輸數據的過程，相反地，從序列化結果解析還原為Python變量就叫做反序列化。

通常我們都是用標準庫pickle?進行這項操作，但其功能單一，且針對很多常見的Python?對象如lambda?函數無法進行序列化。而今天費老師我要給大家介紹的庫dill?就可以看作增強版的pickle。

使用dill實現更豐富的序列化/反序列化操作

作為第三方庫，我們使用pip install dill?完成安裝后，就可以使用它來代替pickle了：

基礎使用

dill?的基礎使用與pickle?一樣，使用dump/dumps?進行序列化操作，load/loads進行反序列化操作，下面是一些基本的例子，我們對一些常見的對象進行序列化/反序列化操作：

import dill
import numpy as np

demo_int = 999

demo_float = 0.99

demo_dict = {'a': 999}

demo_array = np.random.rand(2, 2)

# 序列化并寫出到pkl文件
with open('./demo.pkl', 'wb') as d:
    dill.dump(
        [demo_int, demo_float, demo_dict, demo_array],
        d
    )

從寫出的demo.pkl文件中還原對象：

# 序列化并寫出到pkl文件
with open('./demo.pkl', 'rb') as d:
    restore_demo = dill.load(d)

restore_demo

增強功能

看完了dill?的基礎用法，下面我們來介紹其相對于pickle進行增強的特殊功能：

對lambda函數進行序列化

pickle?可以對常規的函數進行序列化，但針對lambda?函數則會報錯，而使用dill就可以正常序列化：

保存解釋器的會話狀態

dill?中另一項很實用的功能則是其支持將當前解釋器的會話狀態整個打包保存和還原，譬如下面的例子，利用dill.dump_session()?保存當前解釋器會話狀態，在另一個獨立的py?腳本中再利用dill.load_session()就可以一步到位全部還原：

從序列化結果中還原源碼

dill?中另一個很強大的功能是其source?模塊可以從序列化結果中還原對象的源碼，這在序列化的對象為函數時非常實用（注意目前此功能不可以在ipykernel?中執行，因此下面的例子使用魔術命令直接執行外部py腳本）：

除此之外，dill?還有很多其他豐富的功能，感興趣的讀者朋友可以前往其官方文檔（https://dill.readthedocs.io/en/latest/dill.html）了解更多。

責任編輯：趙寧寧來源： Python大數據分析