Глубокая копия диктата в питоне

342

Я хотел бы сделать глубокую копию dictв Python. К сожалению, .deepcopy()метод не существует для dict. Как я могу это сделать?

>>> my_dict = {'a': [1, 2, 3], 'b': [4, 5, 6]}
>>> my_copy = my_dict.deepcopy()
Traceback (most recent calll last):
  File "<stdin>", line 1, in <module>
AttributeError: 'dict' object has no attribute 'deepcopy'
>>> my_copy = my_dict.copy()
>>> my_dict['a'][2] = 7
>>> my_copy['a'][2]
7

Последняя строка должна быть 3.

Я хотел бы, чтобы изменения my_dictне влияли на снимок my_copy.

Как я могу это сделать? Решение должно быть совместимо с Python 3.x.

Оливье Грегуар
источник
3
Я не знаю, является ли это дубликатом, но это: stackoverflow.com/questions/838642/python-dictionary-deepcopy очень близко.
charleslparker

Ответы:

474

Как насчет:

import copy
d = { ... }
d2 = copy.deepcopy(d)

Python 2 или 3:

Python 3.2 (r32:88445, Feb 20 2011, 21:30:00) [MSC v.1500 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import copy
>>> my_dict = {'a': [1, 2, 3], 'b': [4, 5, 6]}
>>> my_copy = copy.deepcopy(my_dict)
>>> my_dict['a'][2] = 7
>>> my_copy['a'][2]
3
>>>
Лассе В. Карлсен
источник
16
Действительно, это работает для упрощенного примера, который я привел. Мои ключи не цифры, а объекты. Если я читаю документацию модуля копирования, я должен объявить метод __copy __ () / __ deepcopy __ () для ключей. Большое спасибо за то, что привели меня туда!
Оливье Грегуар
3
Есть ли разница в кодах Python 3.2 и 2.7? Они кажутся мне идентичными. Если это так, то лучше всего один блок кода и выражение «Работает как для Python 3, так и для 2»
MestreLion
30
Стоит также упомянуть, copy.deepcopyчто не является потокобезопасным. Узнал это трудным путем. С другой стороны, в зависимости от вашего варианта использования, json.loads(json.dumps(d)) является потокобезопасным и работает хорошо.
ограбить
1
@rob, вы должны опубликовать этот комментарий в качестве ответа. Это жизнеспособная альтернатива. Нюанс безопасности ниток является важным отличием.
BuvinJ
3
@BuvinJ Проблема в том json.loads, что проблема не решается во всех случаях, когда dictатрибуты python не сериализуемы в JSON. Это может помочь тем, кто имеет дело только с простыми структурами данных, например, из API, но я не думаю, что этого решения достаточно, чтобы полностью ответить на вопрос ОП.
ограбить
36

dict.copy () - функция поверхностного копирования для словаря.
id - встроенная функция, которая дает вам адрес переменной.

Для начала нужно понять "почему именно эта проблема происходит?"

In [1]: my_dict = {'a': [1, 2, 3], 'b': [4, 5, 6]}

In [2]: my_copy = my_dict.copy()

In [3]: id(my_dict)
Out[3]: 140190444167808

In [4]: id(my_copy)
Out[4]: 140190444170328

In [5]: id(my_copy['a'])
Out[5]: 140190444024104

In [6]: id(my_dict['a'])
Out[6]: 140190444024104

Адрес списка, присутствующего в обоих словах для ключа «а», указывает на то же место.
Поэтому, когда вы меняете значение списка в my_dict, список в my_copy также изменяется.


Решение для структуры данных, упомянутых в вопросе:

In [7]: my_copy = {key: value[:] for key, value in my_dict.items()}

In [8]: id(my_copy['a'])
Out[8]: 140190444024176

Или вы можете использовать Deepcopy, как указано выше.

theBuzzyCoder
источник
4
Ваше решение не работает для вложенных словарей. по этой причине предпочтительнее глубокое копирование.
Чарльз Плагер
2
@CharlesPlager Согласен! Но вы также должны заметить, что нарезка списка не работает на dict value[:]. Решение было для конкретной структуры данных, упомянутой в вопросе, а не универсальным решением.
theBuzzyCoder
17

Python 3.x

из копии импортировать Deepcopy

my_dict = {'one': 1, 'two': 2}
new_dict_deepcopy = deepcopy(my_dict)

Без глубокого копирования я не могу удалить словарь имени хоста из словаря моего домена.

Без глубокой копии я получаю следующую ошибку:

"RuntimeError: dictionary changed size during iteration"

... когда я пытаюсь удалить нужный элемент из моего словаря внутри другого словаря.

import socket
import xml.etree.ElementTree as ET
from copy import deepcopy

домен является объектом словаря

def remove_hostname(domain, hostname):
    domain_copy = deepcopy(domain)
    for domains, hosts in domain_copy.items():
        for host, port in hosts.items():
           if host == hostname:
                del domain[domains][host]
    return domain

Пример вывода: [orginal] domains = {'localdomain': {'localhost': {'all': '4000'}}}

[новые] домены = {'localdomain': {}}}

Так что здесь происходит, я перебираю копию словаря, а не сам словарь. С помощью этого метода вы можете удалять элементы по мере необходимости.

xpros
источник
-3

Я люблю и многому научился у Лассе В. Карлсена. Я изменил его в следующем примере, который хорошо показывает разницу между мелкими копиями словаря и глубокими копиями:

    import copy

    my_dict = {'a': [1, 2, 3], 'b': [4, 5, 6]}
    my_copy = copy.copy(my_dict)
    my_deepcopy = copy.deepcopy(my_dict)

Теперь, если вы измените

    my_dict['a'][2] = 7

и делай

    print("my_copy a[2]: ",my_copy['a'][2],",whereas my_deepcopy a[2]: ", my_deepcopy['a'][2])

ты получаешь

    >> my_copy a[2]:  7 ,whereas my_deepcopy a[2]:  3
Рафаэль Монтейро
источник
1
Как вы думаете, почему этот ответ отличается от ответа Лассе В. Карлсена ? Что это добавляет, что другой ответ не говорит?
Оливье Грегуар
Привет, Оливье! Я не пытаюсь воспользоваться заслугой ответа Лассе В. Карлсена - он по сути решил мою проблему, и я в долгу перед ним. Мой комментарий не отличается, он просто дополняет. По той простой причине, что он противопоставляет «копию» «глубокой копии». Это было источником моей проблемы, потому что я ошибался, когда использовал их эквивалентным образом. Приветствия.
Рафаэль Монтейро
-9

Более простое (на мой взгляд) решение - создать новый словарь и обновить его содержимым старого:

my_dict={'a':1}

my_copy = {}

my_copy.update( my_dict )

my_dict['a']=2

my_dict['a']
Out[34]: 2

my_copy['a']
Out[35]: 1

Проблема с этим подходом в том, что он может быть недостаточно глубоким. то есть не рекурсивно глубоко. достаточно для простых объектов, но не для вложенных словарей. Вот пример, где это может быть недостаточно глубоко:

my_dict1={'b':2}

my_dict2={'c':3}

my_dict3={ 'b': my_dict1, 'c':my_dict2 }

my_copy = {}

my_copy.update( my_dict3 )

my_dict1['b']='z'

my_copy
Out[42]: {'b': {'b': 'z'}, 'c': {'c': 3}}

Используя Deepcopy (), я могу исключить полумелое поведение, но я думаю, что нужно решить, какой подход подходит для вашего приложения. В большинстве случаев вам может быть все равно, но следует помнить о возможных подводных камнях ... последний пример:

import copy

my_copy2 = copy.deepcopy( my_dict3 )

my_dict1['b']='99'

my_copy2
Out[46]: {'b': {'b': 'z'}, 'c': {'c': 3}}
Эрик Хоффман
источник
12
Это делает мелкую копию диктата, который не тот, о котором спрашивал спрашивающий. Объекты, которые он содержит, сами не копируются. И более простой способ поверхностного копирования my_dict.copy()!
Blckknght