Python 在字典中将相似的键组合

在Python中，可以使用各种方法将字典中相似的键组合起来，如使用defaultdict，使用一个列表的字典，使用itertools模块和groupby函数。在数据分析中，有时我们需要根据一定的条件将字典中相似的键组合在一起。在本文中，我们将探讨将相似的键组合在字典中的各种方法。

方法1：使用defaultdict

Python的collections模块中的defaultdict类提供了一种方便的方法来组合相似的键。当访问一个新的键时，它会自动初始化一个默认值。

语法

groups = defaultdict(list)
groups[item].append(item)

在这里，collections模块的defaultdict()函数创建了一个最初包含空列表的组。groups[item].append(item)方法使用键（item）来访问与该键链接的列表，并将item添加到该列表中。

groups 字典。

示例

在下面的示例中，我们创建了一个名为 grouped_dict 的defaultdict对象，其默认值为列表。我们遍历每个键值对，并将键添加到grouped_dict中相应的列表中。最后，我们使用dict()函数将defaultdict转换为常规字典。

from collections import defaultdict

def group_keys_defaultdict(keys):
    grouped_dict = defaultdict(list)
    for key in keys:
        grouped_dict[key[0]].append(key)
    return dict(grouped_dict)

keys = [('A', 1), ('B', 2), ('A', 3), ('C', 4), ('B', 5)]
grouped_dict = group_keys_defaultdict(keys)
print(grouped_dict)

输出

{'A': [('A', 1), ('A', 3)], 'B': [('B', 2), ('B', 5)], 'C': [('C', 4)]}

方法2：使用列表的字典

我们可以手动创建一个空字典，并遍历键来通过为每个键创建列表来对它们进行分组。

语法

list_name.append(element)

在这里，append()函数是一个用于在列表末尾添加元素的列表方法。它通过将指定的元素作为新项添加到原始列表中来修改原始列表。

示例

在下面的示例中，我们初始化一个名为grouped_dict的空字典。对于每个键-值对，我们检查字典中是否已经存在该键。如果不存在，我们为该键创建一个空列表作为值。然后，我们将当前键添加到列表中。这样，我们将相似的键进行分组。

def group_keys_dict_of_lists(keys):
    grouped_dict = {}
    for key in keys:
        if key[0] not in grouped_dict:
            grouped_dict[key[0]] = []
        grouped_dict[key[0]].append(key)
    return grouped_dict

keys = [('A', 1), ('B', 2), ('A', 3), ('C', 4), ('B', 5)]
grouped_dict = group_keys_dict_of_lists(keys)
print(grouped_dict)

输出

{'A': [('A', 1), ('A', 3)], 'B': [('B', 2), ('B', 5)], 'C': [('C', 4)]}

方法3：使用Itertools模块的GroupBy函数

我们可以使用Itertools模块的groupby()函数来对相似的键进行分组。它根据一个键函数来对连续的元素进行分组。

语法

list_name.append(element)

这里，append() 函数是一个列表方法，用于将一个元素添加到列表末尾。它通过将指定的元素作为新项来修改原始列表。

itertools.groupby(iterable, key=None)

在这里，可迭代对象可以是任何元素的集合，而key是一个可选参数，用于确定应用的分组准则。如果未传递key参数，则默认值为None。

示例

在下面的示例中，我们首先使用lambda函数作为key函数，根据每个元组的第一个元素对键进行排序。然后，我们使用groupby()函数遍历排序后的键。对于每个分组，将键和分组本身分别存储在单独的变量中。我们将分组转换为列表，并将其与相应的键存储在grouped_dict中。

from itertools import groupby

def group_keys_itertools(keys):
    grouped_dict = {}
    keys.sort(key=lambda x: x[0])
    for key, group in groupby(keys, lambda x: x[0]):
        grouped_dict[key] = list(group)
    return grouped_dict

keys = [('A', 1), ('B', 2), ('A', 3), ('C', 4), ('B', 5)]
grouped_dict = group_keys_itertools(keys)
print(grouped_dict)

结果

{'A': [('A', 1), ('A', 3)], 'B': [('B', 2), ('B', 5)], 'C': [('C', 4)]}

结论

在本文中，我们讨论了如何使用Python中的不同方法将字典中的相似键进行分组。我们实施了三种方法：使用一个 defaultdict ，创建一个列表字典，并利用 itertools 模块中的 groupby() 函数。每种方法都提供了一种实现所需结果的独特方式。通过有效地使用这些方法，您可以有效地分组相似的键并以更有结构的方式组织您的数据。