您现在的位置是:亿华云 > 域名
深入Python中的 Collections 模块
亿华云2025-10-03 11:52:26【域名】8人已围观
简介collections模块是一个不用不知道,一用就上瘾的模块。这里主要介绍OrderedDict类、defaultdict类、Counter类、namedtuple类和deque类。collectio
collections模块是深入一个不用不知道,一用就上瘾的深入模块。这里主要介绍OrderedDict类、深入defaultdict类、深入Counter类、深入namedtuple类和deque类。深入
collections
collections的深入常用类型有:
计数器(Counter) 双向队列(deque) 默认字典(defaultdict) 有序字典(OrderedDict) 可命名元组(namedtuple)Counter
计数器(counter)以字典的形式返回序列中各个字符出现的次数,值为key,深入次数为value
Counter是深入对字典类型的补充,用于追踪值得出现次数 。深入
import collections counter = collections.Counter("My name is Runsen") print(counter)输出如下
Counter({ : 3,深入 n: 3, e: 2, s: 2, M: 1, y: 1, a: 1, m: 1, i: 1, R: 1, u: 1})取得元素重复次数的值
print(counter[ ]) 3elements()取得计数器中的所有元素。
注:此处非所有元素集合,深入而是深入包含所有元素集合的迭代器.
counter = collections.Counter(abcabcabcdabcdef) print(counter) # 输出如下 Counter({ a: 4, b: 4, c: 4, d: 2, e: 1, f: 1}) print(counter.elements()) # 输出如下 <itertools.chain object at 0x0000025B1477BF98> print(list(counter.elements())) # 输出如下 [a, a, a, a, b, b, b, b, c, c, c, c, d, d, e, f]将Counter按照value从大到小排列,获取前N个元素,深入需要使用函数most_common
# most_common(N)数量从大到小排列,深入获取前N个元素 print(counter.most_common(3)) # 输出如下 [(a, 4), (b, 4), (c, 4)]sorted将Counter中的key进行排序,返回的是所有key的列表
# sorted()列出所有不同的元素并排序 print(sorted(counter)) # 输出如下 [a, b, c, d, e, f]将Counter转换成字符串,字符串的云服务器join方法可以解决。注意不是原来的模样。
# 转换成字符串 print(.join(counter.elements())) # aaaabbbbccccddef print(.join(list(counter.elements())))update()更新计数器,其实在原本的counter更新计数器,如果原来没有,则新建key,如果有value则加一
# update()更新计数器, d = collections.Counter(a) counter.update(d) print(counter) # 输出如下 Counter({ a: 5, b: 4, c: 4, d: 2, e: 1, f: 1})update()更新计数器,那么subtract()相减计数器的values,即原来的计数器中的每一个元素的数量减去后添加的元素的数量
counter.subtract(abdabcabcg) print(counter) # 输出如下 Counter({ a: 2, c: 2, b: 1, d: 1, e: 1, f: 1, g: -1})deque
deque支持从任意一端增加和删除元素。更为常用的两种结构,就是栈和队列。
deque的常见操作
#定义一个空的双向队列 d = collections.deque() #从右端增加元素 d.extend("Runsen") d.append("Maoli") d.append("Python") d.append("king") #从左端增加元素 d.appendleft(left) print(d) # 输出如下 (注意:extend和append的区别) deque([left, R, u, n, s, e, n, Maoli, Python, king]) # reverse()反转队列 print(d.reverse()) d.reverse() print(d) # 输出如下 None deque([king, Python, Maoli, n, e, s, n, u, R, left]) d.reverse() d.extend([qq,ww,ee]) print(d) # deque([left, R, u, n, s, e, n, Maoli, Python, king, qq, ww, ee]) # count()计数 print(d.count(R)) # 输出如下 1 # clear()清空队列 d.clear() print(d) # 输出如下 deque([]) # index()取得元素下标 print(d.index(Maoli)) # 输出如下 7 # insert()指定位置插入元素 d.insert(1,Runsen) print(d) # deque([left, Runsen,R, u, n, s, e, n, Maoli, Python, king, qq, ww, ee])OrderedDict
使用dict时要保持Key的顺序,可以用OrderedDict。
from collections import OrderedDict dic = OrderedDict() dic[k1] = v1 dic[k2] = v2 dic[k3] = v3 print(dic) # 输出如下 OrderedDict([(k1, v1), (k2, v2), (k3, v3)]) # 字典所有的键 print(dic.keys()) # 输出如下 odict_keys([k1, k2, k3]) # 字典所有值 print(dic.values()) # 输出如下 odict_values([v1, v2, v3]) # items() 方法以列表返回可遍历的(键, 值) 元组数组 print(dic.items()) # 输出如下 odict_items([(k1, v1), (k2, v2), (k3, v3)]) #pop()方法,删除指定的键值 dic.pop(k1) print(dic) # 输出如下 OrderedDict([(k2, v2), (k3, v3)]) #popitem()方法,香港云服务器默认删除字典最后一个元素 dic.popitem() print(dic) # 输出如下 OrderedDict([(k2, v2)]) # update()更新字典 dic.update({ k1:v1111,k10:v10}) print(dic) # 输出如下 OrderedDict([(k2, v2), (k1, v1111), (k10, v10)])OrderedDict和字典操作完全相同,区别在于OrderedDict的Key会按照插入的顺序排列,不是Key本身排序
>>> from collections import OrderedDict >>> d = dict([(a, 1), (b, 2), (c, 3)]) >>> d # dict的Key是无序的 { a: 1, c: 3, b: 2} >>> od = OrderedDict([(a, 1), (b, 2), (c, 3)]) >>> od # OrderedDict的Key是有序的 OrderedDict([(a, 1), (b, 2), (c, 3)])defaultdict
在使用字典的时候, 如果在使用不存在的key的时候发生KeyError这样的一个报错, 这时候就该defaultdict登场了。
defaultdict接受一个工厂函数作为参数来构造:dict =defaultdict( factory_function)这个factory_function可以是list、set、str等等,作用是当key不存在时,返回的是工厂函数的默认值,比如list对应[ ],str对应的是空字符串,set对应set( ),int对应0,如下举例:
from collections import defaultdict dict1 = defaultdict(int) dict2 = defaultdict(set) dict3 = defaultdict(str) dict4 = defaultdict(list) dict1[2] =two print(dict1[1]) print(dict2[1]) print(dict3[1]) print(dict4[1]) # 输出如下 0 set() []defaultdict类接受类型名称作为初始化函数的高防服务器参数,这样使得默认值的取值更加灵活。
s = mynameisrunsen d = collections.defaultdict(int) for k in s: d[k] += 1 print(d) # 输出如下 defaultdict(<class int>, { m: 2, y: 1, n: 3, a: 1, e: 2, i: 1, s: 2, r: 1, u: 1})练习有如下值集合 [11,22,33,44,55,66,77,88,99,99]。
下面将所有大于 55的值保存至字典的第一个key中,将小于 55 的值保存至第二个key的值中。
下面通过defaultdict默认字典对列表进行划分。
all_list = [11,22,33,44,55,66,77,88,99] dic = collections.defaultdict(list) for i in all_list: if i > 55: dic[k1].append(i) else: dic[k2].append(i) print(dic) # 输出如下 defaultdict(<class list>, { k2: [11, 22, 33, 44, 55], k1: [66, 77, 88, 99]})也可以使用字典,具体代码如下。
all_list = [11,22,33,44,55,66,77,88,99] dic = { } for i in all_list: if i > 55: if "k1" in dic.keys(): dic[k1].append(i) else: dic[k1] = [i,] else: if "k2" in dic.keys(): dic[k2].append(i) else: dic[k2] = [i,] print(dic) # 输出如下 { k2: [11, 22, 33, 44, 55], k1: [66, 77, 88, 99]}namedtuple
namedtuple是用来创建一个自定义的tuple对象,并且规定了tuple元素的个数,并可以用属性而不是索引来引用tuple的某个元素。
使用命名元组的步骤:
# 将元组封装为一个类,可以通过字段名(属性名)来访问元组中的值 # 支持元组的所有操作 from collections import namedtuple # 1、定义一个类 Runsen = namedtuple(Runsen, [name,sex,age]) # 2、创建对象 runsen = Runsen("Runsen", "帅男", 21) # 3、获取命名元组的值 print(runsen[1]) # 支持元组的索引取值 print(runsen[-2:]) # 支持切片 print(runsen.name) # 支持通过字段名来取值 # _fields,获取命名元组的所有属性名 print(runsen._fields) # _asdict方法,将元组转化为字典 print(runsen._asdict()) # 输出如下 帅男 (帅男, 21) Runsen (name, sex, age) OrderedDict([(name, Runsen), (sex, 帅男), (age, 21)])本文已收录 GitHub,传送门~[1] ,里面更有大厂面试完整考点,欢迎 Star。
Reference
[1]传送门~:
https://github.com/MaoliRUNsen/runsenlearnpy100
很赞哦!(78)