一、排序算法
排序也是在程序中经常用到的算法。无论使用冒泡排序还是快速排序,排序的核心是比较两个元素的大小。如果是数字,我们可以直接比较,但如果是字符串或者两个dict呢?直接比较数学上的大小是没有意义的,因此,比较的过程必须通过函数抽象出来。
Python内置的sorted()函数就可以对list进行排序:
1 2 |
>>> sorted([36, 5, -12, 9, -21]) [-21, -12, 5, 9, 36] |
此外,sorted()函数也是一个高阶函数,它还可以接收一个key函数来实现自定义的排序,例如按绝对值大小排序:
1 2 |
>>> sorted([36, 5, -12, 9, -21], key=abs) [5, 9, -12, -21, 36] |
key指定的函数将作用于list的每一个元素上,并根据key函数返回的结果进行排序。对比原始的list和经过key=abs
处理过的list:
1 2 |
list = [36, 5, -12, 9, -21] keys = [36, 5, 12, 9, 21] |
然后sorted()函数按照keys进行排序,并按照对应关系返回list相应的元素,如下:
1 2 3 |
keys排序结果 => [5, 9, 12, 21, 36] | | | | | 最终结果 => [5, 9, -12, -21, 36] |
我们再看一个字符串排序的例子:
1 2 |
>>> sorted(['bob', 'about', 'Zoo', 'Credit']) ['Credit', 'Zoo', 'about', 'bob'] |
默认情况下,对字符串排序,是按照ASCII的大小比较的,由于'Z' < 'a'
,结果,大写字母Z
会排在小写字母a
的前面。
现在,我们提出排序应该忽略大小写,按照字母序排序。要实现这个算法,不必对现有代码大加改动,只要我们能用一个key函数把字符串映射为忽略大小写排序即可。忽略大小写来比较两个字符串,实际上就是先把字符串都变成大写(或者都变成小写),再比较。
这样,我们给sorted传入key函数,即可实现忽略大小写的排序:
1 2 |
>>> sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower) ['about', 'bob', 'Credit', 'Zoo'] |
要进行反向排序,不必改动key函数,可以传入第三个参数reverse=True
:
1 2 |
>>> sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower, reverse=True) ['Zoo', 'Credit', 'bob', 'about'] |
从上述例子可以看出,高阶函数的抽象能力是非常强大的,而且,核心代码可以保持得非常简洁。
二、对列表和字典进行排序
2.1 sorted()对列表进行排序
假设我们用一组tuple表示学生名字和成绩:
1 |
>>> L = [('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)] |
首先按照学生名字进行排序:
1 2 3 4 5 6 7 |
# 定义处理tuple的函数; >>> def SortName(x): ... return x[0] # 把函数传给sorted,实现自定义排序; >>> sorted(L, key=SortName) [('Adam', 92), ('Bart', 66), ('Bob', 75), ('Lisa', 88)] |
很好理解,sorted接收一个可迭代对象并会进行迭代处理。然后把迭代的value都传给key函数进行处理,并且会以key函数处理的结果作为排序条件。所以我们在SortName函数中直接把每组信息处理一下,只返回名字,所以sorted就会以名字进行排序。
如果函数比较简单,可以直接使用匿名函数(lambda),如下:
1 2 |
>>> sorted(L, key=lambda x: x[0]) [('Adam', 92), ('Bart', 66), ('Bob', 75), ('Lisa', 88)] |
同样也可以按分数进行降序:
跟上面的题目大同小异,取值时,索引位置变更一下就好了。
1 2 |
>>> sorted(L, key=lambda x: x[-1], reverse=True) [('Adam', 92), ('Lisa', 88), ('Bob', 75), ('Bart', 66)] |
2.3 sorted()对字典进行排序
同样,假如我们用一组字典表示学生名字和成绩:
1 |
>>> D = {'Bob':75, 'Adam':92, 'Bart':66, 'Lisa':88} |
然后需要对学生成绩进行排序。首先sorted可以接收可迭代对象,如果我们直接把D.values()传过去,那么虽然可以排序但是无法获得对应学生的名称。
1 2 |
>>> sorted(D.values(), reverse=True) [92, 88, 75, 66] |
所以我们可以使用字典的items()方法,会得到下面数据结构:
1 2 |
>>> D.items() dict_items([('Adam', 92), ('Bob', 75), ('Bart', 66), ('Lisa', 88)]) |
这个数据结构就跟我们上一个示例的一样了。所以处理方法也一样了。
1 2 |
>>> sorted(D.items(), key=lambda x: x[-1] ,reverse=True) [('Adam', 92), ('Lisa', 88), ('Bob', 75), ('Bart', 66)] |
如果想把这个结果print出来,直接for循环解构就可以了:
1 2 3 4 5 6 7 |
>>> for name,score in sorted(D.items(), key=lambda x: x[-1] ,reverse=True): ... print('{} => {}'.format(name,score)) ... Adam => 92 Lisa => 88 Bob => 75 Bart => 66 |
这里D.items方法得到的tuple被解构,分别赋值name和score参数。