Python生成器、推导式之前襟后裾

发布时间:2019-05-08 22:27:01编辑:auto阅读(1985)

    生成器
    函数体内有yield选项的就是生成器,生成器的本质是迭代器,由于函数结构和生成器结构类似,可以通过调用来判断是函数还是生成器,如下:

    def fun():
        yield "我是生成器"
    print(fun())
    
    # 打印内容如下:
    <generator object fun at 0x0000000002160ED0> 

    生成器的优点就是节省内存.
    Python获取生成器的二种方式:

    • 通过函数获取生成器
    • 通过生成器推导式创建生成器

    通过函数获取生成器

    def fun(): 
        print("fun") 
        yield "生成器" 
    g = fun() 
    print(g)    # 打印函数名查看是否是生成器 
    
    # 打印内容如下:
    <generator object fun at 0x0000000000510ED0> 

    从打印内容可以看出是生成器,但是发现生成器里面的内容没有被打印,那如何打印生成器内容呢?我们可以把生成器理解成迭代器的变异版,所以要打印生成器的内容,与迭代器类似,创建生成器对象后,可以使用生成器.__next__()来打印生成器内容,或者next()、send()等来打印生成器,如下:
    使用.__next__()来打印生成器中的内容:

    def fun(): 
        print("fun") 
        yield "生成器" 
        print("我在生成器的下面") 
    g = fun()       # 创建生成器对象 
    print(g)        # 打印生成器对象 
    print(g.__next__())    # 打印生成器里面的内容 
    
    # 打印内容如下:
    <generator object fun at 0x0000000002200ED0>
    fun 
    生成器 

    从上面的打印结果可以发现yield下面的print语句没有被打印,到yield停止了。

    def fun(): 
        print("fun") 
        yield "生成器1" 
        print("我在生成器1下面") 
        yield "生成器2" 
        print("我在生成器2的下面") 
    g = fun()    # 创建生成器对象 
    print(g.__next__()) 
    print(g.__next__()) 
    
    # 打印内容如下:
    fun 
    生成器1 
    我在生成器1下面 
    生成器2 

    由上面两个事例我们可以看出就是每next一次就执行一次yield上面的代码一次,yield下面的代码不会被执行,这就是生成器的惰性机制。
    下面使用next()打印生成器内容:

    def fun(): 
        print("fun") 
        yield "生成器" 
        print("我在生成器下面") 
        yield "生成器2" 
        print("我在生成器2的下面") 
    g = fun() 
    print(next(g)) # next(g)打印生成器内容 
    print(next(g)) # next(g)打印生成器内容 
    
    # 打印内容如下:
    fun 
    生成器 
    我在生成器下面 
    生成器2 

    与.__next__()功能类似
    在使用send(参数)打印生成器内容:
    send方法可以给上一层的yield传递一个值,如果上一个yield没有值的话send的参数将被忽略,如果有值yield的值将被改变成当前的参数,还有需要注意的地方就是如果send(参数)做为第一次迭代,由于上一层没有yield,所以没有办法传参,会导致出现错误,错误内容如下:
    TypeError: can't send non-None value to a just-started generator
    我们将send(None)作为第一次调用即可,然后在第二次调用时可以传适当的参数如下:

    def fun(): 
        print("fun") 
        val = yield "生成器" 
        print("我在生成器下面") 
        print(val) 
        yield "生成器2" 
        print("我在生成器2的下面") 
        yield "生成器3" 
        print("我在生成器3的下面") 
    g = fun() 
    print(g.send(None)) 
    print(g.send("send")) 
    print(g.send("send2")) 
    
    # 打印内容如下:
    fun 
    生成器 
    我在生成器下面 
    send 
    生成器2 
    我在生成器2的下面 
    生成器3 

    使用for循环打印生成器所有内容。

    def fun(): 
        print("fun") 
        yield "生成器" 
        print("我在生成器下面") 
        yield "生成器2" 
        print("我在生成器2的下面") 
        yield "生成器3" 
        print("我在生成器3的下面") 
    g = fun() # 创建生成器对象 
    for g_buf in g: # 使用for循环打印生成器对象 
        print(g_buf) 
    
    # 打印内容如下
    fun
    生成器
    我在生成器下面
    生成器2
    我在生成器2的下面
    生成器3
    我在生成器3的下面

    yield可以返回任何数据类型,这里以列表为事例:

    def fun(): 
        list_1 = [1,2,3,4,5] 
        yield list_1 # 将整个列表作为返回值传给生成器对象
    g = fun() # 创建生成器对象 
    print(g.__next__()) # 打印生成器对象 
    
    # 打印内容如下:
    [1, 2, 3, 4, 5] 

    如果想要yield从列表中每次返回一个元素可以使用yield from 列表来实现,如下:

    def fun(): 
        list_1 = [1,2,3,4,5] 
        yield from list_1 
    g = fun() # 创建生成器对象 
    print(g.__next__()) # 打印生成器对象内容 
    
    # 打印内容如下:
    1 

    可以发现只打印了列表中的一个元素,可以使用for循环打印所有内容:

    def fun(): 
        list_1 = [1,2,3,4,5] 
        yield from list_1 
    g = fun() 
    for g_buf in g: 
    print(g_buf) 
    
    # 打印内容如下:
    1 
    2 
    3 
    4 
    5 

    相当于执行了5次print(g.__next__())  打印生成器所有内容。


    推导式:
    列表推导式:
    如给list_1列表赋值1-20,常规做法如下:

    list_1 = [] 
    for num in range(20): 
        list_1.append(num) 
    print(list_1) 
    
    # 打印内容如下:
    [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19]

    列表list_1和list_2的推导式如下:

    list_1 = [num for num in range(20)] 
    list_2 = ["Python: %s" % num for num in range(5)]
    print(list_1) 
    print(list_2) 
    
    # 打印内容如下:
    [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19]
    ['Python: 0', 'Python: 1', 'Python: 2', 'Python: 3', 'Python: 4'] 

    列表推导式还可以进行筛选,如下:

    list_1 = [num for num in range(20) if num < 5 or num == 15]
    print(list_1) 
    
    # 打印内容如下:
    [0, 1, 2, 3, 4, 15] 

    升级一点,将一个嵌套列表中以"a"开头和以"h"开头的元素存放在一个空列表中,基础写法如下:

    names = [['abc', 'abb', 'zzz'],["hello","world","xiaoming"]] 
    list_names = [] 
    for name_1 in names: 
        if type(name_1) == list: 
            for name_2 in name_1: 
                if name_2.startswith("a") or name_2.startswith("h"):
                    list_names.append(name_2) 
    print(list_names) 
    
    # 打印内容如下:
    ['abc', 'abb', 'hello']         

    使用列表推导法:

    names = [['abc', 'abb', 'zzz'],["hello","world","xiaoming"]] 
    list_names = [name_2 for name_1 in names if type(name_1) for name_2 in name_1 if name_2.startswith("a") or\ 
    name_2.startswith("h")] 
    
    # 打印内容如下:
    ['abc', 'abb', 'hello'] 

    生成器推导式:
    与列表推导式类似,只不过列表是使用[],生成器推导式使用的是()。

    g_1 = (num for num in range(20)) 
    print(g_1) 
    print(g_1.__next__()) 
    print(g_1.__next__()) 
    
    # 打印内容如下:
    <generator object <genexpr> at 0x00000000026A0ED0>
    0 
    1 

    从打印内容和使用__next__()方法可以看出g_1是列表表达式。
    使用for循环打印生成器对象:

    g_1 = (num for num in range(20)) 
    for num in g_1: 
      print(num) 

    生成器的筛选与列表推导式用法一样,只不过是()。
    如下:过滤1-20内的所有偶数。

    g_1 = (num for num in range(20) if num % 2 == 0) 

    升级:与上面列表推导式升级练法类似。

    names = [['abc', 'abb', 'zzz'],["hello","world","xiaoming"]] 
    list_names = (name_2 for name_1 in names if type(name_1) for name_2 in name_1 if name_2.startswith("a") or\ 
    name_2.startswith("h")) # 创建生成器对象 
    print(list_names) 
    for buf in list_names: 
        print(buf) 
    
    # 打印内容下:
    <generator object <genexpr> at 0x0000000002150ED0> 
    abc 
    abb 
    hello

    生成器表达式和列表推导式的区别:

    • 列表推导式比较耗内存,一次性加载全部数据,生成器表达式几乎不占用内存,使用的时候才分配和使用内存。
    • 得到的值不一样,列表推导式得到的是一个列表全部数据,生成器表达式获取的是一个生成器。

    字典推导式:

    list_1 = ["电视剧","电影"] 
    list_2 = ["上海滩","黄飞鸿"] 
    dict_1 = {list_1[i]:list_2[i] for i in range(len(list_1))} 
    print(dict_1) 
    
    # 打印内容如下:
    {'电视剧': '上海滩', '电影': '黄飞鸿'} 

    集合推导式:
    集合的特点:无序、不重复所以集合推导式自带去重功能。

    list_1 = [1,2,3,4,2,3,5] 
    set_1 = {i for i in list_1} # 集合推导式 
    print(set_1) 
    
    # 打印内容如下:
    {1, 2, 3, 4, 5}

    总结:

    • 推导式有列表推导式、生成器推导式、字典推导式、集合推导式。
    • 生成器表达式:(结果 for 变量 in 可迭代对象 if 条件筛选)
    • 生成器表达式可以直接获取到生成器对象,生成器对象具有惰性,每次只能打印一个生成器内容,可以使用for循环打印生成器所有的内容。

关键字