专栏名称: 马哥Linux运维
马哥linux致力于linux运维培训,连续多年排名第一,订阅者可免费获得学习机会和相关Linux独家实战资料!
目录
相关文章推荐
运维  ·  再见,CDN 巨头:Akamai 宣布 ... ·  3 天前  
51好读  ›  专栏  ›  马哥Linux运维

wtfPython—Python中一些奇妙的代码

马哥Linux运维  · 公众号  · 运维  · 2018-07-02 18:06

正文

来源:
Python网络爬虫与数据挖掘
ID:Datanami

wtfPython是github上的一个项目,作者收集了一些奇妙的Python代码片段,这些代码的输出结果会和我们想象中的不太一样;
通过探寻产生这种结果的内部原因,可以让我们对Python里的一些细节有更广泛的认知。

1.字典键的隐式转换

some_dict = {}
some_dict[5.5] = "Ruby"
some_dict[5.0] = "JavaScript"
some_dict[5] = "Python"

输出如下:

>>> some_dict
{5.0: "Python", 5.5: "Ruby"}
>>> some_dict[5.5]
"Ruby"
>>> some_dict[5.0]
"Python"
>>> some_dict[5]
"Python"

原因:

Python的字典键的比较是通过哈希值来比较的
在Python里如果两个不可变对象的值相等,那他们的哈希也是一样的
因此此处hash(5) == hash(5.0)是True的,所以键被隐式的转换了

2.生成器执行时间的差异

array = [1, 8, 15]
g = (x for x in array if array.count(x) > 0)
array = [2, 8, 22]

输出:

>>> print(list(g))
[8]

原因

在一个生成器表达式里,in的操作是在声明时求值的,而if是在运行期求值的
所以在运行期之前,array已经被重新分配成了[2,8,22],x的值也是2,8,22

3.在列表迭代式删除item

list_1 = [1, 2, 3, 4]
list_2 = [1, 2, 3, 4]
list_3 = [1, 2, 3, 4]
list_4 = [1, 2, 3, 4]
for idx, item in enumerate(list_1):
   del item
for idx, item in enumerate(list_2):
   list_2.remove(item)
for idx, item in enumerate(list_3[:]):
   list_3.remove(item)
for idx, item in enumerate(list_4):
   list_4.pop(idx)

输出:

>>> list_1
[1, 2, 3, 4]
>>> list_2
[2, 4]
>>> list_3
[]
>>> list_4
[2, 4]

原因

其实只有list3才算是合格的写法,对一个正在迭代的对象进行修改并不是一个很好的选择,正确的做法应该是建立一份该对象的拷贝来进行迭代
对于list1,del item删除的只是item变量而不是变量指向的数据,对列表本身没有影响
对于list2和list4,因为列表的迭代是根据索引来的,第一次删掉了索引为0的1,剩下[2, 3, 4],然后移除索引 1(此时为3),剩下了[2, 4],此时只有2个元素,循环结束

4.else的不同处理

对于循环的else

def does_exists_num(l, to_find):
     for num in l:
         if num == to_find:
             print("Exists!")
             break
     else:
         print("Does not exist")

输出:

>>> some_list = [1, 2, 3, 4, 5]
>>> does_exists_num(some_list, 4)
Exists!
>>> does_exists_num(some_list, -1)
Does not exist

对于try的else

try:
   pass
except:
   print("Exception occurred!!!")
else:
   print("Try block executed successfully...")

输出:

Try block executed successfully...

原因

循环后的else只会在经过了所有迭代且没有出现break的时候才会执行
一个try模块后的else会在try里的代码成功执行完后去执行

5.python里的is

>>> a = 256
>>> b = 256
>>> a is b
True
>>> a = 257
>>> b = 257
>>> a is b
False

原因

is和==是不一样的;is判断的是两个对象是否是同一个对象,而==判断的是两个对象的值是否相等;即is是既要值相等又要引用一致
在Python中-5~256因为被经常使用所以被设计成固定存在的对象

6.循环里的局部变量泄露

代码段1

for x in range(7):
   if x == 6:
       print(x, ': for x inside loop')
print(x, ': x in global')

输出:

6 : for x inside loop
6 : x in global

代码段2

# This time let's initialize x first
x = -1
for x in range(7):
   if x == 6:
       print(x, ': for x inside loop')
print(x, ': x in global')

输出:

6 : for x inside loop6 : x in global

代码段3

x = 1
print([x for x in range(5)])
print(x, ': x in global')

在Python2.x里的输出:

[0, 1, 2, 3, 4](4, ': x in global')

在Python3.x里的输出:

[0, 1, 2, 3, 4]1 : x in global

原因

对于代码段1,在Python中,for循环可以使用包含他们的命名空间的变量,并将他们自己定义的循环变量保存下来;* 对于代码段2,如果我们在全局命名空间里显示定义for循环变量,则循环变量会重新绑定到现有变量上。
对于代码段3,在Python3.x中改变了对列表解析的语法形式;Python2.x中,列表解析的语法形式为:[… for var in item1, item2, …];而Python3.x的列表解析式为:[… for var in (item1, item2, …)],这种情况下不会发生循环变量的泄露

7.+和+=的区别

代码段1

a = [1, 2, 3, 4]
b = a
a = a + [5, 6, 7, 8]

输出:

>>> a
[1, 2, 3, 4, 5, 6, 7, 8]
>>> b
[1, 2, 3, 4]

代码段2

a = [1, 2, 3, 4]
b = a
a += [5, 6, 7, 8]

输出:

>>> a
[1, 2, 3, 4, 5, 6, 7, 8]
>>> b
[1, 2, 3, 4, 5, 6, 7, 8]

原因

a = a + b的操作生成了一个新的对象并建立了一个新的引用
a += b是在a这个列表上做extend操作

8.关于try—finally里的return

def some_func():
   try:
       return 'from_try'
   finally:
       return 'from_finally'

输出:

>>> some_func()







请到「今天看啥」查看全文