Ассоциативность «in» в Python?

107

Я делаю парсер Python, и это меня действительно сбивает с толку:

>>>  1 in  []  in 'a'
False

>>> (1 in  []) in 'a'
TypeError: 'in <string>' requires string as left operand, not bool

>>>  1 in ([] in 'a')
TypeError: 'in <string>' requires string as left operand, not list

Как именно "in" работает в Python в отношении ассоциативности и т.д.?

Почему никакие два из этих выражений не ведут себя одинаково?

пользователь541686
источник
6
Вы, вероятно, столкнулись с поведением, описанным здесь: docs.python.org/reference/expressions.html#not-in , тот, который позволяет вам писать if a < b < c:и работать интуитивно
millimoose
3
@millimoose: Да, я просто никогда не думал об inоператоре "сравнения", наверное. : \
user541686

Ответы:

123

1 in [] in 'a'оценивается как (1 in []) and ([] in 'a').

Поскольку первое условие ( 1 in []) равно False, все условие оценивается как False; ([] in 'a')на самом деле никогда не оценивается, поэтому ошибки не возникает.

Вот определения операторов:

In [121]: def func():
   .....:     return 1 in [] in 'a'
   .....: 

In [122]: dis.dis(func)
  2           0 LOAD_CONST               1 (1)
              3 BUILD_LIST               0
              6 DUP_TOP             
              7 ROT_THREE           
              8 COMPARE_OP               6 (in)
             11 JUMP_IF_FALSE            8 (to 22)  #if first comparison is wrong 
                                                    #then jump to 22, 
             14 POP_TOP             
             15 LOAD_CONST               2 ('a')
             18 COMPARE_OP               6 (in)     #this is never executed, so no Error
             21 RETURN_VALUE         
        >>   22 ROT_TWO             
             23 POP_TOP             
             24 RETURN_VALUE        

In [150]: def func1():
   .....:     return (1 in  []) in 'a'
   .....: 

In [151]: dis.dis(func1)
  2           0 LOAD_CONST               1 (1)
              3 LOAD_CONST               3 (())
              6 COMPARE_OP               6 (in)   # perform 1 in []
              9 LOAD_CONST               2 ('a')  # now load 'a'
             12 COMPARE_OP               6 (in)   # compare result of (1 in []) with 'a'
                                                  # throws Error coz (False in 'a') is
                                                  # TypeError
             15 RETURN_VALUE   



In [153]: def func2():
   .....:     return 1 in ([] in 'a')
   .....: 

In [154]: dis.dis(func2)
  2           0 LOAD_CONST               1 (1)
              3 BUILD_LIST               0
              6 LOAD_CONST               2 ('a') 
              9 COMPARE_OP               6 (in)  # perform ([] in 'a'), which is 
                                                 # Incorrect, so it throws TypeError
             12 COMPARE_OP               6 (in)  # if no Error then 
                                                 # compare 1 with the result of ([] in 'a')
             15 RETURN_VALUE        
Ашвини Чаудхари
источник
Эй !! +1 Потрясающе, большое спасибо! Выглядит очень удобно, если б я знал об этом! Вы случайно не знаете, где это в документации? Я посмотрел, но не нашел ничего, что подсказывало бы это!
user541686
1
примечание: []ложно, но []не является, Falseнапример, [] and anythingвозвращает [](не False).
jfs
6
@Mehrdad Ознакомьтесь с дизассемблером Python, который использовался с iPython для генерации этого вывода.
Джефф Ферланд,
Не знаю, какая версия Python сгенерировала это, но Python 3.2 явно имеет новый байт-код: JUMP_IF_FALSE_OR_POP, который сокращает последовательность на одну инструкцию с 13 до 12. Классный ответ - спасибо !!
Дэйв
@Dave It's python 2.6.6 (iPython)
Ашвини Чаудхари
22

Python делает особые вещи с цепными сравнениями.

По-разному оцениваются следующие:

x > y > z   # in this case, if x > y evaluates to true, then
            # the value of y is being used to compare, again,
            # to z

(x > y) > z # the parenth form, on the other hand, will first
            # evaluate x > y. And, compare the evaluated result
            # with z, which can be "True > z" or "False > z"

Однако в обоих случаях, если выполняется первое сравнение False, остальная часть утверждения не рассматривается.

Для вашего конкретного случая

1 in [] in 'a'   # this is false because 1 is not in []

(1 in []) in a   # this gives an error because we are
                 # essentially doing this: False in 'a'

1 in ([] in 'a') # this fails because you cannot do
                 # [] in 'a'

Также, чтобы продемонстрировать первое правило выше, это утверждения, которые оцениваются как True.

1 in [1,2] in [4,[1,2]] # But "1 in [4,[1,2]]" is False

2 < 4 > 1               # and note "2 < 1" is also not true

Приоритет операторов Python: http://docs.python.org/reference/expressions.html#summary

Александр Чен
источник
11

Из документации:

Сравнения могут быть связаны произвольно, например, x <y <= z эквивалентно x <y и y <= z, за исключением того, что y оценивается только один раз (но в обоих случаях z не вычисляется вообще, когда x <y найдено быть ложным).

Это означает, что нет ассоциативности x in y in z!

Следующие варианты эквивалентны:

1 in  []  in 'a'
# <=>
middle = []
#            False          not evaluated
result = (1 in middle) and (middle in 'a')


(1 in  []) in 'a'
# <=>
lhs = (1 in []) # False
result = lhs in 'a' # False in 'a' - TypeError


1 in  ([] in 'a')
# <=>
rhs = ([] in 'a') # TypeError
result = 1 in rhs
phant0m
источник
3

Короткий ответ, поскольку длинное выражение уже дано здесь несколько раз и отличным образом, заключается в том, что логическое выражение закорочено , это остановило оценку, когда изменение истины на ложь или наоборот не может произойти при дальнейшей оценке.

(см. http://en.wikipedia.org/wiki/Short-circuit_evaluation )

Это может быть немного кратко (без каламбура) в качестве ответа, но, как уже упоминалось, все остальные объяснения здесь уже сделаны довольно хорошо, но я подумал, что этот термин заслуживает упоминания.

Питер
источник