Реализация нарезки в __getitem__

112

Я пытаюсь реализовать функциональность среза для создаваемого мной класса, который создает векторное представление.

У меня пока есть этот код, который, как я полагаю, правильно реализует срез, но всякий раз, когда я делаю вызов, например, v[4]где v - вектор, python возвращает ошибку о нехватке параметров. Итак, я пытаюсь понять, как определить getitemв моем классе специальный метод для обработки как простых индексов, так и нарезки.

def __getitem__(self, start, stop, step):
    index = start
    if stop == None:
        end = start + 1
    else:
        end = stop
    if step == None:
        stride = 1
    else:
        stride = step
    return self.__data[index:end:stride]
никотин
источник

Ответы:

118

__getitem__()Метод получит sliceобъект , когда объект кружочков. Просто посмотрите на start, stopи stepчлены sliceобъекта, чтобы получить компоненты для среза.

>>> class C(object):
...   def __getitem__(self, val):
...     print val
... 
>>> c = C()
>>> c[3]
3
>>> c[3:4]
slice(3, 4, None)
>>> c[3:4:-2]
slice(3, 4, -2)
>>> c[():1j:'a']
slice((), 1j, 'a')
Игнасио Васкес-Абрамс
источник
10
Примечание: для расширения встроенных типов, таких как список или кортеж, вы должны реализовать __getslice__для версий python 2.X. см. docs.python.org/2/reference/datamodel.html#object.__getslice__
gregorySalvan
@gregorySalvan: Разве этот пример совместимости ниже этого раздела не повторяется?
Эрик
3
@ Эрик: Нет, потому что присутствие второго двоеточия не учитывается __get/set/delslice__. Хотя это довольно тонко.
user2357112 поддерживает Монику
@ user2357112: Вау, совсем пропустил это второе двоеточие - спасибо!
Эрик
@alancalvitti IIRC, это для создания классов нового стиля в Python 2.
wjandrea
64

У меня есть "синтетический" список (тот, в котором данных больше, чем вы хотели бы создать в памяти), и мой __getitem__выглядит так:

def __getitem__( self, key ) :
    if isinstance( key, slice ) :
        #Get the start, stop, and step from the slice
        return [self[ii] for ii in xrange(*key.indices(len(self)))]
    elif isinstance( key, int ) :
        if key < 0 : #Handle negative indices
            key += len( self )
        if key < 0 or key >= len( self ) :
            raise IndexError, "The index (%d) is out of range."%key
        return self.getData(key) #Get the data from elsewhere
    else:
        raise TypeError, "Invalid argument type."

Срез не возвращает тот же тип, что нельзя, но у меня это работает.

Вальтер Ниссен
источник
1
Не должно, если key> = len (self) быть if key <0 или key> = len (self)? Что делать, если передан ключ <-len (self)?
Estan 01
20

Как определить класс getitem для обработки как простых индексов, так и нарезки?

Объекты Slice создаются автоматически, когда вы используете двоеточие в обозначении нижнего индекса - и это то, что передается __getitem__. Используйте, isinstanceчтобы проверить, есть ли у вас объект среза:

from __future__ import print_function

class Sliceable(object):
    def __getitem__(self, subscript):
        if isinstance(subscript, slice):
            # do your handling for a slice object:
            print(subscript.start, subscript.stop, subscript.step)
        else:
            # Do your handling for a plain index
            print(subscript)

Скажем, мы использовали объект диапазона, но мы хотим, чтобы срезы возвращали списки вместо новых объектов диапазона (как это происходит):

>>> range(1,100, 4)[::-1]
range(97, -3, -4)

Мы не можем создавать подклассы из-за внутренних ограничений, но можем делегировать ему:

class Range:
    """like builtin range, but when sliced gives a list"""
    __slots__ = "_range"
    def __init__(self, *args):
        self._range = range(*args) # takes no keyword arguments.
    def __getattr__(self, name):
        return getattr(self._range, name)
    def __getitem__(self, subscript):
        result = self._range.__getitem__(subscript)
        if isinstance(subscript, slice):
            return list(result)
        else:
            return result

r = Range(100)

У нас нет идеально заменяемого объекта Range, но он довольно близок:

>>> r[1:3]
[1, 2]
>>> r[1]
1
>>> 2 in r
True
>>> r.count(3)
1

Чтобы лучше понять нотацию срезов, вот пример использования Sliceable:

>>> sliceme = Sliceable()
>>> sliceme[1]
1
>>> sliceme[2]
2
>>> sliceme[:]
None None None
>>> sliceme[1:]
1 None None
>>> sliceme[1:2]
1 2 None
>>> sliceme[1:2:3]
1 2 3
>>> sliceme[:2:3]
None 2 3
>>> sliceme[::3]
None None 3
>>> sliceme[::]
None None None
>>> sliceme[:]
None None None

Python 2, имейте в виду:

В Python 2 есть устаревший метод, который может потребоваться переопределить при создании подкласса некоторых встроенных типов.

Из документации по модели данных :

object.__getslice__(self, i, j)

Не рекомендуется с версии 2.0: поддержка объектов-срезов в качестве параметров __getitem__()метода. (Тем не менее, встроенные типы в CPython в настоящее время все еще реализуются __getslice__(). Поэтому вам необходимо переопределить их в производных классах при реализации нарезки.)

Этого нет в Python 3.

Аарон Холл
источник
7

Чтобы расширить ответ Аарона, например numpy, вы можете сделать многомерный срез, проверив, givenявляется ли он tuple:

class Sliceable(object):
    def __getitem__(self, given):
        if isinstance(given, slice):
            # do your handling for a slice object:
            print("slice", given.start, given.stop, given.step)
        elif isinstance(given, tuple):
            print("multidim", given)
        else:
            # Do your handling for a plain index
            print("plain", given)

sliceme = Sliceable()
sliceme[1]
sliceme[::]
sliceme[1:, ::2]

`` `

Вывод:

('plain', 1)
('slice', None, None, None)
('multidim', (slice(1, None, None), slice(None, None, 2)))
Эрик Кузино
источник
В качестве небольшого продолжения, вот пример использования этого для сопоставления между индексированием MATLAB и индексированием NumPy (который в настоящее время не поддерживается в MATLAB R2016b) с примером его использования .
Эрик Кузино