Тарифы авиакомпаний - Какой анализ следует использовать для выявления конкурентного поведения при установлении цен и ценовых корреляций?

12

Я хочу исследовать поведение авиакомпаний в отношении ценообразования - особенно то, как авиакомпании реагируют на ценообразование конкурентов.

Как я сказал бы, мои знания о более сложном анализе довольно ограничены, я использовал в основном все основные методы для сбора общего представления о данных. Это включает в себя простые графики, которые уже помогают идентифицировать похожие шаблоны. Я также использую SAS Enterprise 9.4.

Однако я ищу более числовой подход.

Набор данных

Используемый мной (сам) собранный набор данных содержит около 54.000 тарифов. Все тарифы собирались в течение 60-дневного периода времени ежедневно (каждую ночь в 00:00).Метод сбора

Следовательно, каждый тариф в пределах этого временного интервала встречается n раз в зависимости от наличия тарифа, а также даты вылета рейса, когда он проходит к дате сбора тарифа. (Вы не можете получить тариф за рейс, если дата вылета рейса была в прошлом)

Неформатированный, который выглядит в основном так: (поддельные данные)

+--------------------+-----------+--------------------+--------------------------+---------------+
| requestDate        | price| tripStartDeparture | tripDestinationDeparture | flightCarrier |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 725.32    | 16APR2015:10:50:02 | 23APR2015:21:55:04       | XA            |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 966.32    | 16APR2015:13:20:02 | 23APR2015:19:00:04       | XY            |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 915.32    | 16APR2015:13:20:02 | 23APR2015:21:55:04       | XH            |
+--------------------+-----------+--------------------+--------------------------+---------------+

«DaysBeforeDeparture» рассчитывается через I=sc где

  • I & интервал (дней до вылета)
  • s & дата тарифа (отправление рейса)
  • c & дата, когда тариф был собран

Вот пример сгруппированных данных, установленных I (DaysBeforeDep.) (Поддельные данные!):

+-----------------+------------------+------------------+------------------+------------------+
| DaysBefDeparture | AVG_of_sale | MIN_of_sale | MAX_of_sale | operatingCarrier |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 880.68           | 477.99           | 2,245.23         | DL           |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 904.89           | 477.99           | 2,534.55         | DL           |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 1,044.39         | 920.99           | 2,119.09         | LH               |
+-----------------+------------------+------------------+------------------+------------------+

Что я придумал до сих пор

Глядя на линейные графики, я уже могу оценить, что у нескольких линий будет высокий коэффициент корреляции. Поэтому я попытался сначала использовать корреляционный анализ сгруппированных данных. Но так ли это? В основном я сейчас пытаюсь сделать корреляции по средним, а не по отдельным ценам? Есть ли другой способ?

Я не уверен, какая модель регрессии здесь подходит, поскольку цены не движутся в какой-либо линейной форме и кажутся нелинейными. Нужно ли мне приспосабливать модель к каждому ценовому изменению авиакомпании?

PS: это длинная текстовая стена. Если мне нужно что-то уточнить, дайте мне знать. Я новичок в этом сабе.

Кто-нибудь знает? :-)

S1x
источник

Ответы:

9

Слово предупреждения от бывшего аналитика по управлению доходами авиакомпании: при таком подходе вы, возможно, ошибаетесь. Извиняюсь за стену текста, которая следует, но эти данные намного сложнее и шумнее, чем может показаться на первый взгляд, поэтому я хотел дать краткое описание того, как они генерируются; предупрежден - значит вооружен.

Тарифы авиакомпании включают в себя два компонента: все фактические тарифы (в комплекте с правилами тарифа и что у вас есть), которые есть у авиакомпании для определенного маршрута, большинство из которых публикуются издательской компанией Airline Tariff Publishing Company (некоторые из них предназначены для специального использования. нет, но это скорее исключение, чем правило), а фактическое управление запасами осуществляется авиакомпанией на ежедневной основе.

Тарифы могут подаваться в ATPCO четыре раза в день с установленными интервалами, и когда авиакомпании делают это, они обычно состоят из ряда добавлений, исключений и модификаций существующих тарифов. Когда авиакомпания инициирует ценовое действие (при условии, что их конкуренты не пытаются делать свои собственные шаги здесь), им обычно приходится ждать до следующего обновления, чтобы увидеть, будут ли их конкуренты следовать или отвечать. Обратное происходит, когда конкурент инициирует ценовое действие, поскольку авиакомпания должна дождаться следующего обновления, прежде чем они смогут ответить.

Теперь, это все хорошо в отношении тарифов, но проблема в том, что, поскольку все это публикуется в ATPCO, тарифы являются следующей лучшей вещью для публичной информации ... все ваши конкуренты увидят то, что вы попали в ваш арсенал, поэтому нередки попытки запутывания, такие как публикация тарифов, которым фактически никогда не будет назначен какой-либо инвентарь, перечисление всех тарифов как день отъезда и т. д.

Во многих отношениях секретный соус сводится к фактическому распределению инвентаря, то есть, сколько мест на каждом рейсе вы будете готовы продать по заданному тарифу, и эта информация не является общедоступной. Вы можете получить некоторые проблески, просматривая веб-информацию, но потенциальные комбинации времени / даты отъезда и правил тарифа довольно многочисленны и могут быстро выйти за пределы вашей способности легко отслеживать.

Как правило, авиакомпания желает продать лишь несколько мест по очень низкой цене, и люди, которые ее забирают, должны бронировать заранее, чтобы правила тарифа не блокировали их, или другие путешественники просто не смогли их ударить. Авиакомпания будет готова продать еще несколько мест по более высокой цене, и так далее, и тому подобное. Они будут очень рады продать все места по самым высоким тарифам, которые они опубликовали, но это обычно неосуществимо.

То, что вы видите, когда цены становятся выше, чем ближе к дню отправления, это просто естественный процесс, когда дешевые места бронируются дальше, а оставшийся инвентарь постепенно становится дороже. Конечно, здесь есть некоторые оговорки. Процесс RM активно управляется, и вмешательство человека является довольно распространенным явлением, поскольку команда RM, как правило, стремится достичь своих целей в области доходов и максимизировать доход на каждом рейсе. Таким образом, рейсы, которые быстро заполняются, могут быть «ужесточены» за счет закрытия низких тарифов. Рейсы, которые бронируются медленно, могут быть «ослаблены», выделив больше мест по более низким тарифам.

В этой области существует постоянное взаимодействие и конкуренция между авиакомпаниями, но вы вряд ли сможете уловить реальную динамику только из-за пересчета тарифов. Не поймите меня неправильно, в нашем распоряжении были такие инструменты, и, несмотря на их ограничения, они были весьма ценными, но они были всего лишь одним источником данных, который использовался в процессе принятия решений. Вам понадобится доступ к сотням, если не тысячам оперативных решений, принимаемых командами РМ на ежедневной основе, а также информации о состоянии дел в том виде, в каком они видят ее в то время. Если вы не можете найти партнера авиакомпании, с которым можно работать, чтобы получить эти данные, вам может потребоваться рассмотреть альтернативные источники данных.

Я бы порекомендовал получить доступ к данным о тарифах O & D из Официального руководства авиакомпании (или одного из их конкурентов) и попытаться использовать его для своего анализа. Он основан на выборке (около 10% от всех проданных билетов) и агрегирован на более высоком уровне, чем было бы идеально, поэтому необходим тщательный выбор маршрута (я бы рекомендовал что-то с большим количеством авиакомпаний, выполняющих беспосадочные рейсы несколько раз в день, с большой самолет), но вы можете получить лучшее представление о том, что на самом деле было продано (средний тариф) и сколько было продано (коэффициент загрузки), а не только то, что доступно для продажи в данный момент времени. Используя эту информацию, вы, возможно, окажетесь в лучшем положении, чтобы хотя бы изучить результаты ценовой стратегии авиакомпаний и сделать из этого свои выводы.

Habu
источник
Спасибо за ваше подробное объяснение. Я согласен с вами, что такой анализ, основанный только на ценах, весьма ограничен. Это также включает в себя, в частности, правила тарифа (Возвратные билеты, минимальное пребывание и т. Д.). Некоторые из этих ограничений можно преодолеть, собирая всегда одинаковые тарифы, чтобы сделать их сопоставимыми. Тем не менее, важная информация - как вы упомянули, отсутствует количество доступных мест (может быть! = Места в самолете) и фактическое количество проданных билетов.
s1x
Доступ к таким данным очень ограничен и, если - устарел (например, Банк данных 1B от US DOT). В некоторых исследованиях, таких как Clark R. и Vincent N. (2012), ссылка на ценообразование, зависящее от мощности, [...] включает такие данные и предлагает гораздо лучшее понимание. Я знаю об ограничениях (надеюсь ;-)) и, как вы упомянули, гораздо больше информации, влияющей на цены. Тем не менее, наблюдая за конкретным рынком, вы можете почувствовать, что происходит. Вы можете увидеть, есть ли какое-либо конкурентное поведение и различные подходы ценовой стратегии. Однако вы никогда не сможете найти причину.
s1x
1
@ s1x - я согласен и хочу, чтобы у меня была надежная альтернатива, но, как вы узнали сами, подробные данные о доходах являются самым ревностным секретом любой авиакомпании. Просто хотел убедиться, что вы знаете об этом и что входит в процесс генерации данных. Кроме того, мне нравится то, что вы пытаетесь сделать, и я думаю, что другой ответ - это шаг в правильном направлении, с технической точки зрения. Если я могу предложить, вы также можете взглянуть на использование взаимной корреляции между различными TS во время исследования данных, поскольку это часто полезно для определения закономерностей между связанными TS.
Хабу
4

В дополнение к исследовательскому анализу данных (EDA), как описательному, так и визуальному, я бы попытался использовать анализ временных рядов в качестве более всеобъемлющего и сложного анализа. В частности, я бы выполнил регрессионный анализ временных рядов . Анализ временных рядов является огромной исследовательской и практической областью, поэтому, если вы не знакомы с основами, я предлагаю начать с вышеупомянутой статьи в Википедии, постепенно искать более конкретные темы и читать соответствующие статьи, статьи и книги.

Поскольку анализ временных рядов является очень популярным подходом, он поддерживается большинством открытым исходным кодом и закрытым исходным кодом коммерческой науки данных и статистических средах (программное обеспечение) , таких как R , Python , SAS , SPSS и многие другие. Если вы хотите использовать R для этого, проверьте мои ответы об общем анализе временных рядов, а также о классификации и кластеризации временных рядов . Я надеюсь, что это полезно.

Александр Блех
источник
Спасибо за ваш ответ @ Александр Блех - очень признателен. Я буду копаться прямо в этом. Возможно глупый вопрос, но, пожалуйста, поправьте меня здесь, если я ошибаюсь: анализ корреляции, используя одну авиакомпанию в качестве переменной для корреляции. Результаты были убедительными до сих пор, как некоторые авиакомпании, особенно. те, у кого были соглашения о совместном использовании, имели схожие цены. Будут ли такие высокие корреляции, например: ColumnUA(LH) 0.90435 <.0001 ColumnSQ 0.32544 <.0001 ColumnAF(DL) 0.55336 <.0001 я предполагаю, что такие результаты указывают на аналогичные ценовые модели. Что с помощью регрессионного анализа, что я узнаю?
s1x
@ s1x: Добро пожаловать (не стесняйтесь высказываться / принимать, конечно, если вы цените ответ и когда у вас будет достаточно репутации). Теперь по вашему вопросу. Как я уже сказал, анализ TS является более сложным и всеобъемлющим. В частности, регрессия TS учитывает так называемую авторегрессию и другие сложности TS. Следовательно, мое предложение использовать TS регрессионный анализ вместо более простого традиционного. Кроме того, вы всегда должны начинать с EDA, независимо от того, какой анализ данных вы планируете выполнить (на самом деле, EDA часто меняет ваши планы).
Александр Блех