В чем разница между log и symlog?

101

В matplotlib я могу установить масштабирование оси с помощью pyplot.xscale()или Axes.set_xscale(). Обе функции принимают три разных шкалы: 'linear'| 'log'| 'symlog'.

В чем разница между 'log'и 'symlog'? В простом тесте, который я сделал, они оба выглядели одинаково.

Я знаю, что в документации говорится, что они принимают разные параметры, но я до сих пор не понимаю разницы между ними. Может кто-нибудь объяснить это? Ответ будет лучшим, если в нем будут примеры кода и графики! (также: откуда взялось название «symlog»?)

Денилсон Са Майя
источник

Ответы:

188

Наконец я нашел время, чтобы провести несколько экспериментов, чтобы понять разницу между ними. Вот что я обнаружил:

  • logдопускает только положительные значения и позволяет вам выбирать, как обрабатывать отрицательные ( maskили clip).
  • symlogозначает симметричный бревно и допускает положительные и отрицательные значения.
  • symlog позволяет установить диапазон около нуля в пределах графика будет линейным, а не логарифмическим.

Я думаю, что все станет намного проще понять с помощью графики и примеров, поэтому давайте попробуем их:

import numpy
from matplotlib import pyplot

# Enable interactive mode
pyplot.ion()

# Draw the grid lines
pyplot.grid(True)

# Numbers from -50 to 50, with 0.1 as step
xdomain = numpy.arange(-50,50, 0.1)

# Plots a simple linear function 'f(x) = x'
pyplot.plot(xdomain, xdomain)
# Plots 'sin(x)'
pyplot.plot(xdomain, numpy.sin(xdomain))

# 'linear' is the default mode, so this next line is redundant:
pyplot.xscale('linear')

График с линейным масштабированием

# How to treat negative values?
# 'mask' will treat negative values as invalid
# 'mask' is the default, so the next two lines are equivalent
pyplot.xscale('log')
pyplot.xscale('log', nonposx='mask')

График с использованием масштабирования log и nonposx = 'mask'

# 'clip' will map all negative values a very small positive one
pyplot.xscale('log', nonposx='clip')

График с масштабированием log и nonposx = clip

# 'symlog' scaling, however, handles negative values nicely
pyplot.xscale('symlog')

График с масштабированием символьного журнала

# And you can even set a linear range around zero
pyplot.xscale('symlog', linthreshx=20)

График с масштабированием символьного журнала, но линейный в пределах (-20,20)

Для полноты картины я использовал следующий код для сохранения каждой фигуры:

# Default dpi is 80
pyplot.savefig('matplotlib_xscale_linear.png', dpi=50, bbox_inches='tight')

Помните, что вы можете изменить размер фигуры, используя:

fig = pyplot.gcf()
fig.set_size_inches([4., 3.])
# Default size: [8., 6.]

(Если вы не уверены, что я отвечу на свой вопрос, прочтите это )

Денилсон Са Майя
источник
19

symlog похож на log, но позволяет вам определить диапазон значений, близкий к нулю, в котором график является линейным, чтобы график не уходил в бесконечность около нуля.

Из http://matplotlib.sourceforge.net/api/axes_api.html#matplotlib.axes.Axes.set_xscale

В логарифмическом графике у вас никогда не может быть нулевого значения, а если у вас есть значение, приближающееся к нулю, оно будет резко снижаться от основания вашего графика (бесконечно вниз), потому что, когда вы берете «журнал (приближающийся к нулю)», вы получить «приближающуюся к отрицательной бесконечности».

symlog поможет вам в ситуациях, когда вы хотите иметь график журнала, но когда значение может иногда опускаться к нулю или до нуля, но вы все равно хотите иметь возможность показать это на графике значимым образом. Если вам нужен символический журнал, вы бы знали.

Thomasrutter
источник
Ну ... Я читал это, но до сих пор не знаю, когда мне использовать тот или иной. Я ожидал какого-то графического примера, чтобы я мог увидеть, в чем проблема, которую пытается решить symlog .
Denilson Sá Maia
4

Вот пример поведения, когда необходим символический журнал:

Начальный сюжет, без масштабирования. Обратите внимание, сколько точек сгруппировано в x ~ 0

    ax = sns.scatterplot(x= 'Score', y ='Total Amount Deposited', data = df, hue = 'Predicted Category')

[ Без масштабирования '

График в масштабе журнала. Все рухнуло.

    ax = sns.scatterplot(x= 'Score', y ='Total Amount Deposited', data = df, hue = 'Predicted Category')

    ax.set_xscale('log')
    ax.set_yscale('log')
    ax.set(xlabel='Score, log', ylabel='Total Amount Deposited, log')

Шкала журнала '

Почему он рухнул? Поскольку некоторые значения на оси x очень близки или равны 0.

График с масштабированием по симлогу. Все как должно быть.

    ax = sns.scatterplot(x= 'Score', y ='Total Amount Deposited', data = df, hue = 'Predicted Category')

    ax.set_xscale('symlog')
    ax.set_yscale('symlog')
    ax.set(xlabel='Score, symlog', ylabel='Total Amount Deposited, symlog')

Шкала симлогов

Гигикало
источник