Что значит Тета?

16

Я новичок в статистике и нашел это .

В статистике θ, строчная греческая буква 'theta', является обычным именем для (вектора) параметра (ов) некоторого общего распределения вероятностей. Распространенной проблемой является поиск значения (й) тэты. Обратите внимание, что нет никакого смысла в именовании параметра таким образом. Мы могли бы также назвать это как-нибудь еще. Фактически, во многих дистрибутивах есть параметры, которым обычно присваиваются другие имена. Например, общепринято называть среднее значение и отклонение нормального распределения μ (читай: «mu») и отклонение σ («сигма») соответственно.

Но я все еще не знаю, что это значит на простом английском?

Kamilski81
источник
10
является просто математическим символом и означает разные вещи в разных контекстах. Иногда θ используется для обозначения оцениваемого параметра, но нет реального ответа на вопрос «Что такое θ ?». Это все равно что спросить «Что такое буква А?». Ваша ссылка даже намекает на это, когда говорит:«Обратите внимание, что нет никакого смысла в названии параметра таким образом. Мы могли бы также назвать его как угодно». , θθθ
Макрос
Это просто способ присвоения статистическому параметру (который определяет распределение количества, связанного с этим «параметром») специальной буквы (кроме английских букв).
Stat-R
4
Большинство из нас восприняли бы эту цитату как чрезвычайно простой английский, но для того, чтобы добиться прогресса, мы должны признать, что вопрос не в том, как читать по-английски. О чем же это может быть? Я утверждаю, что он просит нас объяснить технические термины в цитате: те, с которыми мы настолько знакомы, что мы больше не видим, насколько странными они могут быть для статистически непосвященных. Это требует, чтобы мы обратились к значениям распределения и параметров (распределения, а не подогнанной кривой или другой детерминированной модели).
whuber

Ответы:

31

Это не соглашение, но довольно часто обозначает набор параметров распределения.θ

Это было для простого английского, давайте покажем примеры.

Пример 1. Вы хотите изучить бросок старомодной канцелярской кнопки (с большим круглым дном). Вы предполагаете, что вероятность того, что он упадет, является неизвестным значением, которое вы называете . Вы можете вызвать случайную переменную X и сказать, что X = 1, когда чертежная кнопка падает, указывает вниз, и X = 0, когда она падает, указывает вверх. Вы бы написали модельθИксИксзнак равно1Иксзнак равно0

P(X=1)=θP(X=0)=1θ,

и вы были бы заинтересованы в оценке θ (здесь вероятность того, что чертежная кнопка падает вниз).

Пример 2. Вы хотите изучить распад радиоактивного атома. Основываясь на литературных источниках, вы знаете, что количество радиоактивности уменьшается экспоненциально, поэтому вы решаете смоделировать время распада с экспоненциальным распределением. Если - время распада, модельt

f(t)=θeθt.

Здесь - плотность вероятности, что означает, что вероятность того, что атом распадется в интервале времени ( t , t + d t ), равна f ( t ) d t . Опять же, вам будет интересно оценить θf(t)(t,t+dt)f(t)dtθ (здесь скорость дезинтеграции).

Пример 3. Вы хотите изучить точность весов. Основываясь на литературных источниках, вы знаете, что измерения являются гауссовыми, поэтому вы решаете смоделировать взвешивание стандартного объекта весом 1 кг как

f(x)=1σ2πexp{(xμ2σ)2}.

Здесь - мера, определяемая масштабом, f ( x ) - плотность вероятности, а параметры - это μ и σ , поэтому θ = ( μ , σ ) . Параметр μ - это целевой вес (шкала смещена, если μ 1 ), а σ - стандартное отклонение меры каждый раз, когда вы взвешиваете объект. Опять же, вам будет интересно оценить θ (здесь смещение и неточность шкалы).xf(x)μσθ=(μ,σ)μμ1σθ

gui11aume
источник
1
+1 FWIW, я недавно опубликовал рабочий пример в том же духе на stats.stackexchange.com/a/34894 . Хотя было бы неверно толковать его как «простой английский» - он не стесняется использовать технические термины - я постарался максимально четко и кратко объяснить, что происходит, какие предположения сделаны и как работает с параметризованным семейством распределений для получения оценки на основе данных. Для некоторых это может быть информативным дополнением к вашему ответу здесь.
whuber
1
Отличный ответ! Я смущен, когда вы заявляете, что шкала смещена, если mu! = 1. Фактически, после «нормализации» стандартное нормальное распределение становится x ~ N (0, 1). Или, по-английски, mu = 0 и дисперсия = 1. См., Например, en.wikipedia.org/wiki/…
Майк Уильямсон,
Я просто имею в виду, что прибор имеет смещение, если он показывает что-то еще, чем 1 кг, когда он измеряет 1 кг объекта. Возможно, слово «масштаб» сбивает с толку. Здесь это просто обозначает инструмент.
gui11aume
3

какая θ refers to depends on what model you are working with. For example, in ordinary least squares regression, you model a dependent variable (usually called Y) as a linear combination of one or more independent variables (usually called X), getting something like

Yi=b0+b1x1+b2x2+...+bpxp

where p is the number of independent variables. The parameters to be estimated here are the βs and θ is a name for all the βs. But θ is more general can apply to any parameters we want to estimate.

Peter Flom - Reinstate Monica
источник
3
Peter, although you didn't say this exactly, I'm afraid this answer may give a novice the incorrect impression that the symbol θ will always refer to a parameter vector and, conversely, that this is the only way to refer to a parameter value. As my comment above indicates, I think the answer is nothing more than "θ is a mathematical symbol", making it not really a statistical question.
Macro
1
@Macro I think, in this context, it's clear that this is the meaning of θ that Kamilski wanted. Sure, any symbol can refer to anything. But in this paragraph, Macro means you, and not a course in Economics or a part of SAS or whatnot.
Peter Flom - Reinstate Monica
1
хорошо, я не думаю, что аналогия действительно удачна, но я буду воспринимать ее как попытку гиперболы. В любом случае, я действительно имею в виду нечто очень простое: математические новички часто ошибочно принимают нотацию за что-то по своей сути и за нечто иное, чем она есть - просто за метку. Моя точка зрения заключалась в том, что этот ответ (я думаю, непреднамеренно) не делает ничего, чтобы развеять эту идею. Как ты знаешь,θможет ссылаться на другие вещи, с которыми может столкнуться статистик. Например, углы часто обозначаются какθ,
Макрос
4
This explanation, although it is clear and technically correct, does not explicitly involve any distributions whatsoever, and thus appears not to be relevant to the quotation in the question.
whuber
1

In plain English:

Statistical distribution is a mathematical function f that tells you what is the probability of different values of your random variable X that has the distribution f, i.e. f(x) outputs a probability of x. There are different such a functions, but for now let consider f as some kind of "general" function.

However, for f to be universal, that is, one that is possible to apply to different data (that share similar properties), it needs parameters that change its shape so that it fits different data. A simple example of such a parameter is μ in normal distribution that tells where is the center (mean) of this distribution and so it can describe random variables with different mean values. Normal distribution has another parameter σ and other distributions also have at least one such a parameters. The parameters are often called θ, where for normal distribution θ is a shorthand for both μ and σ (i.e. is a vector of the two values).

Why is θ important? Statistical distributions are used to approximate the empirical distributions of data. Say you have dataset of ages of a group of people and on average they are 50 years old and you want to approximate the distribution of their ages using a normal distribution. If normal distribution didn't allow for different values of μ (e.g. had a fixed value of this parameter, say μ=0), then it would be useless for this data. However, since μ is not fixed, normal distribution could use different values of μ, with μ=50 being one of them. This is a simple example, but there are more complicated cases where the values of θ parameters are not so clear and so you have to use statistical tools for estimating (finding the most appropriate) θ values.

So you could say that statistics is about finding the best θ values given the data (Bayesians would say: given the data and priors).

Tim
источник