Я новичок в статистике и нашел это .
В статистике θ, строчная греческая буква 'theta', является обычным именем для (вектора) параметра (ов) некоторого общего распределения вероятностей. Распространенной проблемой является поиск значения (й) тэты. Обратите внимание, что нет никакого смысла в именовании параметра таким образом. Мы могли бы также назвать это как-нибудь еще. Фактически, во многих дистрибутивах есть параметры, которым обычно присваиваются другие имена. Например, общепринято называть среднее значение и отклонение нормального распределения μ (читай: «mu») и отклонение σ («сигма») соответственно.
Но я все еще не знаю, что это значит на простом английском?
terminology
Kamilski81
источник
источник
Ответы:
Это не соглашение, но довольно часто обозначает набор параметров распределения.θ
Это было для простого английского, давайте покажем примеры.
Пример 1. Вы хотите изучить бросок старомодной канцелярской кнопки (с большим круглым дном). Вы предполагаете, что вероятность того, что он упадет, является неизвестным значением, которое вы называете . Вы можете вызвать случайную переменную X и сказать, что X = 1, когда чертежная кнопка падает, указывает вниз, и X = 0, когда она падает, указывает вверх. Вы бы написали модельθ Икс Икс= 1 Икс= 0
и вы были бы заинтересованы в оценкеθ (здесь вероятность того, что чертежная кнопка падает вниз).
Пример 2. Вы хотите изучить распад радиоактивного атома. Основываясь на литературных источниках, вы знаете, что количество радиоактивности уменьшается экспоненциально, поэтому вы решаете смоделировать время распада с экспоненциальным распределением. Если - время распада, модельt
Здесь - плотность вероятности, что означает, что вероятность того, что атом распадется в интервале времени ( t , t + d t ), равна f ( t ) d t . Опять же, вам будет интересно оценить θf(t) (t,t+dt) f(t)dt θ (здесь скорость дезинтеграции).
Пример 3. Вы хотите изучить точность весов. Основываясь на литературных источниках, вы знаете, что измерения являются гауссовыми, поэтому вы решаете смоделировать взвешивание стандартного объекта весом 1 кг как
Здесь - мера, определяемая масштабом, f ( x ) - плотность вероятности, а параметры - это μ и σ , поэтому θ = ( μ , σ ) . Параметр μ - это целевой вес (шкала смещена, если μ ≠ 1 ), а σ - стандартное отклонение меры каждый раз, когда вы взвешиваете объект. Опять же, вам будет интересно оценить θ (здесь смещение и неточность шкалы).x f(x) μ σ θ=(μ,σ) μ μ≠1 σ θ
источник
какаяθ refers to depends on what model you are working with. For example, in ordinary least squares regression, you model a dependent variable (usually called Y) as a linear combination of one or more independent variables (usually called X), getting something like
where p is the number of independent variables. The parameters to be estimated here are theβs and θ is a name for all the βs . But θ is more general can apply to any parameters we want to estimate.
источник
In plain English:
Statistical distribution is a mathematical functionf that tells you what is the probability of different values of your random variable X that has the distribution f , i.e. f(x) outputs a probability of x . There are different such a functions, but for now let consider f as some kind of "general" function.
However, forf to be universal, that is, one that is possible to apply to different data (that share similar properties), it needs parameters that change its shape so that it fits different data. A simple example of such a parameter is μ in normal distribution that tells where is the center (mean) of this distribution and so it can describe random variables with different mean values. Normal distribution has another parameter σ and other distributions also have at least one such a parameters. The parameters are often called θ , where for normal distribution θ is a shorthand for both μ and σ (i.e. is a vector of the two values).
Why isθ important? Statistical distributions are used to approximate the empirical distributions of data. Say you have dataset of ages of a group of people and on average they are 50 years old and you want to approximate the distribution of their ages using a normal distribution. If normal distribution didn't allow for different values of μ (e.g. had a fixed value of this parameter, say μ=0 ), then it would be useless for this data. However, since μ is not fixed, normal distribution could use different values of μ , with μ=50 being one of them. This is a simple example, but there are more complicated cases where the values of θ parameters are not so clear and so you have to use statistical tools for estimating (finding the most appropriate) θ values.
So you could say that statistics is about finding the bestθ values given the data (Bayesians would say: given the data and priors).
источник