Для матрицы затрат
L=[010.50]c1c2predictionc1c2truth
потеря прогнозирования класса когда истина - это класс составляет , а стоимость прогнозирования класса когда истина - это класс составляет . За правильные прогнозы плата не взимается, . Тогда условный риск для прогнозирования любого класса равенc 2 L 12 = 0,5 c 2 c 1 L 21 = 1 L 11 = L 22 = 0 R kc1c2L12=0.5c2c1L21=1L11=L22=0Rk
R ( c1| х)R ( c2| х)= L11Pr ( c1| х)+ L12Pr ( c2| х)= L12Pr ( c2| х)= L22Pr ( c2| х)+ L21Pr ( c1| х)= L21Pr ( c1| х)
Для см. эти
примечания на стр. 15.
Чтобы минимизировать риск / убыток, вы прогнозируете если цена из-за ошибки при этом (это потеря неправильного прогноза, умноженная на последующую вероятность того, что прогноз неверен, ) меньше, чем стоимость ошибочного прогнозирования альтернативы,L 12 Pr ( c 2 | x )с1L12Pr ( c2| х)
Pr(c2|x)∝Pr(x|c2)Pr(c2)Pr(c1)=Pr(c2)=0,51
L12Pr ( c2| х)L12Pr ( x | c2) Pr ( c2)L12Pr ( c2)L21Pr ( c1)< L21Pr ( c1| х)< L21Pr ( x | c1) Pr ( c1)< Pr ( x | c)1)Pr ( x | c2)
где вторая строка использует правило Байеса . При равных априорных вероятностях вы получаете
Pr ( c2| x)∝Pr(x | c2) Pr ( c2)Pr ( c1) = Pr ( c2) = 0,512< Pr ( x | c)1)Pr ( x | c2)
поэтому вы решили классифицировать наблюдение как , если отношение правдоподобия превышает этот порог. Теперь мне неясно, хотели ли вы знать «наилучший порог» с точки зрения отношения правдоподобия или с точки зрения атрибута . Ответ меняется в зависимости от функции стоимости. Использование гауссиана в неравенстве с и , ,
x σ 1 = σ 2 = σ μ 1 = 0 μ 2 = 1 1с1Иксσ1= σ2= σμ1= 0μ2= 1
12журнал( 12)журнал( 12)Иксσ2Икс< 12 π√σехр[ - 12 σ2( х - μ1)2]12 π√σехр[ - 12 σ2( х - μ2)2]< журнал( 12 π--√σ) - 12 σ2( х - 0 )2- [ журнал( 12 π--√σ) - 12 σ2( х - 1 )2]< - х22 σ2+ х22 σ2- 2 х2 σ2+ 12 σ2< 12 σ2- журнал( 12)< 12- журнал( 12) σ2
поэтому порог предсказания в терминах
Икспоиск может быть достигнут только в том случае, если потери от ложных прогнозов одинаковы, т.е. потому что только тогда вы можете иметь и вы получите .
L12= L21журнал( Л12L21) = журнал( 1 ) = 0Икс0< 12