Traducción del libro de Andrew Un, Pasión por el aprendizaje automático, capítulos 44-46

capítulos anteriores


Algoritmos de depuración final


44. Prueba de verificación de optimización (prueba de verificación de optimización)


Supongamos que está desarrollando un sistema de reconocimiento de voz. El sistema recibe la voz de entrada de grabación A y calcula un cierto valor A (S) , la estimación de la verosimilitud de que este clip de sonido corresponde propuesta S . Por ejemplo, se puede tratar de estimar el valor de A (S) = P (el S | A) , la probabilidad de que la transcripción correcta de salida ofrecerá S, a condición de que el sonido de entrada era una .


Cualquiera sea el método de estimación de la cantidad A (S) que elija, la tarea es encontrar la oración en inglés S en la que esta cantidad sea máxima:
imagen


¿Cómo abordar el cálculo de "arg max" en esta fórmula? Digamos 50,000 palabras en inglés, de las cuales puedes hacer


50000N


N — , , .


, , S, () A(S). « », K . ( , « »). , S, A(S).


, A -, « ». : « ».
:


  1. . ( ) S, A(S).
  2. ( ). A(S) = P(S|A) . , A(S) « » .

, - . . , A(S).


, ; A(S). , , .
?


(« »), Sout. (« »), S*. , , (The Optimization Verification test): ScoreA(S*) ScoreA(Sout), ScoreA(S*) ScoreA(Sout).


1: ScoreA(S*) > ScoreA(Sout)


S*, , Sout. , Sout, S*. , S, A(S) . (The Optimization Verification test) , , . , « » (beam search).


2: ScoreA(S*)ScoreA(Sout).


ScoreA(.): S* Sout. (The Optimization Verification test) . , , ScoreA(S) S.


. (The Optimization Verification test) , . , ScoreA(S*) > ScoreA(Sout). , , , . , ScoreA(S*)ScoreA(Sout) ScoreA(.).


, , 95% ScoreA(.), 5% - . , , ~ 5% . , ScoreA(.).


45. (The Optimization Verification test).


(the Optimization Verification test) , , x , , x(y), , y x , arg maxyScorex(y), , . x=A, y=S.


, y* — «» , yout. Scorex(y*) > Scorex(yout). , . , . , Scorex(y).


. , . C ScoreC(E) E. , ScoreC(E) = P(E|C), E, , C.


imagen


, , .


, Eout E*. , ScoreC(E*) > ScoreC(Eout). , ScoreC(.) E* Eout; , . , ScoreC(.).


« » : (approximate scoring function) Scorex(.), (approximate maximization algorithm). , (The Optimization Verification test) .


46.



, , . , , .


«». , . -. , , .


« » R(.), T. , T , R(T) = -1000 — «» . T, , R(T) , , . R(.), , T. , , , . — .


, R(T) , , , maxTR(T). .
, R(.) , . , , - — .


— , , , , maxTR(T) , , ?
(Optimization Verification test), Thuman, , -, Tout . , Thuman Tout. : , R(Thuman) > R(Tout)?


1: , R(.) , Thuman Tout. , , Tout, . , .


2: : R(Thuman)R(Tout). , R(.) Thuman , Tout, , Thuman . R(.), .


«» Scorex(.) . x, Score(.). Score(T)=R(T), (optimization algorithm) , , T.


Una de las diferencias entre este y los ejemplos anteriores es que la calidad del algoritmo no se compara con el resultado "óptimo", sino con la trayectoria humana T humano . Asumimos que T humano es lo suficientemente bueno, incluso si no es óptimo. En general, siempre que tenga algún resultado y * (en este ejemplo, T humano ) que exceda la calidad del sistema, incluso si no es "óptimo", la prueba de verificación de optimización indicará que Más prometedor: para mejorar el algoritmo de optimización o la función de evaluación.


continuación


All Articles