خوارزميات التصحيح النهائية

44. اختبار للتحقق من التحسين (اختبار التحقق من التحسين)

افترض أنك تقوم بتطوير نظام التعرف على الكلام. النظام يتلقى صوت مدخلات تسجيل A ويحسب قيمة معينة A (S) ، تقدير معقولية ان هذا مقطع صوت يتوافق تقديم المقترحات S . على سبيل المثال، يمكنك محاولة لتقدير قيمة ألف (S) = P (وS | A) ، واحتمال أن الناتج النسخ الصحيح وتقديم S، شريطة أن يكون الصوت المدخلات و A .

مهما كانت طريقة تقدير الكمية A (S) التي تختارها ، فإن المهمة هي العثور على الجملة الإنجليزية S التي ستكون فيها هذه الكمية كحد أقصى:

كيفية التعامل مع حساب "arg max" في هذه الصيغة؟ دعنا نقول 50000 كلمة باللغة الإنجليزية ، والتي يمكنك صنعها

50000^{N}

$50000^N$

N — , , .

, , S, () A(S). « », K . ( , « »). , S, A(S).

, A -, « ». : « ».
:

. ( ) S, A(S).
( ). A(S) = P(S|A) . , A(S) « » .

, - . . , A(S).

, ; A(S). , , .
?

(« »), S_out. (« »), S*. , , (The Optimization Verification test): Score_A(S*) Score_A(S_out), Score_A(S*) Score_A(S_out).

1: Score_A(S*) > Score_A(S_out)

S*, , S_out. , S_out, S*. , S, A(S) . (The Optimization Verification test) , , . , « » (beam search).

2: Score_A(S*) ≤ Score_A(S_out).

Score_A(.): S* S_out. (The Optimization Verification test) . , , Score_A(S) S.

. (The Optimization Verification test) , . , Score_A(S*) > Score_A(S_out). , , , . , Score_A(S*) ≤ Score_A(S_out) Score_A(.).

, , 95% Score_A(.), 5% - . , , ~ 5% . , Score_A(.).

45. (The Optimization Verification test).

(the Optimization Verification test) , , x , , x(y), , y x , arg max_yScore_x(y), , . x=A, y=S.

, y* — «» , y_out. Score_x(y*) > Score_x(y_out). , . , . , Score_x(y).

. , . C Score_C(E) E. , Score_C(E) = P(E|C), E, , C.

, , .

, E_out E*. , Score_C(E*) > Score_C(E_out). , Score_C(.) E* E_out; , . , Score_C(.).

« » : (approximate scoring function) Score_x(.), (approximate maximization algorithm). , (The Optimization Verification test) .

46.

, , . , , .

«». , . -. , , .

« » R(.), T. , T , R(T) = -1000 — «» . T, , R(T) , , . R(.), , T. , , , . — .

, R(T) , , , max_TR(T). .
, R(.) , . , , - — .

— , , , , max_TR(T) , , ?
(Optimization Verification test), T_human, , -, T_out . , T_human T_out. : , R(T_human) > R(T_out)?

1: , R(.) , T_human T_out. , , T_out, . , .

2: : R(T_human) ≤ R(T_out). , R(.) T_human , T_out, , T_human . R(.), .

«» Score_x(.) . x, Score(.). Score(T)=R(T), (optimization algorithm) , , T.

أحد الاختلافات بين هذا والأمثلة السابقة هو أن جودة الخوارزمية لا تتم مقارنتها بالنتيجة "المثلى" ، ولكن مع المسار _البشري T _human . افترضنا أن _{الإنسان} T جيد بما فيه الكفاية ، حتى لو لم يكن الأمثل. بشكل عام ، طالما لديك بعض النتائج y * (في هذا المثال ، T _human ) التي تتجاوز جودة النظام - حتى لو لم تكن "مثالية" ، فإن اختبار التحقق من التحسين سيشير إلى أن أكثر واعدة: لتحسين خوارزمية التحسين أو وظيفة التقييم.

استمرار

ترجمة كتاب أندرو أون ، شغف التعلم الآلي ، الفصول 44-46

خوارزميات التصحيح النهائية

44. اختبار للتحقق من التحسين (اختبار التحقق من التحسين)

45. (The Optimization Verification test).

46.

More articles: