🌀 🧑🏾 🤞🏾 संयमी तंत्रिका नेटवर्क प्रशिक्षण 🥑 👩🏻‍⚖️ 🤽

प्रशिक्षण तंत्रिका नेटवर्क की समस्याओं में से एक है मुंहतोड़ जवाब देना। यह तब होता है जब एल्गोरिथ्म ने उस डेटा के साथ अच्छी तरह से काम करना सीखा, जो उसने देखा था, लेकिन दूसरों पर यह अधिक खराब हो गया। लेख में, हम इस बारे में बात करते हैं कि कैसे हमने धीरे-धीरे सीखने और विकासवादी दृष्टिकोण के साथ संयोजन करके इस समस्या को हल करने की कोशिश की।

किसी को बेहतर समझने के लिए क्या नीचे चर्चा की जाएगी चाहता है, तो आप पर इन लेखों को पढ़ सकते हब : article1 और article2

( , , , )

, , . .

, , . , .

P.S. , , ., , , . .

N -
K
-
( )
goto 1

— CIFAR10
— resnet18
— SGD
— CrossEntropyLoss
— accuracy
5
50 ,
40-50

: , ..

№1. .

: Adding Gradient Noise Improves Learning for Very Deep Networks, Evolutionary Stochastic Gradient Descent for Optimization of Deep Neural Networks.

For i in range(N):
    N  - 
       SGD
   #   
   For k in range(K):
         
             .

, .

G .

, , .
( 1) . — . ?
.


1. accuracy.

, . accuracy , , . . ( 2).


2. .

.
? ? . SGD () . . , .

:
Accuracy 47.81% — .
Accuracy 47.72% — SGD.

. 40 . SGD . .


1. ccuracy, resnet18, CIFAR10 10 , SGD. 40 5 . . SGD, .

:--:
2. ccuracy, resnet18, CIFAR10 10 , SGD. 40 5 . accuracy. SGD, .

4 , resnet18 accuracy. accuracy. .

. .
, . , .

, .

.. , . . , .

, .
. , .

. .
backward.

№2.

OpenAI Evolution Strategies as a Scalable Alternative to Reinforcement Learning, https://github.com/staturecrane/PyTorch-ES

For i in range(N):
    N  -   SGD
   For k in range(K):

— . -1 1 σ, .

normalized_rewards = (rewards - np.mean(rewards)) / np.std(rewards)
for index, param in enumerate(self.weights):
   A = np.array([p[index] for p in population])
   rewards_pop = torch.from_numpy(np.dot(A.T,normalized_rewards).T).float()
   param.data = param.data + LEARNING_RATE/(POPULATION_SIZE * SIGMA) * rewards_pop

. - . , . .

/ — SGD+
/ — SGD

C	Pretrained

Loss — , . SGD , , .

Validation — accuracy. , - 5 SGD , , , SGD+

Final score — accuracy , .

: SGD , c .
, , , , Google .

accuracy

		Pretrained
SGD	47.72%	68.56 %
	47.81%	68.61 %
SGD + OpenAI	49.82%	69.45 %

Adam, , . .
इसके लिए एक अलग शेल लिखने के बजाय, उत्परिवर्तन का हिस्सा बनाना संभव था
हमारी योजना से कई गुना अधिक समय लगा

हमें केवल सामग्री पर ही नहीं, बल्कि संपूर्ण रूप से लेख पर प्रतिक्रिया प्राप्त करने में खुशी होगी। यदि आप इस विषय में रुचि रखते हैं या रुचि रखते हैं, तो भी लिखें, बात करना बहुत अच्छा होगा, शायद हम कुछ चूक गए।

उपयोगी कड़ियाँ

संयमी तंत्रिका नेटवर्क प्रशिक्षण

№1. .

№2.

More articles: