🕵️ 🍃 🤴🏽 Treinamento da rede neural espartana 🙍🏽 🐾 👨🏽‍🤝‍👨🏼

Um dos problemas do treinamento de redes neurais é o treinamento. Foi quando o algoritmo aprendeu a funcionar bem com os dados que viu, mas em outros ele lida pior. No artigo, descrevemos como tentamos resolver esse problema combinando treinamento com descida de gradiente e uma abordagem evolutiva.

imagem

Se alguém quiser entender melhor o que será discutido abaixo, você poderá ler estes artigos no hub : article1 e article2

( , , , )

, , . .

, , . , .

P.S. , , ., , , . .

N -
K
-
( )
goto 1

— CIFAR10
— resnet18
— SGD
— CrossEntropyLoss
— accuracy
5
50 ,
40-50

: , ..

№1. .

: Adding Gradient Noise Improves Learning for Very Deep Networks, Evolutionary Stochastic Gradient Descent for Optimization of Deep Neural Networks.

For i in range(N):
    N  - 
       SGD
   #   
   For k in range(K):
         
             .

, .

G .

, , .
( 1) . — . ?
.


1. accuracy.

, . accuracy , , . . ( 2).


2. .

.
? ? . SGD () . . , .

:
Accuracy 47.81% — .
Accuracy 47.72% — SGD.

. 40 . SGD . .


1. ccuracy, resnet18, CIFAR10 10 , SGD. 40 5 . . SGD, .

:--:
2. ccuracy, resnet18, CIFAR10 10 , SGD. 40 5 . accuracy. SGD, .

4 , resnet18 accuracy. accuracy. .

. .
, . , .

, .

.. , . . , .

, .
. , .

. .
backward.

№2.

OpenAI Evolution Strategies as a Scalable Alternative to Reinforcement Learning, https://github.com/staturecrane/PyTorch-ES

For i in range(N):
    N  -   SGD
   For k in range(K):

— . -1 1 σ, .

normalized_rewards = (rewards - np.mean(rewards)) / np.std(rewards)
for index, param in enumerate(self.weights):
   A = np.array([p[index] for p in population])
   rewards_pop = torch.from_numpy(np.dot(A.T,normalized_rewards).T).float()
   param.data = param.data + LEARNING_RATE/(POPULATION_SIZE * SIGMA) * rewards_pop

. - . , . .

/ — SGD+
/ — SGD

C	Pretrained

Loss — , . SGD , , .

Validation — accuracy. , - 5 SGD , , , SGD+

Final score — accuracy , .

: SGD , c .
, , , , Google .

accuracy

		Pretrained
SGD	47.72%	68.56 %
	47.81%	68.61 %
SGD + OpenAI	49.82%	69.45 %

Adam, , . .
Foi possível fazer das mutações parte do otimizador, em vez de escrever um shell separado para esse
Demorou várias vezes mais tempo do que planejamos

Teremos o maior prazer em receber feedback não apenas sobre o conteúdo, mas também sobre o próprio artigo como um todo. Se você está interessado neste tópico ou se interessou, escreva também, seria ótimo conversar, talvez tenhamos perdido alguma coisa.

Links Úteis

Treinamento da rede neural espartana

№1. .

№2.

More articles: