Czemu wagi można używać tylko na treningach?

Question 1

Po wywołaniu funkcji dopasowania widzę, że model pasuje w nauce, ale po tym, jak włączę się do wywoływania metody oceny on zachowuje się tak, jakby model w ogóle nie pełniła dopasowanie. Najlepszy przykład znajduje się poniżej, gdzie używam szkolenia generator do nauki i sprawdzania i otrzymuję różne wyniki.

import tensorflow as tf
from tensorflow.keras.callbacks import ModelCheckpoint

from ImageGenerator import ImageGenerator

if __name__== "__main__":

    batch_size=64

    train_gen = ImageGenerator('synthetic3/train/open/*.png', 'synthetic3/train/closed/*.png', batch_size=batch_size)

    model = tf.keras.applications.mobilenet_v2.MobileNetV2(weights=None, classes=2, input_shape=(256, 256, 3))

    model.compile(optimizer='adam', 
                loss=tf.keras.losses.CategoricalCrossentropy(),
                metrics=['accuracy'])

    history = model.fit(
        train_gen,
        validation_data=train_gen,
        epochs=5,
        verbose=1
    )
    
    model.evaluate(train_gen)

Wyniki

Epoch 1/5
19/19 [==============================] - 11s 600ms/step - loss: 0.7707 - accuracy: 0.5016 - val_loss: 0.6932 - val_accuracy: 0.5016
Epoch 2/5
19/19 [==============================] - 10s 533ms/step - loss: 0.6991 - accuracy: 0.5855 - val_loss: 0.6935 - val_accuracy: 0.4975
Epoch 3/5
19/19 [==============================] - 10s 509ms/step - loss: 0.6213 - accuracy: 0.6637 - val_loss: 0.6932 - val_accuracy: 0.4992
Epoch 4/5
19/19 [==============================] - 10s 514ms/step - loss: 0.4407 - accuracy: 0.8158 - val_loss: 0.6934 - val_accuracy: 0.5008
Epoch 5/5
19/19 [==============================] - 10s 504ms/step - loss: 0.3200 - accuracy: 0.8643 - val_loss: 0.6949 - val_accuracy: 0.5000
19/19 [==============================] - 3s 159ms/step - loss: 0.6953 - accuracy: 0.4967

Jest to problematyczne, bo nawet przy zachowaniu wagi to oszczędza, jak gdyby model nie pełniła dopasowanie.

Question 2

funkcja evaluate() przyjmuje zestaw danych sprawdzania jako danych wejściowych do oceny już wyszkolony modelu.

Najwyraźniej używasz szkolny zestaw danych (train_gen) w celu sprawdzenia данных_данных i przekazuje ten sam zestaw danych jako danych wejściowych do modelu.

Question 3

Witam wszystkich po wielu dniach bólu, w końcu znalazłem rozwiązanie tego problemu. Jest to związane z warstwami packet normalizacji w modelu. Parametr momentum należy zmienić w zależności od wielkości pakietu, jeśli planujesz szkolenie jako niestandardowego zestawu danych.

for layer in model.layers:
    if type(layer)==type(tf.keras.layers.BatchNormalization()):
        # renorm=True, Can have renomalization for smaller batch sizes
        layer.momentum=new_momentum

Źródła: https://github.com/tensorflow/tensorflow/issues/36065

Uğur Kahveci · Answer 1 · 2021-11-24T11:43:27

funkcja evaluate() przyjmuje zestaw danych sprawdzania jako danych wejściowych do oceny już wyszkolony modelu.

Najwyraźniej używasz szkolny zestaw danych (train_gen) w celu sprawdzenia данных_данных i przekazuje ten sam zestaw danych jako danych wejściowych do modelu.

Tak, zrobiłem to specjalnie, aby pokazać, że choć dokładność pociągi poprawia, sprawdzanie-nie. Nawet w jednym i tym samym zestawie danych

ac4824 · Answer 2 · 2021-12-10T04:30:31

Witam wszystkich po wielu dniach bólu, w końcu znalazłem rozwiązanie tego problemu. Jest to związane z warstwami packet normalizacji w modelu. Parametr momentum należy zmienić w zależności od wielkości pakietu, jeśli planujesz szkolenie jako niestandardowego zestawu danych.

for layer in model.layers:
    if type(layer)==type(tf.keras.layers.BatchNormalization()):
        # renorm=True, Can have renomalization for smaller batch sizes
        layer.momentum=new_momentum

Źródła: https://github.com/tensorflow/tensorflow/issues/36065

Czemu wagi można używać tylko na treningach?

Pytanie

Najlepsza odpowiedź

W innych językach

Ta strona jest w innych językach

Popularne w tej kategorii

Najczęściej zadawane pytania w tej kategorii