InvalidArgumentError: КонкатОп : Rozmiary danych wejściowych muszą być zgodne w przewidywaniu na X_test z Conv2D - dlaczego?

Question 1

Studiuję Tensorflow i staram się zbudować klasyfikator na podstawie zestawu danych Fashion MNIST. Mogę dopasować modele, ale gdy próbuję przewidzieć w swoim testowym zestawie, otrzymuję następujący błąd:

y_pred = model.predict(X_test).argmax(axis=1)

InvalidArgumentError: ConcatOp : Dimensions of inputs should match: shape[0] = [1,32,10] vs. shape[312] = [1,16,10] [Op:ConcatV2] name: concat

Nie pojawia się błąd, jeśli przewiduję na X_test pakietami, np.:

y_pred = []
step_size = 10
for i in trange(0, len(X_test), step_size):
  y_pred += model.predict(X_test[i:i+step_size]).argmax(axis=1).tolist()[0]

Poświęciłem trochę czasu na poszukiwania w Internecie i przeglądanie innych przykładów tego samego błędu, ale wciąż nie mogę zrozumieć, co robię nie tak. Próbowałem kilka różnych rzeczy, takich jak stosowanie kroków skalowania i rozszerzenia rozmiarów ręcznie do X_train i X_test przed budową modelu, ale uzyskał ten sam wynik.

To jest mój pełny kod (z wykorzystaniem Python 3.7.12 i Tensorflow 2.7.0):

import tensorflow as tf # 2.7.0
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# load data 
mnist = tf.keras.datasets.fashion_mnist
(X_train, y_train), (X_test, y_test) = mnist.load_data()

# Build model 

# Input 
inputs = tf.keras.Input(shape=X_train[0].shape)

# # Scale 
x = tf.keras.layers.Rescaling(scale=1.0/255)(inputs)

# Add extra dimension for use in conv2d
x = tf.expand_dims(x, -1)

# Conv2D
x = tf.keras.layers.Conv2D(filters=32, kernel_size=(3, 3), activation="relu", strides=2)(x)
x = tf.keras.layers.Conv2D(filters=64, kernel_size=(3, 3), activation="relu", strides=2)(x)
x = tf.keras.layers.Conv2D(filters=128, kernel_size=(3, 3), activation="relu", strides=2)(x)

# Flatten
x = tf.keras.layers.Flatten()(x),
x = tf.keras.layers.Dropout(rate=.2)(x)  # 20% chance of dropout  
x = tf.keras.layers.Dense(512, activation='relu')(x)
x = tf.keras.layers.Dropout(rate=.2)(x)   
x = tf.keras.layers.Dense(K, activation='softmax')(x)

model = tf.keras.Model(inputs=inputs, outputs=x)

# Compile
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

# Fit
r = model.fit(X_train, y_train, validation_data=[X_test, y_test], epochs=10)

# Throws an error
y_pred = model.predict(X_test).argmax(axis=1)

Co daje

InvalidArgumentError: ConcatOp : Dimensions of inputs should match: shape[0] = [1,32,10] vs. shape[312] = [1,16,10] [Op:ConcatV2] name: concat

Question 2

Z model.predict robisz prognozy według partii, jak pokazano tutaj:

Obliczenia wykonywane są pakietami. Ta metoda służy do wsadowego przetwarzania dużej ilości danych wejściowych. Nie jest on przeznaczony do stosowania wewnątrz cykli, które powtarzają swoje dane i przetwarzają niewielką ilość danych wejściowych jednocześnie.

Ale rozmiar X_test nie dzieli się równomiernie na wartość domyślną batch_size=32. Myślę, że to może być przyczyną twojego problemu. Można zmienić swoje batch_size do 16, na przykład, i to będzie działać:

y_pred = model.predict(X_test, batch_size=16).argmax(axis=1)
print(y_pred)

[[ 8  0  2 ... 14  8  2]
 [15 15  8 ... 10  8 14]
 [ 5 13  4 ...  4  5  6]
 ...
 [11 11 12 ...  7  2  3]
 [ 3  8  0 ... 15  3 14]
 [ 3 13  1 ...  1 15  0]]

Można również korzystać z model.predict_on_batch(X_test) aby dokonać prognozy dla jednej partii próbek. Jednak najbardziej elastyczni, jeśli korzystasz z funkcji połączenia modelu bezpośrednio:

y_pred = model(X_test[:10])
tf.print(tf.argmax(y_pred, axis=1), summarize=-1)

[[2 8 0 1 1 1 8 2 2 6]]

AloneTogether · Answer 1 · 2021-11-22T13:44:08

Z model.predict robisz prognozy według partii, jak pokazano tutaj:

Obliczenia wykonywane są pakietami. Ta metoda służy do wsadowego przetwarzania dużej ilości danych wejściowych. Nie jest on przeznaczony do stosowania wewnątrz cykli, które powtarzają swoje dane i przetwarzają niewielką ilość danych wejściowych jednocześnie.

Ale rozmiar X_test nie dzieli się równomiernie na wartość domyślną batch_size=32. Myślę, że to może być przyczyną twojego problemu. Można zmienić swoje batch_size do 16, na przykład, i to będzie działać:

y_pred = model.predict(X_test, batch_size=16).argmax(axis=1)
print(y_pred)

[[ 8  0  2 ... 14  8  2]
 [15 15  8 ... 10  8 14]
 [ 5 13  4 ...  4  5  6]
 ...
 [11 11 12 ...  7  2  3]
 [ 3  8  0 ... 15  3 14]
 [ 3 13  1 ...  1 15  0]]

Można również korzystać z model.predict_on_batch(X_test) aby dokonać prognozy dla jednej partii próbek. Jednak najbardziej elastyczni, jeśli korzystasz z funkcji połączenia modelu bezpośrednio:

y_pred = model(X_test[:10])
tf.print(tf.argmax(y_pred, axis=1), summarize=-1)

[[2 8 0 1 1 1 8 2 2 6]]

Dziękuję, to działa!! Jestem trochę zdezorientowany argumentem "pakiet" - co by się stało, gdyby mój rozmiar był liczbą pierwszą? Wygląda na to, że będzie trzeba więcej czytać o zapowiedziach :)

InvalidArgumentError: КонкатОп : Rozmiary danych wejściowych muszą być zgodne w przewidywaniu na X_test z Conv2D - dlaczego?

Pytanie

Najlepsza odpowiedź

W innych językach

Ta strona jest w innych językach

Popularne w tej kategorii

Najczęściej zadawane pytania w tej kategorii