Mam problem, jestem pobierania plików xlsx w repozytorium Google. Kiedy chcę użyć ich później dostanę plik dużego obiektu binarnego.
Po tym gubię się w tym, jak używać rzeczywisty plik xlsx.
from google.cloud import storage
import openpyxl
client = storage.Client()
new_bucket = client.get_bucket('bucket.appspot.com')
#get blob object:
o = new_bucket.get_blob('old_version.xlsx')
# <Blob: blobstorage.appspot.com, old_version.xlsx, 16372393787851916>
#download the object
bytes_version = o.download_as_bytes()
#load it to openpyxl library
wb = load_workbook(filename = bytes_version ,data_only=True)
InvalidFileException: openpyxl does not support b'.xmlpk\x05\x06\x00\x00\x00\x00:\x00:\x00n\x10\x00\x00\xa6\x06\x01\x00\x00\x00' file format, please check you can open it with Excel first. Supported formats are: .xlsx,.xlsm,.xltx,.xltm
Ostatecznym celem byłoby pobrać plik jako obiekt i odczytać go za pomocą biblioteki openpyxl (działa z plikiem źródłowym, ale po przechowywania w chmurze nie znalazła sposoby, aby mój plik xlsx).
Dziękuję za pomoc !
edycja: dodawanie bieżącego kodu