Używam opcji fields w API python-elasticsearch do wydobycia niektórych danych z elasticsearch, próbując analizować etykiety @timestamp w formacie iso do użytku w ramce danych pandas.
fields = \
[{
"field": "@timestamp",
"format": "strict_date_optional_time"
}]
Domyślnie elasticsearch zwraca wyniki w postaci listy tablic, jak pokazano w dokumencie doc:
https://www.elastic.co/guide/en/elasticsearch/reference/current/search-fields.html
The fields response always returns an array of values for each field, even when there is a single value in the _source.
Z tego powodu wyników ramka danych zawiera serię listy obiektów, które nie mogą być analizowane w serię danych czasu konwencjonalnymi metodami.
Name: fields.@timestamp, Length: 18707, dtype: object
0 [2021-11-04T01:30:00.263Z]
1 [2021-11-04T01:30:00.385Z]
2 [2021-11-04T01:30:00.406Z]
3 [2021-11-04T01:30:00.996Z]
4 [2021-11-04T01:30:01.001Z]
...
8368 [2021-11-04T02:00:00.846Z]
8369 [2021-11-04T02:00:00.894Z]
8370 [2021-11-04T02:00:00.895Z]
8371 [2021-11-04T02:00:00.984Z]
8372 [2021-11-04T02:00:00.988Z]
Podczas próby przeanalizowania serii na serię datetime:
pd.to_datetime(["fields.@timestamp"])
To prowadzi do:
TypeError: <class 'list'> is not convertible to datetime
W moim przypadku wymaga wiele formatów daty i czasu, a parametr pola bardzo dobrze nadaje się do prośby wielu formatów, ale wiersz daty i czasu obiektu na liście komplikuje zadanie.