Mam dwie ramki danych pandy, to tak:
df1
Strona | Link |
---|---|
retailer_site1 | https://www.retailer_site1.com |
... | ... |
retailer_siteX | https://www.retailer_siteX.com |
df2
Strona | Link |
---|---|
retailer_site1 | https://www.retailer_site1.com |
... | ... |
retailer_siteY | https://www.retailer_siteY.com |
Dlatego chcę przejść przez df2 i znaleźć egzemplarze z linków df2 w df1. Oto mój kod:
for row in df2['link'].astype(str):
boolean_findings = df1['link'].str.contains(row)
Kiedy piszę boolean_findings, mam wszystkie fałszywe, co, jak wiem, nie może być prawdą, bo widzę zbieżności lokalnie w plikach programu excel:
logiczne powiązania |
---|
Fałszywy |
Fałszywy |
... |
Fałszywy |
Chcę wiedzieć, dlaczego tekst hiperłącza nie jest mapowany z jego odpowiednikiem w pierwszym df, i co mogę zrobić, aby dopasować internetowych.
TypeError: replace() takes no keyword arguments
. Gdy usunęregex=True
to nie prowadzi do błędu, ale i nie zastępuje go. Myślę, że zobaczę wre
moduł, aby zorientować się w tym, ale dziękuję, że prowadzą mnie na właściwą drogę!