Staram się analizować niektóre strony internetowe, które wykorzystują algorytmy wykrywania botów. Używam następujące ustawienia Chrome
chrome_options = Options()
chrome_options.add_argument("start-maximized")
chrome_options.add_experimental_option("detach", True)
chrome_options.add_experimental_option("excludeSwitches", ["enable-automation"])
chrome_options.add_experimental_option('useAutomationExtension', False)
chrome_options.add_argument("--disable-blink-features")
chrome_options.add_argument('--start-maximized')
chrome_options.add_argument('window-size=1920,1080')
chrome_options.add_argument("--disable-blink-features=AutomationControlled")
driver = webdriver.Chrome(executable_path='chromedriver.exe', chrome_options=chrome_options)
driver.get(url)
Mnie też życie chromedriver.exe usuń szablon cdc_.
Gdy okno przeglądarki uruchamia się i przechodzi na stronę, witryna wykrywa go jako bota i zapobiega pobieranie zawartości. Ale gdy przeglądarka przechodzi w tryb wyłączenia, a ja ręcznie klikam przycisk "Aktualizuj", zawartość strony ładują się pomyślnie. Symulacja naciśnięcia "f5" również nie działa, strona nadal blokuje pobieranie zawartości.