Änderungen

Zur Navigation springen Zur Suche springen
459 Bytes hinzugefügt ,  07:02, 24. Dez. 2020
keine Bearbeitungszusammenfassung
Zeile 3: Zeile 3:  
== Fernsteuerung von Firefox ==
 
== Fernsteuerung von Firefox ==
   −
Um [[Firefox]] fernzusteuern, bedarf es noch des [https://github.com/mozilla/geckodriver/releases geckodriver], der von [https://github.com/mozilla/geckodriver/releases Github] herunterzuladen ist und dann im Pfad enthalten sein muss. Z.B. in <code>/usr/local/bin/</code>.  
+
Um [[Firefox]] fernzusteuern, bedarf es noch des [https://github.com/mozilla/geckodriver/releases geckodriver], der von [https://github.com/mozilla/geckodriver/releases Github] herunterzuladen ist und dann im Pfad enthalten sein muss. Z.B. in <code>/usr/local/bin/</code>.
 +
 
 +
== Fernsteuerung von Chromium ==
 +
 
 +
Um Chromium fernzusteuern, bedarf es des ChromeDrivers<ref>https://sites.google.com/a/chromium.org/chromedriver/getting-started</ref>. Dieser kann unter Debian 9 Stretch mit folgendem Befehl installiert werden:
 +
  sudo aptitude install chromium-chromedriver
    
== Schnelleres Parsen von Tabellen ==
 
== Schnelleres Parsen von Tabellen ==
Zeile 12: Zeile 17:  
   Document doc = Jsoup.parse(source, "UTF-8");
 
   Document doc = Jsoup.parse(source, "UTF-8");
    +
== Alternativen ==
 +
 +
In der Nodejs-Welt gibt es Alternativen zu Selenium, z.B.
 +
* Puppeteer
 +
** https://www.lewuathe.com/simple-crawling-with-puppeteer-in-typescript.html
    
--------
 
--------
 
<references/>
 
<references/>
 
[[Category:Internet]]
 
[[Category:Internet]]

Navigationsmenü