Selenium: Unterschied zwischen den Versionen
Zur Navigation springen
Zur Suche springen
";
Document doc = Jsoup.parse(source, "UTF-8");
Codica (Diskussion | Beiträge) |
Codica (Diskussion | Beiträge) |
||
Zeile 4: | Zeile 4: | ||
Um [[Firefox]] fernzusteuern, bedarf es noch des [https://github.com/mozilla/geckodriver/releases geckodriver], der von [https://github.com/mozilla/geckodriver/releases Github] herunterzuladen ist und dann im Pfad enthalten sein muss. Z.B. in <code>/usr/local/bin/</code>. | Um [[Firefox]] fernzusteuern, bedarf es noch des [https://github.com/mozilla/geckodriver/releases geckodriver], der von [https://github.com/mozilla/geckodriver/releases Github] herunterzuladen ist und dann im Pfad enthalten sein muss. Z.B. in <code>/usr/local/bin/</code>. | ||
+ | |||
+ | == Schnelleres Parsen von Tabellen == | ||
+ | |||
+ | Das Parsen von Tabellen nimmt in Selenium einige Zeit in Anspruch. Angeblich kann man das verbessern, indem nach Aufbau der Webpage der HTML-Code mittels [https://jsoup.org/ Jsoup] geparset wird.<ref>Siehe http://stackoverflow.com/questions/21243523/using-seleniumdriver-to-extract-all-rows-and-columns-given-a-table-element .</ref> | ||
+ | |||
+ | String source = "<table>" + driver.findElement(By.xpath(locator)).getAttribute("innerHTML") + "<table>"; | ||
+ | Document doc = Jsoup.parse(source, "UTF-8"); | ||
Version vom 8. November 2016, 21:06 Uhr
Selenium ist eine Fernsteuerung-API für verschiedene Webbrowser. In Java-Projekte integriert man es am besten mittels Maven (Group-ID:selenium-java, Artifact-ID: org.seleniumhq.selenium).
Fernsteuerung von Firefox
Um Firefox fernzusteuern, bedarf es noch des geckodriver, der von Github herunterzuladen ist und dann im Pfad enthalten sein muss. Z.B. in /usr/local/bin/
.
Schnelleres Parsen von Tabellen
Das Parsen von Tabellen nimmt in Selenium einige Zeit in Anspruch. Angeblich kann man das verbessern, indem nach Aufbau der Webpage der HTML-Code mittels Jsoup geparset wird.[1]
String source = "
" + driver.findElement(By.xpath(locator)).getAttribute("innerHTML") + "