Zum Hauptinhalt springen
JD Media
Zum GlossarWeb Entwicklung

XPath

Abfragesprache zum gezielten Navigieren und Auswählen von Knoten in XML und HTML Dokumenten.

Auch bekannt als: XML Path Language

XPath ist eine Abfragesprache des W3C, mit der Sie gezielt einzelne Elemente oder Attribute innerhalb eines XML oder HTML Dokuments adressieren. Die Syntax ähnelt einer Pfad Notation, etwa //div[@class="price"]/span, und liefert genau die Knoten zurück, die einer Bedingung entsprechen. XPath ist die Grundlage vieler Tools im Bereich Scraping, Testautomatisierung und XML Verarbeitung.

Wie XPath aufgebaut ist

Ein XPath Ausdruck startet bei der Wurzel oder einem beliebigen Knoten und navigiert über Achsen wie child, descendant oder parent. Prädikate in eckigen Klammern filtern nach Attributen, Position oder Text Inhalt. Funktionen wie contains, starts-with oder normalize-space erlauben komplexe Auswertungen, die mit reinen CSS Selektoren schwer abbildbar sind.

Praxis Werkzeuge

XPath ist Standardwerkzeug in Selenium und Playwright für das Auffinden von Elementen, in Scrapy für das Extrahieren von Daten und in XSLT für die Transformation. Auch Excel und Power Automate können XPath nutzen, um XML Antworten aus Web Services zu parsen. Stolperer: zu spezifische XPath Ausdrücke brechen bei kleinen DOM Änderungen, deshalb sollten Selektoren bewusst stabil gewählt werden.

Einordnung im Marketing Alltag

Im Marketing Umfeld begegnet XPath vor allem Teams, die mit Crawlern, Konkurrenzbeobachtung oder Conversion Tests arbeiten. Auch in der Anbindung externer Datenquellen, etwa Lieferanten Feeds oder öffentlichen Datensätzen, spielt XPath eine Rolle. Wer regelmäßig Datenextraktion betreibt, profitiert von einer kleinen XPath Bibliothek mit erprobten Mustern.