XPath
Abfragesprache zum gezielten Navigieren und Auswählen von Knoten in XML und HTML Dokumenten.
Auch bekannt als: XML Path Language
XPath ist eine Abfragesprache des W3C, mit der Sie gezielt einzelne Elemente oder Attribute innerhalb eines XML oder HTML Dokuments adressieren. Die Syntax ähnelt einer Pfad Notation, etwa //div[@class="price"]/span, und liefert genau die Knoten zurück, die einer Bedingung entsprechen. XPath ist die Grundlage vieler Tools im Bereich Scraping, Testautomatisierung und XML Verarbeitung.
Wie XPath aufgebaut ist
Ein XPath Ausdruck startet bei der Wurzel oder einem beliebigen Knoten und navigiert über Achsen wie child, descendant oder parent. Prädikate in eckigen Klammern filtern nach Attributen, Position oder Text Inhalt. Funktionen wie contains, starts-with oder normalize-space erlauben komplexe Auswertungen, die mit reinen CSS Selektoren schwer abbildbar sind.
Praxis Werkzeuge
XPath ist Standardwerkzeug in Selenium und Playwright für das Auffinden von Elementen, in Scrapy für das Extrahieren von Daten und in XSLT für die Transformation. Auch Excel und Power Automate können XPath nutzen, um XML Antworten aus Web Services zu parsen. Stolperer: zu spezifische XPath Ausdrücke brechen bei kleinen DOM Änderungen, deshalb sollten Selektoren bewusst stabil gewählt werden.
Einordnung im Marketing Alltag
Im Marketing Umfeld begegnet XPath vor allem Teams, die mit Crawlern, Konkurrenzbeobachtung oder Conversion Tests arbeiten. Auch in der Anbindung externer Datenquellen, etwa Lieferanten Feeds oder öffentlichen Datensätzen, spielt XPath eine Rolle. Wer regelmäßig Datenextraktion betreibt, profitiert von einer kleinen XPath Bibliothek mit erprobten Mustern.