NawiSEO S1 - Parser Sitemap XML

Damian Ślimak , 2025-12-25

n8nwordpress

Parser Sitemap XML

Parser Sitemap XML dla n8n

Zamiast ręcznie kopiować URL-e z sitemapy lub płacić za narzędzia, które robią to samo, zbudowałem prosty workflow w n8n. Automat wchodzi na Twoją sitemapę, wyciąga z niej wszystkie linki (nawet jeśli są zagnieżdżone w sitemap_index.xml) i wrzuca je do czystego arkusza Google Sheets.

Widziałem masę projektów, gdzie SEOwiec tracił godziny na ręczne kompletowanie URL-i do audytu. Tutaj dzieje się to w tle. To nie teoria – używam tego automatu w każdym audycie, który przeprowadzam.

Jak to działa? (Konkret)

Workflow nie jest skomplikowany, ale robi jedną ważną rzecz: czyści dane i obsługuje zagnieżdżenia.

  1. Pobranie Sitemapy (HTTP Request): Automat uderza pod wskazany adres (np. /sitemap.xml) i pobiera surowy kod.
  2. Inteligentny Regex (Code): To jest klucz. Nie używam standardowych parserów XML, które często się wykładają przy dziwnych formatowaniach (np. w PrestaShop czy starych Wordpressach). Napisałem prosty regex, który wyciąga zawartość znacznika <loc>, czyści protokoły i zbędne końcówki.
  3. Obsługa zagnieżdżeń (If + Loop): Problem polega na tym, że większość dużych serwisów ma sitemap_index.xml, która tylko linkuje do innych map. Mój automat to wykrywa. Jeśli link kończy się na .xml, skrypt wchodzi głębiej (pętla). Dzięki temu masz pewność, że nie pominiesz żadnego produktu czy wpisu.
  4. Zrzut do Google Sheets: Na końcu dostajesz gotowy plik z kolumnami: url oraz type (automatycznie wyciągnięty z URL-a, np. ‘product’, ‘category’, ‘blog’).

Więc co z tego masz?

Konfiguracja (3 minuty)

Wymagania są minimalne:

  1. Google Sheets: Podajesz ID pustego arkusza w węźle konfiguracyjnym.
  2. Adres Sitemapy: Wklejasz link do swojej mapy głównej.

Pobierz Workflow

Nie musisz budować tego od zera. Udostępniam gotowy plik JSON do importu dla społeczności.

Pobierz ten Workflow

Plik nawiseo-s1-parser.json czeka na Ciebie w naszej społeczności.