
Parser Sitemap XML dla n8n
Zamiast ręcznie kopiować URL-e z sitemapy lub płacić za narzędzia, które robią to samo, zbudowałem prosty workflow w n8n. Automat wchodzi na Twoją sitemapę, wyciąga z niej wszystkie linki (nawet jeśli są zagnieżdżone w sitemap_index.xml) i wrzuca je do czystego arkusza Google Sheets.
Widziałem masę projektów, gdzie SEOwiec tracił godziny na ręczne kompletowanie URL-i do audytu. Tutaj dzieje się to w tle. To nie teoria – używam tego automatu w każdym audycie, który przeprowadzam.
Jak to działa? (Konkret)
Workflow nie jest skomplikowany, ale robi jedną ważną rzecz: czyści dane i obsługuje zagnieżdżenia.
- Pobranie Sitemapy (
HTTP Request): Automat uderza pod wskazany adres (np./sitemap.xml) i pobiera surowy kod. - Inteligentny Regex (
Code): To jest klucz. Nie używam standardowych parserów XML, które często się wykładają przy dziwnych formatowaniach (np. w PrestaShop czy starych Wordpressach). Napisałem prosty regex, który wyciąga zawartość znacznika<loc>, czyści protokoły i zbędne końcówki. - Obsługa zagnieżdżeń (
If+Loop): Problem polega na tym, że większość dużych serwisów masitemap_index.xml, która tylko linkuje do innych map. Mój automat to wykrywa. Jeśli link kończy się na.xml, skrypt wchodzi głębiej (pętla). Dzięki temu masz pewność, że nie pominiesz żadnego produktu czy wpisu. - Zrzut do Google Sheets: Na końcu dostajesz gotowy plik z kolumnami:
urloraztype(automatycznie wyciągnięty z URL-a, np. ‘product’, ‘category’, ‘blog’).
Więc co z tego masz?
- Oszczędność czasu: Klikasz “Execute” i idziesz po kawę. Tysiące URL-i lądują w arkuszu w kilka sekund.
- Fundament pod audyt: To jest pierwszy krok (S1) w moim procesie “NawiSEO”. Mając listę URL-i w arkuszu, możesz potem podpiąć kolejne automaty (np. sprawdzanie statusów 404, pobieranie meta tagów, czy analiza treści przez LLM).
- Czyste dane: Dane są od razu posegregowane. Wiesz dokładnie, ile masz produktów, a ile wpisów na blogu.
Konfiguracja (3 minuty)
Wymagania są minimalne:
- Google Sheets: Podajesz ID pustego arkusza w węźle konfiguracyjnym.
- Adres Sitemapy: Wklejasz link do swojej mapy głównej.
Pobierz Workflow
Nie musisz budować tego od zera. Udostępniam gotowy plik JSON do importu dla społeczności.
Pobierz ten Workflow
Plik nawiseo-s1-parser.json czeka na Ciebie w naszej społeczności.