sitemap-generator
Features CLI Installation GitHub
Open Source TUI Tool · v1.4.2

Sitemap
Generator

Crawlt Websites und generiert standardkonforme sitemap.xml Dateien — mit Live-TUI, Seitenbaum und Crawl-History direkt im Terminal.

GitHub Repository Installation
Features

Was es kann

Ein vollwertiger Website-Crawler mit interaktiver Terminal-Oberfläche.

Dual-Modus

httpx für schnelles HTML-Crawling oder Playwright für JavaScript-Rendering — je nach Bedarf wechselbar.

🖥️

Live-TUI

Interaktive Terminal-Oberfläche mit Echtzeit-Fortschritt, URL-Tabelle, Statistiken und Tastenkürzel.

🌳

Seitenbaum

Hierarchische Baumansicht aller gecrawlten URLs — mit HTTP-Status und aufklappbaren Pfaden.

🤖

robots.txt

Respektiert standardmäßig die robots.txt — mit Option zum Deaktivieren für autorisierte Analysen.

🔗

Tote Links erkennen

Findet 404er und andere HTTP-Fehler automatisch beim Crawlen — inklusive der Quellseite, die den toten Link enthält.

📋

Fehlerberichte

Exportiert gefundene Fehler als JSON-Report oder JIRA-kompatible Tabelle — direkt in die Zwischenablage oder als Datei.

🎨

Themes

Anpassbare Farbthemen über textual-themes — die TUI-Oberfläche lässt sich visuell individualisieren.

📊

Auto-Split

Bei über 50.000 URLs automatisch Sitemap-Index mit Teil-Sitemaps. Priority und lastmod werden automatisch gesetzt.

📝

Formular-Erkennung

Erkennt <form>-Tags auf jeder Seite, markiert sie in der Tabelle und exportiert sie als JSON.

Tech Stack

Gebaut mit

Die Technologien hinter dem Projekt.

Python 3
Textual
Playwright
Chromium
httpx
BeautifulSoup
CLI

Parameter

Alle Optionen für die Kommandozeile.

Parameter Beschreibung Default
URL Start-URL der Website
--output -o Ausgabe-Pfad für sitemap.xml sitemap_<host>.xml
--max-depth -d Maximale Crawl-Tiefe 10
--concurrency -c Parallele Requests 8
--timeout -t Timeout pro Seite (Sekunden) 30
--render JavaScript mit Playwright rendern aus
--ignore-robots robots.txt ignorieren aus
--cookie Cookie setzen (NAME=VALUE, mehrfach)
Installation

Schnellstart

One-Liner Installation — kein Python nötig.

Linux / macOS

curl -fsSL https://raw.githubusercontent.com/michaelblaess/sitemap-generator/main/install.sh | bash

Windows (PowerShell)

irm https://raw.githubusercontent.com/michaelblaess/sitemap-generator/main/install.ps1 | iex
Windows
Linux
macOS