Open Source TUI Tool · v1.4.2

Sitemap
Generator

Crawlt Websites und generiert standardkonforme sitemap.xml Dateien — mit Live-TUI, Seitenbaum und Crawl-History direkt im Terminal.

GitHub Repository Installation

Features

Was es kann

Ein vollwertiger Website-Crawler mit interaktiver Terminal-Oberfläche.

⚡

Dual-Modus

httpx für schnelles HTML-Crawling oder Playwright für JavaScript-Rendering — je nach Bedarf wechselbar.

🖥️

Live-TUI

Interaktive Terminal-Oberfläche mit Echtzeit-Fortschritt, URL-Tabelle, Statistiken und Tastenkürzel.

🌳

Seitenbaum

Hierarchische Baumansicht aller gecrawlten URLs — mit HTTP-Status und aufklappbaren Pfaden.

🤖

robots.txt

Respektiert standardmäßig die robots.txt — mit Option zum Deaktivieren für autorisierte Analysen.

🔗

Tote Links erkennen

Findet 404er und andere HTTP-Fehler automatisch beim Crawlen — inklusive der Quellseite, die den toten Link enthält.

📋

Fehlerberichte

Exportiert gefundene Fehler als JSON-Report oder JIRA-kompatible Tabelle — direkt in die Zwischenablage oder als Datei.

🎨

Themes

Anpassbare Farbthemen über textual-themes — die TUI-Oberfläche lässt sich visuell individualisieren.

📊

Auto-Split

Bei über 50.000 URLs automatisch Sitemap-Index mit Teil-Sitemaps. Priority und lastmod werden automatisch gesetzt.

📝

Formular-Erkennung

Erkennt <form>-Tags auf jeder Seite, markiert sie in der Tabelle und exportiert sie als JSON.

Tech Stack

Gebaut mit

Die Technologien hinter dem Projekt.

Python 3

Textual

Playwright

Chromium

httpx

BeautifulSoup

CLI

Parameter

Alle Optionen für die Kommandozeile.

Parameter	Beschreibung	Default
`URL`	Start-URL der Website	—
`--output` `-o`	Ausgabe-Pfad für sitemap.xml	sitemap_<host>.xml
`--max-depth` `-d`	Maximale Crawl-Tiefe	10
`--concurrency` `-c`	Parallele Requests	8
`--timeout` `-t`	Timeout pro Seite (Sekunden)	30
`--render`	JavaScript mit Playwright rendern	aus
`--ignore-robots`	robots.txt ignorieren	aus
`--cookie`	Cookie setzen (NAME=VALUE, mehrfach)	—

Installation

Schnellstart

One-Liner Installation — kein Python nötig.

Linux / macOS

curl -fsSL https://raw.githubusercontent.com/michaelblaess/sitemap-generator/main/install.sh | bash

Windows (PowerShell)

irm https://raw.githubusercontent.com/michaelblaess/sitemap-generator/main/install.ps1 | iex

Windows

Linux

macOS

SitemapGenerator