2.9 KiB
2.9 KiB
Projektplan (Neustart)
Leitentscheidungen
- Bestehendes Repository wird weiterverwendet.
- Kein harter Endtermin: lauffaehig werden, dann iterativ verbessern.
- Hetzner bleibt Laufzeitplattform.
- WordPress (IONOS) bleibt vorerst Ziel fuer Publikation.
- Auth initial nur mit einem User/Password.
Zielbild
Eine modulare News-Pipeline mit klaren Stufen:
- Feed-Ingestion
- Inhaltsanalyse und Normalisierung
- Rewrite/Anreicherung
- Legal- und Qualitaetschecks
- WordPress-Publikation (Draft-first, Queue + Retry)
- Monitoring/Logging
Grobe Zeitplanung (ohne Fixtermine)
- Phase 0: ca. 1 Woche
- Phase 1: ca. 2-4 Wochen
- Phase 2: ca. 2-3 Wochen
- Phase 3: fortlaufend
Phasen
Phase 0 - Grundlagen (jetzt)
- Doku und Wiki strukturieren
- Source-Policy definieren
- Redirect fuer
news.vanityontour.desetzen - GitHub Project als zentrale Planung scharfstellen
Phase 1 - MVP Core
- Neues FastAPI-Projektgeruest
- SQLite-Datenmodell (feeds, articles, runs, source_policy)
- Feed-Import mit Duplikaterkennung
- Admin-Login (ein User)
- Manuelle Review vor Publish
- Admin-UI fuer Rechtscheck, Bildauswahl, Relevanzbewertung
Phase 2 - Automation
- Job-Queue (asynchron)
- Regelbasierte Scheduler
- Retry/Dead-Letter-Handling
- Robustes Error-Reporting
- WordPress-Publisher (Draft) mit Mapping
article_id -> wp_post_id
Phase 3 - Compliance und Skalierung
- Source-Whitelisting mit Pflichtfeldern
- Pflicht-Attribution pro Artikel
- Qualitaetsmetriken und Audit-Logs
- Optional: Passkey/WebAuthn
Aktueller Stand (Snapshot)
- Backend/API + Admin-UI lauffaehig
- Feed-Ingestion inkl. Originalartikel-Extraktion (Autor, Pressekontakt, Bilder)
- Bildkuration:
- automatische Scoring-Reduktion (u. a. Presseportal
story_bigpriorisiert) - manuelle Auswahl/Ausblendung im UI
- automatische Scoring-Reduktion (u. a. Presseportal
- Rechts-/Publish-Gates aktiv:
legal_checkedPflicht- Hauptbild-Auswahl Pflicht
- Status-Workflow bis
published
- WordPress-Publishing:
- Queue + Retry + Job-Historie
- Draft-Erstellung/Update erfolgreich getestet
- Exporte:
- JSON/CSV inkl. Datum/Alter/Relevanz + Attribution/Legal-Felder
Naechste Iteration (konkret)
- WordPress
featured_mediaUpload aus ausgewaehltem Hauptbild - Publish-HTML je Artikel verfeinern (strukturierter Body + konsistenter Quellenblock)
- Publisher als periodischen Worker (Timer/Cron/Systemd) auf Hetzner betreiben
- Monitoring/Alerting fuer Queue-Fehler + WP-API Fehlercodes
Architekturprinzipien
- Idempotente Jobs
- Trennung von UI, API, Worker
- Strikte Validierung bei Quell-/Lizenzdaten
- Expliziter Publish-Schritt, kein blindes Autoposting
Risiken
- Lizenz-/Nutzungsbedingungen je Quelle variieren stark
- Feeds aendern Struktur/Verfuegbarkeit
- WordPress-API und Auth koennen regressionsanfaellig sein
Erfolgsmetriken
- Zeit von Feed-Eingang bis Review-Ready
- Quote sauber attribuierter Artikel
- Fehlerrate pro Pipeline-Stufe
- Anzahl manueller Eingriffe pro Woche