Zurück zur VidCraft-Hauptseite
Der Doc-Analyzer ist VidCrafts Eingangstür für Doku-zu-Video-Pipelines. Er parst PDF/DOCX/Markdown, extrahiert Struktur, schlägt Video-Typen vor und produziert eine Szenen-Skizze — ohne dass du das Script von Hand zusammensuchst.
Faustregel: Wenn du eine Plugin-README, ein Manual oder eine Spec hast, fang immer mit
doc-analyzeran. Der Skill spart dir 80% der Recherche-Zeit.
| Use Case | Empfehlung |
|---|---|
| Plugin-Tutorial aus README | Direkt — typische Komplexität 3-5 Episoden |
| Software-Manual zu Training-Serie | Pflicht — Manual zerlegen, sonst überfrachtet |
| Whitepaper zu Explainer | Hilfreich — Top-Aussagen extrahieren |
| Spec-Dokument zu Onboarding | Hilfreich — User-Flows finden |
| Webinar-Transkript recyclen | Direkt — Re-Cut-Mode |
project-conceptualizer ist da besserbrief-creator reichtdoc-analyzer/vidcraft:doc-analyzer <file-path> [video-type]
Beispiele:
/vidcraft:doc-analyzer ~/projekte/oxid-gallery/README.md tutorial
/vidcraft:doc-analyzer ~/Downloads/synthesia-spec.pdf training
/vidcraft:doc-analyzer ~/docs/altcha-howto.docx
research/doc-analysis.md:
# Document Analysis: oxid-gallery README.md
## Statistik
- Wörter: 3.520
- Sektionen: 12
- Code-Blöcke: 18
- Listen: 7
- Bilder: 3
## Strukturanalyse
1. Einleitung (380 Wörter)
2. Voraussetzungen (210 Wörter)
3. Installation (940 Wörter, 6 Code-Blöcke)
4. Konfiguration (620 Wörter, 4 Code-Blöcke)
5. Theming (310 Wörter)
6. Troubleshooting (480 Wörter)
7. FAQ (320 Wörter)
8. Lizenz (260 Wörter)
## Komplexitäts-Bewertung
- Lesbarkeit: Flesch 58 (mittel-komplex)
- Tech-Tiefe: Mittel (Composer, OXID-Module)
- Visuell: 3 Screenshots, alle in Section "Theming"
- Zielgruppe: Shop-Admins mit OXID-Erfahrung
## Empfehlung
- **Video-Typ:** Tutorial-Serie
- **Episoden:** 3
- Ep 01: Installation (Section 1-3)
- Ep 02: Konfiguration (Section 4)
- Ep 03: Theming + Troubleshooting (Section 5-6)
- **Geschätzte Dauer:** 8-12 min total
- **Audience-Match:** Mid-Level Shop-Admin
analyze_documentParst die Datei und extrahiert Struktur.
Input:
analyze_document(file_path: str)
Output:
{
"stats": {
"words": 3520,
"sections": 12,
"code_blocks": 18,
"lists": 7,
"images": 3
},
"structure": [
{"level": 1, "title": "Introduction", "words": 380},
{"level": 1, "title": "Prerequisites", "words": 210},
...
],
"code_languages": ["bash", "php", "yaml"],
"language_detected": "de"
}
extract_key_pointsExtrahiert die wichtigsten Aussagen.
Input:
extract_key_points(file_path: str, max_points: int = 10)
Output:
{
"key_points": [
{
"rank": 1,
"text": "OXID Gallery 1.5+ requires PHP 8.1 and OXID 7.0",
"section": "Prerequisites",
"type": "constraint"
},
{
"rank": 2,
"text": "Composer-Install ohne Plugin-Activation aktiviert nicht automatisch",
"section": "Installation",
"type": "warning"
}
]
}
suggest_video_structureSchlägt eine Szenen-Skizze vor.
Input:
suggest_video_structure(file_path: str, video_type: str = "tutorial")
Output (Auszug):
{
"video_type": "tutorial",
"episodes": [
{
"title": "Installation",
"duration_estimate": "3-4 min",
"scenes": [
{"id": "01-hook", "narration_seed": "OXID Gallery installiert sich in...", "duration": "5s"},
{"id": "02-prereqs", "narration_seed": "Du brauchst PHP 8.1...", "duration": "20s"},
{"id": "03-composer", "narration_seed": "Erster Schritt: composer require...", "duration": "60s"},
...
]
}
]
}
analyze_complexityBewertet die Komplexität für Video-Typ-Empfehlung.
Input:
analyze_complexity(file_path: str)
Output:
{
"readability": 58,
"tech_depth": "medium",
"visual_density": "low",
"audience_level": "mid-admin",
"recommended_types": ["tutorial", "how-to", "training"],
"primary_recommendation": "tutorial"
}
suggest_video_topicsSchlägt mehrere Video-Themen vor (für Multi-Episoden-Pläne).
Input:
suggest_video_topics(file_path: str, max_topics: int = 5)
Output:
{
"topics": [
{"title": "OXID Gallery installieren", "type": "tutorial", "duration": "3-4 min"},
{"title": "Theming der Gallery", "type": "how-to", "duration": "4-5 min"},
{"title": "Performance-Tuning", "type": "training", "duration": "8-10 min"},
{"title": "Lightbox-Konfiguration", "type": "tutorial", "duration": "2-3 min"},
{"title": "OXID Gallery vs. native Bildkomponente", "type": "explainer", "duration": "60-90s"}
]
}
/vidcraft:doc-analyzer ~/projekte/oxid-gallery/README.md
→ Empfehlung: Tutorial-Serie, 3 Episoden
/vidcraft:new-project "OXID Gallery Tutorial" tutorial
→ Projektstruktur angelegt
/vidcraft:project-conceptualizer oxid-gallery-tutorial
→ Konzept aus doc-analysis.md ableiten
/vidcraft:brief-creator oxid-gallery-tutorial
→ Brief mit Zielgruppe + Goals
(Pro Episode:)
/vidcraft:script-writer oxid-gallery-tutorial 01-installation
/vidcraft:script-reviewer oxid-gallery-tutorial 01-installation
...
/vidcraft:doc-analyzer ~/Documents/altcha-whitepaper.pdf
→ Empfehlung: Explainer (60-120s)
/vidcraft:new-project "Was ist ALTCHA?" explainer
/vidcraft:project-conceptualizer altcha-explainer
→ Top-3 Kernaussagen aus extract_key_points
/vidcraft:script-writer altcha-explainer 01-erklaerung
/vidcraft:doc-analyzer ~/docs/altcha-spec.pdf
/vidcraft:doc-analyzer ~/docs/altcha-integration.md
/vidcraft:doc-analyzer ~/docs/altcha-faq.docx
→ 3 separate doc-analysis.md Dateien
/vidcraft:new-project "ALTCHA Training" training
/vidcraft:project-conceptualizer altcha-training
→ Aggregiert die 3 Analysen, schlägt 5-Episoden-Plan vor
/vidcraft:script-writer altcha-training 01-was-ist-altcha
/vidcraft:script-writer altcha-training 02-installation
...
| Format | Library | Was wird extrahiert |
|---|---|---|
| pdfplumber | Text, Headings, Tables (best-effort) | |
| DOCX | python-docx | Text, Headings, Listen, Tables |
| Markdown (.md) | nativ | Text, Headings, Code-Blöcke, Listen, Frontmatter |
| HTML | BeautifulSoup (geplant) | — |
| EPUB | ebooklib (geplant) | — |
PDFs ohne Text-Layer (gescannt) liefern leere Ergebnisse. OCR ist nicht eingebaut.
Doc-Analyzer funktioniert sprach-neutral, aber:
Tabellen aus PDFs sind oft ein Glücksspiel — pdfplumber versucht es, aber komplexe Layouts (verbundene Zellen, Multi-Column) gehen verloren. Bei wichtigen Tabellen: Inhalt manuell aus dem Quelldokument prüfen.
Doc-Analyzer extrahiert keine Bilder. Er erkennt nur, dass sie da sind und meldet die Position. Für Screenshots: screenshot-planner nutzen, nicht doc-analyzer.
Praktisches Limit: ~50.000 Wörter pro Doc. Bei größeren Dokumenten ist die Empfehlung weniger zielsicher — splitte in logische Teile (z.B. Kapitel-weise).
# Doc Analysis: oxid-gallery/README.md
> Analyzed: 2026-04-25 14:32 UTC
## Source Stats
- Path: ~/projekte/oxid-gallery/README.md
- Format: Markdown
- Size: 18 KB
- Words: 3.520
- Sections: 12 (max depth: 3)
- Code blocks: 18 (bash: 12, php: 4, yaml: 2)
- Lists: 7 (ordered: 4, unordered: 3)
- Images: 3 (alle in Section "Theming")
- Language: de (confidence 0.94)
## Section Breakdown
| # | Title | Level | Words | Has Code | Has List |
|---|-------|-------|-------|----------|----------|
| 1 | Einleitung | 1 | 380 | no | no |
| 2 | Voraussetzungen | 1 | 210 | no | yes |
| 3 | Installation | 1 | 940 | yes (6) | yes |
| 4 | Konfiguration | 1 | 620 | yes (4) | yes |
| 5 | Theming | 1 | 310 | yes (2) | no |
| ... | ... | ... | ... | ... | ... |
## Key Points (Top 10)
1. [HIGH] OXID Gallery 1.5+ requires PHP 8.1 and OXID 7.0
2. [HIGH] Composer-Install ohne Plugin-Activation aktiviert nicht automatisch
3. [MID] Theme-Override über `bin/oe-console oe:theme:activate`
4. [MID] Lightbox-Lib ist Fancybox 5 (LGPL — Lizenz-Kontext beachten)
5. [LOW] Default-Image-Größe: 1200x800px
6. ...
## Complexity Assessment
- Readability: Flesch 58 (medium-complex)
- Tech depth: medium (Composer, OXID modules)
- Visual: 3 screenshots — alle in "Theming"
- Audience: Mid-level shop admin
## Recommended Video Type
- Primary: tutorial-series (3 episodes)
- Alternative: training (single 12-min)
- Reason: code-heavy + step-based + admin audience
## Suggested Episode Plan
### Ep 01 — Installation (target: 3-4 min)
- Hook: "Stop messing with FTP-only-Plugins."
- Prereqs scene
- Composer-Install scene
- Activate-Plugin scene
- Verification scene
- CTA: "Ep 02: Konfiguration"
### Ep 02 — Konfiguration (target: 3-4 min)
- Hook (über Konfig-Möglichkeiten)
- Theme-Settings scene
- Lightbox-Config scene
- ...
### Ep 03 — Theming + Troubleshooting (target: 4-5 min)
...
analyze_document schlägt mit Import-Error fehlUrsache: pdfplumber oder python-docx fehlt im venv.
Lösung:
~/.vidcraft/venv/bin/pip install pdfplumber python-docx
Ursache: Gescannter PDF ohne Text-Layer.
Lösung: OCR vorab (z.B. via ocrmypdf):
ocrmypdf input.pdf output-ocr.pdf
/vidcraft:doc-analyzer output-ocr.pdf
Ursache: Doc deckt mehrere Themen ab — Empfehlung wird unscharf.
Lösung: Doc splitten oder explizit Video-Typ vorgeben:
/vidcraft:doc-analyzer mein-doc.md training
Ursache: Sprach-Detection wählt eine Dominanz, andere Inhalte werden suboptimal eingeordnet.
Lösung: Doc nach Sprache splitten und zwei Analysen fahren.