Dein Verantwortungsbereich
Motivation & Relevanz: Die Umstellung auf eine moderne Reporting‑Engine erfordert bei RAQUEST die Migration von über 900 PDF‑Templates und die Anpassung an ein neues Datenmodell. Diese Aufgabe ist für die Produktqualität und Skalierbarkeit des Systems zentral und bietet zugleich ein praxisnahes Forschungsthema an der Schnittstelle von Machine Learning, Program Analysis und Dokumentenverarbeitung.
Projektbeschreibung: Ziel der Arbeit ist die Entwicklung eines KI‑gestützten Verfahrens zur weitestgehend automatisierten Übertragung von Layout‑ und Datenpfadinformationen vom alten in das neue Templateformat. Neben der Implementierung eines prototypischen Migrationspipelines ist eine systematische Evaluation der Migrationsqualität und der Einflüsse von Modell‑ und Trainingsparametern vorgesehen.
Konkrete Aufgaben / Arbeitspakete
Projektbeschreibung: Ziel der Arbeit ist die Entwicklung eines KI‑gestützten Verfahrens zur weitestgehend automatisierten Übertragung von Layout‑ und Datenpfadinformationen vom alten in das neue Templateformat. Neben der Implementierung eines prototypischen Migrationspipelines ist eine systematische Evaluation der Migrationsqualität und der Einflüsse von Modell‑ und Trainingsparametern vorgesehen.
Konkrete Aufgaben / Arbeitspakete
- Analyse alter und neuer Templateformate sowie des aktuellen Datenmodells
- Datensammlung und Aufbereitung (Beispieltemplates, Metadaten)
- Entwicklung eines KI‑basierten Mappings (z. B. regelbasierte + ML‑Komponenten) zur Extraktion und Zuordnung von Layout‑/Feldinformationen
- Implementierung eines Migrationsprototyps inkl. Test‑ und Validierungspipeline
- Quantitative Evaluation (Metriken zur Genauigkeit der Datenpfadzuordnung, Layout‑Ähnlichkeit, Reduktion des manuellen Aufwands)
- Dokumentation, Abschlussbericht und ggf. wissenschaftliche Auswertung