Lokale LLMs statt Alleskönner: Warum schlanke KI-Modelle die Zukunft der Prozessautomatisierung sind
Künstliche Intelligenz kann das ändern. Doch je leistungsfähiger KI-Systeme werden, desto größer, teurer und ressourcenhungriger werden sie auch. Das wirft eine entscheidende Frage auf: Brauchen wir wirklich ein KI-System, das alles kann – oder reicht eines, dass unsere Anfrage richtig gut beherrscht?
Genau dieser Aufgabe widmet sich das Forschungsprojekt SLIMDOC – eine Kooperation zwischen Insiders und der Hochschule RheinMain.
KI wird mächtiger – und teurer
Moderne KI-Sprachmodelle wie GPT oder vergleichbare Systeme sind beeindruckend vielseitig. Sie schreiben Texte, beantworten komplexe Fragen, übersetzen Sprachen und lösen Programmieraufgaben. Doch diese Vielseitigkeit hat ihren Preis: Die Modelle werden von Monat zu Monat größer, der Betrieb kostet enorme Mengen an Rechenleistung und Energie – und damit auch Geld.
Für Unternehmen, die KI für klar definierte Aufgaben einsetzen möchten – etwa das automatische Auslesen einer Rechnung – stellt sich eine naheliegende Frage: Warum soll ein Modell, das Dokumente verarbeitet, gleichzeitig wissen, wie man Pasta kocht?
Das braucht es nicht. Aber genau das ist das Problem: Heute werden große Allzweckmodelle genutzt die wirtschaftlich kaum lokal betrieben werden können oder kleine Spezialmodelle, die zwar ressourcenschonend sind, aber auch aufwändig mit händisch annotierten Daten trainiert werden müssen.
Was ist SLIMDOC – und warum ist es besonders?
SLIMDOC steht für „Synergetic LIghtweight Multimodal DOCument Analysis“ und ist ein Forschungsprojekt der Hochschule RheinMain mit einem klaren Ziel: KI-Modelle, die Dokumente zuverlässig analysieren – schlanker, schneller und nachhaltiger als bisher.
Der Ansatz: Per „Knowledge Distillation“ wird das Wissen großer Sprachmodelle auf kleine, aufgabenspezifische Modelle übertragen. Das Ergebnis sind kompakte Sprachmodelle, die nur das können, was sie brauchen – ohne Cloud-Abhängigkeit, ohne unnötigen Ressourcenverbrauch, mit vollem Datenschutz.
Da Dokumente selten nur aus Text bestehen, setzt SLIMDOC auf multimodale Analyse: Text, Bilder und Layout werden gemeinsam ausgewertet. Konkret geplant sind zwei Anwendungsfälle – Analyse von Geschäftsberichten und Plausibilitätsprüfung von Versicherungsfällen – gemeinsam mit R+V Versicherung und der Doxis.
Warum wir dabei sind
Wir bei Insiders automatisieren dokumentenzentrierte Geschäftsprozesse – seit mehr als 25 Jahren. Ob handgeschriebene Formulare, komplexe Tabellen, Scans oder digitale PDFs: Unsere Software liest, versteht und verarbeitet Dokumente aller Art.
Dabei setzen wir schon länger auf eine Kombination aus eigener KI-Technologie und großen Sprachmodellen. Und wir erkennen dabei immer deutlicher: Die Richtung, in die sich KI-Modelle entwickeln, wird früher oder später zu einem ernsthaften Problem für den praktischen Einsatz.
Deshalb engagieren wir uns aktiv in der Forschung – und sind zentraler Praxispartner im Projekt SLIMDOC.
