Lokale LLMs statt Alles­könner: Warum schlanke KI-Modelle die Zukunft der Pro­zess­au­to­ma­ti­sie­rung sind

Lokale LLMs für die Pro­zess­au­to­ma­ti­sie­rung – wie schlanke KI-Modelle effi­zi­enter arbeiten und was SLIMDOC damit zu tun hat.
Jeden Tag landen Millionen von Doku­menten in den Systemen von Banken, Ver­si­che­rungen und Behörden: Rech­nungen, Verträge, Scha­dens­mel­dungen, Formulare. Viele davon werden noch immer manuell gesichtet – ein enormer Zeit- und Kos­ten­faktor.

Künst­liche Intel­li­genz kann das ändern. Doch je leis­tungs­fä­higer KI-Systeme werden, desto größer, teurer und res­sour­cen­hung­riger werden sie auch. Das wirft eine ent­schei­dende Frage auf: Brauchen wir wirklich ein KI-System, das alles kann – oder reicht eines, dass unsere Anfrage richtig gut beherrscht?

Genau dieser Aufgabe widmet sich das For­schungs­pro­jekt SLIMDOC – eine Koope­ra­tion zwischen Insiders und der Hoch­schule RheinMain.

KI wird mächtiger – und teurer

Moderne KI-Sprach­mo­delle wie GPT oder ver­gleich­bare Systeme sind beein­dru­ckend viel­seitig. Sie schreiben Texte, beant­worten komplexe Fragen, über­setzen Sprachen und lösen Pro­gram­mier­auf­gaben. Doch diese Viel­sei­tig­keit hat ihren Preis: Die Modelle werden von Monat zu Monat größer, der Betrieb kostet enorme Mengen an Rechen­leis­tung und Energie – und damit auch Geld.

Für Unter­nehmen, die KI für klar defi­nierte Aufgaben einsetzen möchten – etwa das auto­ma­ti­sche Auslesen einer Rechnung – stellt sich eine nahe­lie­gende Frage: Warum soll ein Modell, das Dokumente ver­ar­beitet, gleich­zeitig wissen, wie man Pasta kocht?

Das braucht es nicht. Aber genau das ist das Problem: Heute werden große All­zweck­mo­delle genutzt die wirt­schaft­lich kaum lokal betrieben werden können oder kleine Spe­zi­al­mo­delle, die zwar res­sour­cen­scho­nend sind, aber auch aufwändig mit händisch anno­tierten Daten trainiert werden müssen.

Was ist SLIMDOC – und warum ist es besonders?

SLIMDOC steht für „Syn­er­getic LIght­weight Mul­ti­modal DOCument Analysis“ und ist ein For­schungs­pro­jekt der Hoch­schule RheinMain mit einem klaren Ziel: KI-Modelle, die Dokumente zuver­lässig ana­ly­sieren – schlanker, schneller und nach­hal­tiger als bisher.

Der Ansatz: Per „Knowledge Distil­la­tion“ wird das Wissen großer Sprach­mo­delle auf kleine, auf­ga­ben­spe­zi­fi­sche Modelle über­tragen. Das Ergebnis sind kompakte Sprach­mo­delle, die nur das können, was sie brauchen – ohne Cloud-Abhän­gig­keit, ohne unnötigen Res­sour­cen­ver­brauch, mit vollem Daten­schutz.

Da Dokumente selten nur aus Text bestehen, setzt SLIMDOC auf mul­ti­mo­dale Analyse: Text, Bilder und Layout werden gemeinsam aus­ge­wertet. Konkret geplant sind zwei Anwen­dungs­fälle – Analyse von Geschäfts­be­richten und Plau­si­bi­li­täts­prü­fung von Ver­si­che­rungs­fällen – gemeinsam mit R+V Ver­si­che­rung und der Doxis.

Warum wir dabei sind

Wir bei Insiders auto­ma­ti­sieren doku­men­ten­zen­trierte Geschäfts­pro­zesse – seit mehr als 25 Jahren. Ob hand­ge­schrie­bene Formulare, komplexe Tabellen, Scans oder digitale PDFs: Unsere Software liest, versteht und ver­ar­beitet Dokumente aller Art.

Dabei setzen wir schon länger auf eine Kom­bi­na­tion aus eigener KI-Tech­no­logie und großen Sprach­mo­dellen. Und wir erkennen dabei immer deut­li­cher: Die Richtung, in die sich KI-Modelle ent­wi­ckeln, wird früher oder später zu einem ernst­haften Problem für den prak­ti­schen Einsatz.

Deshalb enga­gieren wir uns aktiv in der Forschung – und sind zentraler Pra­xis­partner im Projekt SLIMDOC.

FAQs

Was sind lokale LLMs und warum lohnen sie sich für Unter­nehmen?

L
K
Lokale LLMs laufen direkt auf der eigenen Infra­struktur – ohne Daten an externe Cloud-Dienste zu über­mit­teln. Das erhöht den Daten­schutz, reduziert Anbie­ter­ab­hän­gig­keiten und senkt lang­fristig die Betriebs­kosten.

Was versteht man unter KI-Doku­men­ten­ana­lyse?

L
K
KI-Doku­men­ten­ana­lyse bezeichnet den auto­ma­ti­sierten Einsatz von KI, um Inhalte aus Doku­menten zu erkennen, zu extra­hieren und wei­ter­zu­ver­ar­beiten – von Rech­nungen über Verträge bis hin zu hand­schrift­li­chen For­mu­laren.

Was ist Knowledge Distil­la­tion im KI-Kontext?

L
K
Knowledge Distil­la­tion überträgt das Wissen eines großen Modells auf ein kleineres, spe­zia­li­siertes Modell. Dieses lernt nur, was für seine Aufgabe relevant ist – und arbeitet dadurch effi­zi­enter und res­sour­cen­scho­nender.

Was ist mul­ti­mo­dale Doku­men­ten­ana­lyse?

L
K
Mul­ti­mo­dale Analyse bedeutet, dass KI nicht nur Text, sondern gleich­zeitig Bilder, Grafiken und das Layout eines Dokuments auswertet – etwa bei Ver­si­che­rungs­akten mit Fotos und Text­fel­dern.