BSB Bildähnlichkeitssuche
Alle sprechen gerade über den KI-basierten Chatbot ChatGPT. Aber mit einer KI (Künstlicher Intelligenz) sind noch ganz andere spannende Sachen möglich: zum Beispiel die Bildähnlichkeitssuche des Münchener Digitalisierungszentrums (MDZ) der Bayerische Staatsbibliothek München . Das neue Tool ist mittlerweile für den gesamten Bestand der BSB online gegangen. Dabei geht es um eine Webanwendung, mit der – wie der Name schon sagt – ähnliche Bilder aus den über 57 Mio. digitalisierten Bildern der BSB herausgesucht werden können. Der/die Nutzer*in startet die Suche mit einem Upload oder der Verlinkung eines Bildes, zu dem dann ähnliche Bilder ausgeworfen werden. Dabei kann mittels sogenannter Deskriptoren (stark komprimierte Datensätze mit den Informationen eines Bildes) u.a. nach Farb-/Kantenähnlichkeit, Zeitraum und Mindestähnlichkeit (auch Deckungsgleichheit einstellbar) gefiltert werden, auch in Kombination miteinander. Ebenso ist eine Suche mit bestimmten Oberbegriffen (Menschen, Technik, Landkarten und vielen mehr) möglich. Alle 57 Mio. Bilder werden also bei einer Anfrage nicht einzeln durchsucht, das wäre viel zu zeitaufwendig. Stattdessen werden die Deskriptoren untereinander verglichen, was aufgrund der geringen Größe (hier 96 Bytes) deutlich schneller geht.
Grundlage der Anwendung ist ein „künstliches neuronales Netz“, das auf GPU (Graphical Proces-sing Unit), also Grafikkarten, basiert und mit Methoden des „maschinellen Lernens“ arbeitet. Dieses Netz lernt dabei – ähnlich wie das menschliche Gehirn – anhand von Bildsegmenten als manuell vorgegebenen Beispielen, z.B. Kategorien (Illustration, Person) auf neue, vorher nicht bekannte Beispiele anzuwenden. Ein sogenannter „Klassifikator“ soll Merkmale finden, die charakteristisch für einen bestimmten Bildtyp (z.B. eine Landkarte oder ein Wappen) sind. So können dann ähnliche Bilder gefunden werden.
Autor*in: K. Welcher