Auf den ersten Blick sieht Apples neue Zusammenfassung für App-Reviews wie eine einfache Aufgabe für Künstliche Intelligenz aus. Die mit iOS 18.4 eingeführte Funktion soll Nutzern des App Stores einen schnelleren Überblick geben, was andere zu einer App sagen. Bei genauerem Hinsehen ist es aber deutlich komplexer, da ältere und falsche Rezensionen ein schiefes Bild wiedergeben können – Apple hat jetzt in einem Blogpost dargelegt, wie man die Herausforderung mittels verschiedener KI-Modelle meistern will.

Regelmäßige Leser von App-Reviews wissen, dass sich unter den Bewertungen einer App oft auch Einträge befinden, die am Thema vorbei gehen – etwa bei einer Lieferservice-App eine Kritik an der Qualität des Essens eines teilnehmenden Restaurants oder Ressentiments gegen den App-Entwickler. Auch kritische Rezensionen für ältere Versionen mit längst behobenen Fehlern drohen, das Bild zu verzerren.

Zusammenfassung als Wissenschaft

Apple macht deshalb aus den zwei Sätzen eine regelrechte Wissenschaft, wie jetzt im firmeneigenen Machine-Learning-Blog dargelegt wird. Ein mehrstufiges System aus Large Language Models (LLMs) soll möglichst nutzbringende Zusammenfassungen mit einer Länge zwischen 100 und 300 Zeichen abliefern, heißt es.

In einem ersten Schritt werden alle Bewertungen durch einen Filter geschickt, der Spam, Beleidigungen und betrügerische Inhalte ausfiltern sollen. Ein speziell abgestimmtes LLM soll sodann die Kernaussagen jeder Bewertung extrahieren. In einem nächsten Schritt werden diese Aussagen von einem weiteren Modell in verschiedene Themen geordnet. Im dritten Schritt sollen dann die relevantesten Themen ausgewählt werden. Ein weiteres KI-Modell fertigt daraus die Zusammenfassung in der gewünschten Länge und im Stile Apples.

Blaupause für andere Apps?

Der Veröffentlichung in iOS 18.4 sei eine Prüfung durch menschliche Tester vorausgegangen, die die Zusammenfassungen laut Apple auf verschiedene Aspekte abgeklopft hätten. Dazu zählt, dass die Inhalte nicht schädlich oder anstößig sind und die verwendeten Bewertungen wahrheitsgetreu wiedergegeben werden. In weiteren Prüfschritten wurde geguckt, ob die Grammatik korrekt ist und die Zusammenfassungen bei Download- und Kaufentscheidungen nützlich sind.

Bei Apple sieht man die eigene Vorgehensweise auch als Blaupause für ähnliche Anwendungen, wo große Mengen an Nutzerfeedback vorliegen. Im deutschen App Store gibt es die Zusammenfassungen aktuell noch nicht. Sie werden schrittweise ausgerollt und sind gegenwärtig nur bei ausgewählten Apps im US-Store verfügbar.

(mki)