On-device-KI auf dem Handy: Welche Apps funktionieren intelligenter und privater?
Das Smartphone berechnet immer mehr KI-Funktionen direkt auf dem Gerät, ohne Umweg über externe Server. Apple, Google und Samsung verlagern Übersetzung, Bildbearbeitung und Textanalyse auf eigene spezialisierte Chips. Diese Neural Processing Units sitzen fest im Gehäuse und arbeiten unabhängig vom Netz. Die Verlagerung verändert spürbar das Datenschutzversprechen moderner Endgeräte. Persönliche Sprachnachrichten, Fotos und Notizen verlassen seltener das Telefon. Das schafft eine technische Grundlage, die mehr absichert als vertragliche Zusagen allein.
Der Vorteil zeigt sich auch jenseits des Datenschutzes. Kürzere Reaktionszeiten entstehen, weil keine Anfrage den Umweg über ein Rechenzentrum nehmen muss. Diktat, Zusammenfassung und Übersetzung funktionieren im Funkloch genauso zuverlässig wie in der Stadt. Das macht On-device-KI besonders wertvoll auf Reisen, in Kellerbüros oder bei schlechtem Empfang. Nutzerinnen profitieren von einer stabilen Verfügbarkeit, die keine Internetleitung voraussetzt.
Apple Intelligence: Live Translation und Writing Tools
Apple Intelligence läuft seit iOS 18 in vielen Funktionen vollständig lokal auf dem A17- oder A18-Chip. Mit iOS 26 erweitert Apple den Sprachumfang und ergänzt deutsche Lokalisierung in mehreren Regionen. Die Funktion Live Translation übersetzt Gespräche in den AirPods Pro 2, ohne Audio in die Cloud zu schicken. Apple ver spricht hier verarbeitet jede Konversation auf dem Gerät, was sensible Inhalte schützt. Schreibwerkzeuge korrigieren Texte in Mail, Notizen und Drittanbieter-Apps wie Bear oder Things. Komplexere Anfragen leitet das System an Private Cloud Compute weiter, wo unabhängige Forscherinnen den Code prüfen können.
Entwicklerinnen erhalten kostenfreien Zugriff auf die Inferenz der lokalen Modelle. Apps wie Day One, Drafts und Craft nutzen die Schnittstelle für Zusammenfassungen und Korrekturlesen. Visual Intelligence erkennt Objekte über die Kamera und liefert Kontext ohne Serveraufruf. Die Funktion arbeitet offline im Flugzeug oder im Funkloch, was Reisenden hilft. Apple bindet die Modelle eng an Foundation Models und das Neural Engine ein. Die Unterstützung beschränkt sich allerdings auf iPhone 15 Pro, iPhone 16 und iPhone 17.
Google Gemini Nano: Tensor G5 für Pixel-Features
Google liefert Gemini Nano seit dem Pixel 8 Pro aus und hebt die Leistung auf dem Pixel 10 stark an. Der neue Tensor G5 Chip rechnet multimodale Anfragen direkt im Gerät, ohne Backend. Aufzeichner fasst Meetings zusammen, Magic Compose schlägt Antworten in Nachrichten vor. Der Recorder funktioniert offline und transkribiert sogar lange Vorträge in Echtzeit. Pixel-Telefone nutzen Gemini Nano zudem für Antwortvorschläge in WhatsApp, Gboard und Google Messages. Die KI bleibt während des Fluges einsatzbereit und schont mobile Datenvolumen.
Über die ML Kit GenAI APIs öffnet Google die Modelle für Drittanbieter. Notiz-Apps wie Obsidian-Plugins, Joplin oder Microsoft Lens binden lokale Zusammenfassung und Korrektur an. Der AICore-Systemdienst orchestriert die Modelle und verwaltet Speicher. Anwenderinnen aktivieren die Funktion in den Entwickleroptionen auf älteren Pixel-Geräten. Pixel Buds 2a beantworten Nachrichten per Sprachbefehl und greifen auf Kalender, Keep und Tasks zu. Die Foto-zu-Video-Funktion in der Gemini-App rendert kurze Clips komplett auf dem Telefon.
Samsung Galaxy AI: Lokale Telefonübersetzung
Samsung verteilt Galaxy AI seit der S24-Reihe und erweitert sie 2025 um Arabisch, Indonesisch und Russisch. Live Übersetzung dolmetscht Anrufe in Echtzeit, ohne Audio an Cloud-Dienste zu schicken. Diese Trennung schützt vertrauliche Telefonate vor unerwünschten Mitschnitten auf fremden Servern. Der Dolmetscher-Modus zeigt Gespräche in einem geteilten Bildschirm und übersetzt beide Richtungen. Der Transkriptionsassistent fasst Sprachaufnahmen zusammen und liefert eine Übersetzung der Mitschrift. Sprachpakete laden Anwenderinnen einmalig herunter und nutzen sie danach offline.

In den Einstellungen lässt sich Galaxy AI vollständig auf den lokalen Modus zwingen. Diese Option verhindert jegliche Übertragung an Samsung-Server und genügt strengen Compliance-Anforderungen. Note Assist generiert Zusammenfassungen in Samsung Notes, Browsing Assist verkürzt Webseiten in Samsung Internet. Die Foto-App entfernt Bildhintergründe oder unerwünschte Personen über generative Bearbeitung. Galaxy S25 und S26 erweitern die Werkzeuge um längere Kontextfenster und schnellere NPU-Pfade. Drittanbieter wie Microsoft, Google Docs und KakaoTalk integrieren Übersetzungsfunktionen direkt in die Tastatur.
Hardware-Grundlage: NPUs als Arbeitspferde
Neural Processing Units rechnen Matrixoperationen besonders effizient und sparen Akku gegenüber CPU oder GPU. Apples Neural Engine im A18 Pro liefert rund 35 Billionen Operationen pro Sekunde. Googles Tensor G5 nutzt eine eigene TPU-ähnliche Einheit für multimodale Modelle. Qualcomms Snapdragon 8 Elite treibt Galaxy- und OnePlus-Geräte mit der Hexagon-NPU an. Diese Recheneinheiten verarbeiten Modelle bis sieben Milliarden Parameter lokal, ohne den Hauptprozessor zu blockieren. MediaTek liefert mit dem Dimensity 9400 eine vergleichbare Plattform für Mittelklasse-Smartphones.
Die Modelle laufen quantisiert in INT4- oder INT8-Präzision und passen so in den Arbeitsspeicher. Acht Gigabyte RAM gelten als Mindestmaß für aktuelle On-device-Funktionen. Apple, Google und Samsung optimieren die Modelle gemeinsam mit Chipherstellern. Diese Kooperation verkürzt Latenzen auf wenige hundert Millisekunden bei Übersetzung und Diktat. Akkuverbrauch bleibt überschaubar, weil NPUs spezialisierte Operationen viel sparsamer ausführen. Künftige Generationen werden zehn Milliarden Parameter und mehr mobil tragen.
Was lokal bleibt, kann nicht abfließen
Lokale Verarbeitung reduziert Angriffsflächen und vereinfacht die Einhaltung der DSGVO. Audio, Bilder und Texte verlassen das Endgerät bei vielen Funktionen gar nicht erst. Anwältinnen, Ärztinnen und Journalistinnen profitieren bei vertraulichen Gesprächen ganz besonders von dieser Architektur. Berufsgeheimnisse genießen damit einen technischen Schutz zusätzlich zur rechtlichen Pflicht. Telekonferenzen mit Mandanten oder Patientinnen lassen sich ohne Server-Mitschnitt protokollieren. Polizeiliche Zugriffe auf Cloud-Backups laufen ins Leere, wenn Inhalte das Telefon nicht erreichen.

Apple dokumentiert die Funktionsweise von Private Cloud Compute öffentlich und ermöglicht externe Audits. Google trennt AICore strikt vom restlichen System und verschlüsselt geladene Modelle. Samsung kennzeichnet jede KI-Funktion sichtbar mit einem Stern, sobald Cloud-Verarbeitung greift. Diese Transparenz hilft beim Auswählen der passenden Funktion für sensible Aufgaben. Konzerne wie Volkswagen, Allianz oder Deutsche Bank prüfen Galaxy AI bereits für interne Pilotprojekte. Der lokale Modus wird zum Verkaufsargument im Geschäftskundengeschäft.
Diese Anwendungen nutzen den Vorteil
Die App Otter konkurriert mit dem Recorder von Pixel und transkribiert Meetings ebenfalls offline. Microsoft OneNote bindet Apple Intelligence für Zusammenfassungen ein, ohne Inhalte an Microsoft zu schicken. Bear, Day One und Craft nutzen die Writing Tools direkt aus dem Kontextmenü. Die App DeepL ergänzt Gerätemodelle durch eine Cloud-Variante für seltene Sprachpaare. Google Translate arbeitet schon seit Jahren offline mit heruntergeladenen Sprachpaketen. Microsoft Translator bietet ähnliche Pakete für Windows-, iOS- und Android-Geräte.
Im Bereich Foto unterstützen Lightroom, Photomator und Pixelmator Pro lokale generative Bearbeitung. Adobes mobile Apps verlagern Maskierung und Hintergrundentfernung zunehmend auf das Endgerät. Notiz-Apps wie Bear, Notion und Logseq integrieren Apple Foundation Models für lokale Zusammenfassung. Die Diktier-App Whisper Transcription liefert OpenAI Whisper komplett offline auf modernen iPhones. Diese Vielfalt zeigt eine reife mobile KI-Landschaft jenseits der Hersteller-Apps. Auch deutsche Banken testen lokale Sprachmodelle für Vertrauenskommunikation.
Fazit zu On-device-KI auf dem Handy
