Hugging Face für alleSo kannst du Apples KI-Modell 4M selber ausprobieren
Martin Abgottspon
3.7.2024
Apple macht in Sachen einen weiteren Schritt und lässt seine User direkt daran teilnehmen. Doch was kann das Modell und was eher nicht? Ein Blick auf Hugging Face.
Martin Abgottspon
03.07.2024, 10:38
Martin Abgottspon
Keine Zeit? blue News fasst für dich zusammen
Apple hat auf der Plattform Hugging Face eine Demoversion seines KI-Modells 4M veröffentlicht.
Das 4M-Modell kann unter anderem Bilder aus Texten generieren, 3D-Szenen mittels natürlicher Sprache bearbeiten und komplexe Objekte in Bildern erkennen.
Nutzer können die Demoversion direkt auf Hugging Face testen, indem sie Bilder hochladen oder aufnehmen.
Laut der Beschreibung auf Hugging Face ist das Modell nicht nur skalierbar und Open Source, sondern arbeitet auch über verschiedene Modalitäten und Aufgaben hinweg. Einfach ausgedrückt, ist das Modell in der Lage, Daten aus unterschiedlichen Disziplinen zu verarbeiten und zu manipulieren. Es kann beispielsweise Bilder aus Texten generieren, 3D-Szenen mittels natürlicher Sprache bearbeiten oder komplexe Objekte in Bildern erkennen.
So kannst du selber testen
Interessierte können die Demoversion direkt auf Hugging Face ausprobieren. Nutzer haben die Möglichkeit, ein Bild hochzuladen, mit der Webcam aufzunehmen oder aus der Zwischenablage einzufügen.
Mit einem Klick auf den Button «Predict with 4M-21 XL» versucht das Modell, alle Modalitäten des Bildes zu erkennen. Dazu gehören unter anderem die RGB-Ebene, Tiefeninformationen, die Farbpalette sowie Objekte wie Menschen, Fenster und Wände. Zudem erstellt es eine Überschrift für das Bild, erkennt Metadaten und weitere Ebenen.
Die Demo zeigt eindrucksvoll, dass die KI in der Lage ist, multimodale Ebenen in Bildern zu erkennen. In der Praxis könnte das Modell verwendet werden, um Apples Software mit neuen Funktionen zu versehen. Dazu zählen beispielsweise die Bearbeitung von Bildern und Videos mittels natürlicher Sprache. Die Demoversion gibt somit einen vielversprechenden Ausblick auf die Möglichkeiten und Potenziale von Apples neuem KI-Modell.