Hugging Face für alle So kannst du Apples KI-Modell 4M selber ausprobieren

Martin Abgottspon

3.7.2024

Hugging Face hat in der Vergangenheit schon mehrere Investoren überzeugen können.
Hugging Face hat in der Vergangenheit schon mehrere Investoren überzeugen können.
Hugging Face

Apple macht in Sachen einen weiteren Schritt und lässt seine User direkt daran teilnehmen. Doch was kann das Modell und was eher nicht? Ein Blick auf Hugging Face.

Martin Abgottspon

Keine Zeit? blue News fasst für dich zusammen

  • Apple hat auf der Plattform Hugging Face eine Demoversion seines KI-Modells 4M veröffentlicht.
  • Das 4M-Modell kann unter anderem Bilder aus Texten generieren, 3D-Szenen mittels natürlicher Sprache bearbeiten und komplexe Objekte in Bildern erkennen.
  • Nutzer können die Demoversion direkt auf Hugging Face testen, indem sie Bilder hochladen oder aufnehmen.

Apple hat eine Demoversion seines neuen KI-Modells «4M» veröffentlicht.  Diese ist ab sofort auf der Plattform Hugging Face verfügbar.

Laut der Beschreibung auf Hugging Face ist das Modell nicht nur skalierbar und Open Source, sondern arbeitet auch über verschiedene Modalitäten und Aufgaben hinweg. Einfach ausgedrückt, ist das Modell in der Lage, Daten aus unterschiedlichen Disziplinen zu verarbeiten und zu manipulieren. Es kann beispielsweise Bilder aus Texten generieren, 3D-Szenen mittels natürlicher Sprache bearbeiten oder komplexe Objekte in Bildern erkennen.

So kannst du selber testen

Interessierte können die Demoversion direkt auf Hugging Face ausprobieren. Nutzer haben die Möglichkeit, ein Bild hochzuladen, mit der Webcam aufzunehmen oder aus der Zwischenablage einzufügen.

Mit einem Klick auf den Button «Predict with 4M-21 XL» versucht das Modell, alle Modalitäten des Bildes zu erkennen. Dazu gehören unter anderem die RGB-Ebene, Tiefeninformationen, die Farbpalette sowie Objekte wie Menschen, Fenster und Wände. Zudem erstellt es eine Überschrift für das Bild, erkennt Metadaten und weitere Ebenen.

Die Demo zeigt eindrucksvoll, dass die KI in der Lage ist, multimodale Ebenen in Bildern zu erkennen. In der Praxis könnte das Modell verwendet werden, um Apples Software mit neuen Funktionen zu versehen. Dazu zählen beispielsweise die Bearbeitung von Bildern und Videos mittels natürlicher Sprache. Die Demoversion gibt somit einen vielversprechenden Ausblick auf die Möglichkeiten und Potenziale von Apples neuem KI-Modell.