Cloudinary hat sein KI-Portfolio um AI Vision erweitert. AI Vision bietet Entwicklern und Unternehmen beispiellose Kontrolle und Einblicke in visuelle Inhalte. Darüber hinaus stellte das Unternehmen mehrere Verbesserungen seiner generativen KI-Tools vor, auf die sich Tausende Entwickler verlassen, um visuelle Inhalte in großem Umfang mühelos zu bearbeiten, zu optimieren und zu transformieren.
AI Vision – Intelligente Verarbeitung visueller Inhalte mit generativer KI
AI Vision wurde entwickelt, um die wachsenden Herausforderungen bei der Verwaltung umfangreicher visueller Medienbibliotheken zu bewältigen und gleichzeitig die Markensicherheit zu gewährleisten. Sie integriert die Leistungsfähigkeit der generativen KI nahtlos in die intelligente Digital Asset Management Plattform (DAM).
Durch die Automatisierung der Inhaltsverwaltung und die Bereitstellung präziser, skalierbarer und markenkonformer Workflows geht AI Vision weit über herkömmliche Automatisierung hinaus und bietet Unternehmen ein leistungsstarkes Werkzeug zur Optimierung ihrer Bilder.
Zu den wichtigsten Anwendungsfällen gehören:
- Benutzerdefinierte Taxonomie und Bildklassifizierung: Ermöglicht eine einfachere Kategorisierung, Suche und Auffindbarkeit von Assets anhand detaillierter Kriterien wie Hintergrundfarbe oder Motivausrichtung, ohne dass dafür Tagging-Modelle trainiert oder angepasst werden müssen. Demografische Daten können in automatisierte Workflows integriert werden, die eine umfangreiche Bildanalyse ermöglichen.
- Contentmoderation und Compliance: Fortschrittliche Bildanalyse bietet außergewöhnliche Genauigkeit und tiefe Einblicke in visuelle Inhalte, von der Erkennung spezifischer Markenelemente bis hin zur Identifizierung sensibler oder unangemessener Inhalte.
- Visual Question Answering (VQA): Ermöglicht das Stellen komplexer, bildspezifischer Fragen und liefert präzise, umsetzbare Antworten, die den Workflow für visuelle Inhalte optimieren, wie die Generierung von SEO-fähigen Metadaten oder beschreibenden Alt-Texten.
Umfassende Verbesserungen der generativen KI-Funktionen
Seit der Einführung seiner ersten Reihe von generativen KI-Tools im Jahr 2023 hat Cloudinary kontinuierlich die dringendsten praktischen Bedürfnisse von Entwicklern und Unternehmen adressiert. Die neuesten Innovationen in diesem Bereich eröffnen den Nutzern neue kreative Möglichkeiten und reduzieren gleichzeitig die Komplexität und Kosten ihrer Workflows für visuelle Inhalte.
Zu den wichtigsten Verbesserungen gehören:
- Generative Fill: Diese beliebte Funktion von Cloudinary, die auf einem weiterentwickelten und präziseren Modell basiert, bietet nun eine verbesserte kontextuelle Genauigkeit beim Füllen von Lücken, die durch die Vergrößerung des Bildbereichs zur Anpassung an neue Seitenverhältnisse entstehen.
- Hintergrundentfernung und Hintergrundersetzung: Liefern jetzt noch präzisere Ergebnisse beim Entfernen und Ersetzen von Hintergründen basierend auf dem Bildvordergrund, selbst bei komplexen Assets. Darüber hinaus wurden die Benutzeroberflächen optimiert, damit die Benutzer Inhalte schneller und mit minimalem Aufwand erstellen und verwalten können.
- Generative Extract: Isoliert auf intelligente Weise bestimmte Elemente wie Produkte, Objekte oder Personen aus Bildern, um mehrschichtige, dynamische Inhalte zu erstellen, die für verschiedene Kanäle optimiert sind. Besonders leistungsstark wird die Funktion, wenn sie in Kombination mit der Overlay-Funktion von Cloudinary eingesetzt wird.
- Generative Verbesserung und Wiederherstellung: Entfernt Bildrauschen und Defekte, schärft automatisch Details, korrigiert Fehler und verbessert die Bildqualität. So können alte oder beschädigte Bilder mühelos wiederhergestellt werden, ohne dass wichtige Details verloren gehen.
- Generative Upscale: Erhöht die Bildauflösung nahtlos, ohne die Qualität zu beeinträchtigen oder Artefakte zu erzeugen. So können Unternehmen hochwertige Bilder für alle Anwendungen nutzen, unabhängig von der Qualität des Ausgangsmaterials.
- KI Video Transkription und Kapiteleinteilung: Erzeugt automatisch Transkripte und Kapitel nach dem Hochladen über die Video-API von Cloudinary und den Video Player Studio in seinem intelligenten DAM.
„Durch den Einsatz dieser Tools für unsere häufigsten Anwendungsfälle können wir dynamischere Erlebnisse erstellen und bereitstellen und in einem Bruchteil der Zeit mehrere Assets für verschiedene Märkte produzieren“, so Javier Acón, Audiovisual Documentalist, Creative Marketing bei Fever. „Sie haben für uns alles verändert.“
„Bei der Verwaltung von Bildern in großem Umfang geht es nicht nur um Geschwindigkeit, sondern auch um Genauigkeit, Markenkonformität und Effizienz über Tausende Assets, Teams und Kontaktpunkte hinweg“, sagt Nadav Soferman, Mitbegründer und Chief Product Officer von Cloudinary.
„AI Vision bringt Automatisierung und Intelligenz in diese kritischen Workflows und ermöglicht es Unternehmen, Bilder sofort und zuverlässig zu taggen, zu moderieren und zu transformieren. In Kombination mit unserer Suite generativer KI-Tools bedeutet dies kürzere Markteinführungszeiten, weniger manuelle Arbeit und eine nahtlose Bereitstellung optimierter visueller Inhalte an jedem Ort.“