KI-Framework: Microsoft VASA-1

VASA-1 ist ein von Microsoft Research entwickeltes KI-Framework, das aus einem einzigen statischen Bild und einem Sprach-Audio-Clip lebensechte sprechende Gesichter generieren kann.

Die Hauptinnovationen umfassen ein Modell zur holistischen Erzeugung von Gesichtsdynamik und Kopfbewegungen im latenten Raum des Gesichts sowie die Entwicklung eines ausdrucksstarken und entwirrten latenten Gesichtsraums mithilfe von Videos.

VASA-1 kann nicht nur realistische Lippenbewegungen erzeugen, die exquisit mit dem Audio synchronisiert sind, sondern auch eine breite Palette von Gesichtsnuanzen und natürlichen Kopfbewegungen, die zur Wahrnehmung von Authentizität und Lebendigkeit beitragen.

Es ermöglicht die Echtzeit-Erzeugung von 512×512-Videos mit bis zu 40 FPS und ebnet den Weg für lebensechte Avatare, die menschliches Gesprächsverhalten nachahmen können.

Weitere Informationen gibt es auf der offiziellen Projektseite.

AI Tool: Suno AI

Suno ist ein innovatives Startup, das sich auf die Schaffung von Musik mithilfe künstlicher Intelligenz (KI) spezialisiert hat, der gleichnamige Service ist unter app.suno.ai zu finden.

Suno nutzt KI-Technologien, um Musik zu komponieren, die auf Textanweisungen basiert: Man gibt einfach ein, was man hören will, dann generiert Suno ein Lied mitsamt Text, Gesang, Instrumenten und Cover. Die fertigen Lieder können dann über die Suno Website geteilt oder als Audio- und Videofile heruntergeladen werden.

„AI Tool: Suno AI“ weiterlesen

Chatbot: Pi

Zu den immer zahlreicher werdenden Chatbots gesellt sich Pi von Inflection AI. Pi basiert auf dem LaMDA Sprachmodell von Google.

Pi soll besonders freundlich und empathisch sein. Seine Trainingsdaten reichen bis November 2022, direkten Internetzugriff hat Pi noch nicht, was sich aber bald ändern soll.

Wie auch bei anderen Chatbots weisen die Entwickler ausdrücklich darauf hin, dass Pi noch in der Entwicklungsphase ist und Fehler macht. Nach einem ersten schnellen Blick scheint Pi aber weniger Halluzinationen zu haben als ChatGPT.

Pi ist primär auf Englisch verfügbar, kann aber auch Deutsch, Spanisch, Französisch, Russisch und Chinesisch. Allerdings ist es in diesen Sprachen nicht so versiert wie z.B. ChatGPT.

Neben einer Weboberfläche gibt es bei Pi die Möglichkeit, auch über Instagram, Facebook Messenger, WhatsApp, iOS App und sogar SMS zu kommunizeren.

Am einfachsten ist der Einstieg über die Weboberfläche unter heypi.com.

In Deutschland ist die Nutzung insoweit eingeschränkt, als dass man sich nach einem längeren Gespräch mit dem Bot registrieren muss, was derzeit nur mit einer Handynumer aus einem angelsächsischen Land möglich ist.

Warum sollte man PI ausprobieren?

PI ist einmal ein ganz anderes Sprachmodell als ChatGPT, hat andere Vorgaben und ist sehr empathisch und freundlich kommunikationsfreudig. Es hat einen ganz anderen Schreibstil als ChatGPT.

AI Tool: Eightify – Zusammenfassungen von Youtube Videos

Oft stolpert man über ein interessantes Video auf Youtube, hat aber nicht die Zeit, es sich komplett anzusehen. Da kommt Eightify ins Spiel. Es handelt sich hier um eine Chrome Extension, die einem Videos kompakt als Text zusammenfassen kann, im Screenshot oben kann man das sehr schön sehen.

„AI Tool: Eightify – Zusammenfassungen von Youtube Videos“ weiterlesen

App Tipp: Aimi

Wenn ich Texte schreibe, höre ich gerne Musik im Hintergrund. Und die sollte mich idealerweise nicht zu sehr ablenken, sondern meine Konzentration nicht stören.

„App Tipp: Aimi“ weiterlesen

App Tipp: Artifact

Artifact ist eine sehr schön gemachte Newsreader App, die von den Instagram-Mitbegründern Kevin Systrom und Mike Krieger ins Leben gerufen wurde. Die App verwendet KI, um einem passende Artikel und Nachrichten anzuzeigen – und das macht sie sehr ordentlich. Die App ist kostenlos und für iOS und Android verfügbar, derzeit aber nur auf Englisch.

Hier können Sie sich direkt anmelden, einen optischen Eindruck gibt dieser Screenshot:

„App Tipp: Artifact“ weiterlesen

Was ist You.com?

You.com ist im wesentlichen eine Suchmaschine. Kernstück ist ein Dazu gehören die intelligente Suchfunktion, die Ihnen dabei hilft, relevante Ergebnisse zu finden, und ein integriertes Tool zur Verwaltung von Suchgeschichten, mit dem Sie Ihre Suchanfragen organisieren und speichern können.

Ähnlich wie bei ChatGPT gibt es auch einen Chatbot sowie sogar eine KI Bildgenerierung sowie Tools für Coding und Texterstellung.

Probieren Sie es am besten einmal selbst aus: You.com

Hier finden Sie mehr moderne Suchmaschinen.

Suchmaschine: Das neue Bing

Bing – aus dem Dornröschenschlaf zum Vorreiter

In Deutschland fristete Bing, die Suchmaschine von Microsoft, ein Schattendasein, in den USA gab es immerhin erwähnenswerte Marktanteile. Ich habe sie manchmal genutzt, da die Bilder Suche teilweise auch hierzulande teilweise besser war und ist als die von Google, wenn Google – was auch vorkommen kann – versagte und um Microsoft Punkte zu sammeln.

„Suchmaschine: Das neue Bing“ weiterlesen

AI Zeichentool: autodraw.com

autodraw.com ist ein sehr einfaches, aber ziemlich geniales Zeichentool.

Man malt im Browser einfach eine Skizze und das Tool erkennt, was man wahrscheinlich malen wollte. Und das kann man dann in schönerer Form erhalten:

Wie das in der Praxis aussieht, habe ich hier mal im Video festgehalten:

Oder sie testen es einfach selbst.

Was ist Eleven Labs?

Eleven Labs ist eine Text to Speech (TTS) Lösung, mit der man u.a. auch seine eigene Stimme klonen kann.

Eleven Labs selbst ausprobieren.

Stand: Februar 2023