Die Anwendungen und Möglichkeiten, die verschiedenste Sprachmodelle für die Content-Erstellung bieten, sind tatsächlich recht umfangreich. Es genügt zu sagen, dass sich sogar das gängige ChatGPT als äußerst nützliches Tool für Menschen erweist, die Hilfe bei den sogenannten kreative Blockade.
Bei Musikfans erfreut sich auch SunoAI großer Beliebtheit, ein Tool zum Erstellen eigener Songs basierend auf Texten und passenden Eingabeaufforderungen. Der Kreativität, die in diesem Tool entsteht, scheinen manchmal keine Grenzen gesetzt zu sein, was eigentlich sehr schön ist, insbesondere für diejenigen, die keine Angst vor solchen Experimenten haben.
Für solche Leute wurde ein neues Tool entwickelt, dieses Mal von NVIDIA entwickelt. Was ist Fugatto? Welche Möglichkeiten hat es?
Fugatto, ein Werkzeug zum Erstellen von Sounds
Fugatto (aus dem Englischen Grundlegender generativer Audiotransformer Opus 1) ist ein von NVIDIA-Ingenieuren entwickeltes fortschrittliches GenAI-Modell, mit dem Sie Sound mithilfe von Textbefehlen manipulieren können. Es kann Musik erstellen, Stimmen ersetzen, Effekte hinzufügen und völlig einzigartige Sounds erzeugen. Fugatto erledigt mehrere Aufgaben gleichzeitig und kombiniert verschiedene Anweisungen wie Akzent oder Emotion in der Stimme.
Beeindruckend ist auch der Maßstab, in dem dieses Modell erstellt wurde. Wir sprechen von 2,5 Milliarden Parametern, die Fugatto für seine Bedürfnisse verwendet. Natürlich basiert all dies auf NVIDIA-Technologien und das Ganze wurde von einem Team aus verschiedenen Ländern erstellt und entwickelt. Dank seiner innovativen Funktionen ermöglicht Fugatto den Benutzern künstlerische Experimente in einem noch nie dagewesenen Ausmaß.
Daher ist es nicht verwunderlich, dass die Ingenieure ihr Modell als „Schweizer Taschenmesser“ für den Klang bezeichneten. Die Möglichkeiten sind enorm, da diese Technologie auf vielen Daten trainiert wurde. Es gab unter anderem: BBC Sound Library, die Ihnen Zugriff auf eine Fülle an Quellenmaterial bietet, die wirklich beeindruckend ist.
Riesige Möglichkeiten

Aber wofür kann Fugatto verwendet werden? Nun, Sie können das Beispiel von Musikproduzenten anführen, die anhand von Eingabeaufforderungen eine „Skizze“ eines Songs erstellen können. Sie können außerdem bequem Effekte hinzufügen oder versuchen, mit nur wenigen Befehlen verschiedene Stile, Instrumente oder Effekte anzupassen.
Unser heutiger Held wird auch in der Lage sein, die Gesamtqualität bestehender Tracks zu verbessern oder die Isolierung einzelner Instrumente zu ermöglichen. Es gibt so viele Möglichkeiten und sie beschränken sich nicht nur auf die Musikindustrie.
Wie festgestellt wurde, arbeitet Fugatto auch mit Geräuschen, was es Spieleentwicklern ermöglichen könnte, Geräusche an dynamische Situationen anzupassen. Dies kann zu mehr Individualität für jeden Spieler führen, der je nach Situation unterschiedliche Geräusche oder unterschiedlich verstärkte Dialoge hört.
Ähnlich verhält es sich beim Marketing, wo dieses Modell in der Lage ist, den Ton und den Akzent des Erzählers an eine bestimmte Region anzupassen. Dies ist eine große Vereinfachung für alle, die in Zukunft Werbekampagnen erstellen und Empfänger aus der ganzen Welt erreichen möchten.
Wann wird Fugatto für den allgemeinen Gebrauch verfügbar sein?

Laut den Ingenieuren hinter Fugatto treten wir in eine neue Ära der Musik- und Klangerzeugung ein, in der KI unser bester Assistent sein wird. Interessanterweise wird diese Begeisterung vom berühmten Produzenten Ido Zmishlany geteilt.
Tatsächlich scheint in diesem Fall unsere eigene Kreativität das einzige Hindernis zu sein. Ich frage mich, wie das NVIDIA-Modell mit der Vielzahl interessierter Nutzer zurechtkommt.
Derzeit hat NVIDIA jedoch nicht bekannt gegeben, wann Fugatto veröffentlicht und einem breiteren Publikum zugänglich gemacht wird. Im Moment können wir nur abwarten und hoffen, dass es eher früher als später geschieht.