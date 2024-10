Mit dem AquaSoft Transcriptor bringt das Potsdamer Unternehmen ein frei nutzbares Programm mit vielen Einsatzmöglichkeiten auf den Markt

Softwareentwickler AquaSoft veröffentlicht mit dem AquaSoft Transcriptor ein neues, kostenloses Tool: eine Vereinigung aus Sprachmodell Whisper von Open AI mit den Videobearbeitungsfunktionen der hauseigenen Programme. Aus diesem Zusammenschluss entsteht ein vielseitig einsetzbarer Helfer, der sprachliche Inhalte aus Audio- und Videodateien filtert und aufbereitet.

Audio rein – Text raus

Per Drag-and-Drop ziehen Nutzer Audio- oder Videodateien in die Benutzeroberfläche. Dort wählen Ersteller je nach Anwendungsfall die Transkriptions- und Ausgabevorlage sowie die Zieldatei. Unsichere Uploads in die Cloud vermeidet das Programm: Vom Bearbeiten bis zum fertigen Produkt bleibt alles lokal auf dem eigenen Computer. Verschiedene Kombinationen der Funktionen ermöglichen zum Beispiel ein schnelles Transkript einer Aufnahme, Untertitel direkt im Video oder auf Wunsch als Textdatei, visuelle Aufbereitung für Podcast-Folgen oder zur Weiterverarbeitung in den AquaSoft-Programmen. Egal ob YouTube-Channel oder Werbefilm, je zugänglicher ein Video, desto höher die Reichweite. Ein Untertitel vergrößert die Zielgruppe um ein Vielfaches: moderne Konsumenten, die ihre Medien ohne Ton ansehen, Menschen, die gesprochene Sprache schlecht verstehen und dank automatischer Übersetzung auch globale Zuschauer. Zudem sind audiovisuelle Inhalte mit textlicher Begleitung barrierefrei. Mit der KI Whisper springen im Nu die Worte über den Bildschirm. Aufnahme rein und mit einem Klick auf den Startknopf zaubert das Tool ein Video mit Untertitel. In der frei nutzbaren Standard-Version des AquaSoft Transcriptor wählen Nutzer das Erscheinungsbild ihres Videos aus fünf vorgegebenen Vorlagen. Für mehr Gestaltungsfreiraum greifen Kreative auf die Pro Version zurück.

Bildlich gesprochen

Im Bereich der Transkription performt das Sprachmodell Whisper von OpenAI bereits in der Standard Version. Integriert in die Software, bedarf es für dessen Nutzung keines Uploads in eine externe Cloud. Alle Daten bleiben auf dem heimischen Rechner. So hält das Tool Audio- und Videoaufnahmen schriftlich fest und wirft einen Text aus, der nach Wunsch im Ganzen, in Blöcken oder nach einzelnen Wörtern angeordnet ist. Ein Limit für die Länge des Inputs gibt es nicht. Eingabesprachen in Deutsch, Englisch, Französisch, Spanisch, Chinesisch und weiteren Sprachen lassen den Transcriptor auch auf internationalem Parkett glänzen. Neben Transkripten von Gesprächen, Interviews oder Lesungen fungiert eine Abschrift auch als Untertitel-Datei für YouTube-Videos. Das jüngste Programm aus dem Hause AquaSoft überträgt nicht nur Ton zu Text, sondern bereitet auch Audioaufnahmen visuell auf. Podcast-Hosts, die neue Kanäle bespielen wollen, richten ihre Aufmerksamkeit auf YouTube. Auf der Plattform rangieren Formate mit Bewegtbild höher im Ansehen, als jene mit statischen Bildern. Die Funktion Spektrum unterlegt Erzählungen mit einer visuellen Illustration des Gesprochenen. Ein Episoden-Bild hinter der Anzeige schafft Wiedererkennungswert.

Transcriptor Pro

Wer sein eigenes Flair mit einbringen möchte, lässt die Regler tanzen. Mit dem Transcriptor Pro für 29,90 EUR im Jahr erhalten Nutzer die vollen Gestaltungsmöglichkeiten im Programm. Damit beschleunigen sich Verarbeitungsvorgänge, zudem kommt eine Übersetzungsfunktion hinzu und eigene Vorlagen lassen sich erstellen und speichern. Über Drop-Down Menüs wählen Nutzer aus vorgefertigten Hintergründen von natürlichen Mustern bis hin zu abstrakten Werken eine passendeUntermalung des Geschehens. Innerhalb der Kulissen passen Kreative Farben, Ausrichtung, Deckstärke und mehr dem eigenen Geschmack an. Eine Vorschau gibt die Änderungen wieder – bei Gefallen stehen alle gängigen Formate, Auflösungen und Seitenverhältnisse zur Ausgabe bereit. Fertige Transkriptionen können entweder direkt als Video ausgegeben werden, oder als AquaSoft Stages-Projekt detailliert weiterbearbeitet werden.

Systemanforderungen

– Betriebssystem: Windows 11 und 10 mit 64-bit

– Arbeitsspeicher: je nach verwendetem Sprachmodell 2-8 GB freiem RAM

– CPU: Multicore CPU wird voll ausgeschöpft.

– Grafikkarte: Es werden nur geringfügige Anforderungen an die Grafikkarte gestellt, wenn die CPU zur Transkription verwendet wird. Zur optionalen KI-Beschleunigung ist eine CUDA-fähige Grafikkarte mit 8 GB Videospeicher von Vorteil und kann den Vorgang deutlich beschleunigen. Auch bei der Videoausgabe ist eine bessere Grafikkarte von Vorteil, aber nicht Voraussetzung.

– Internetverbindung zum Download der Sprachmodelle

– Festplattenspeicher: 6-10 GB

Die AquaSoft GmbH entstand 2003 aus dem Start-up-Unternehmen AquaSoftware des Software-Ingenieurs Steffen Binas. Die Kernkompetenz des Entwicklerstudios liegt in Tools zur Bearbeitung und Komposition digitaler Fotos und Videos. Das Unternehmen bietet die Softwares Photo Vision, Video Vision und Stages sowie viele Erweiterungen für die jeweiligen Programme an. In den Versionen Photo Vision für Einsteiger und Video Vision für Fortgeschrittene ermöglicht AquaSoft PC-Anwendern effektvolle Bilder- und Videokreationen; die Profi-Version Stages wendet sich an Erfahrene, wie Fotografen und Medienschaffende. Mit der YouDesign-Produktlinie von AquaSoft lassen sich eigene Buchlayouts und Kalender erstellen. Am Unternehmenssitz in Potsdam beschäftigen sich die Mitarbeiter mit der Programmierung von Produkt-Erweiterungen, -Updates, -Upgrades sowie neuen Software-Produkten rund um die Foto- und Videowelt und leisten persönlich Kundensupport. Mehr Informationen auf www.aquasoft.de

