Sind Online-Transkriptionsdienste sicher und vertraulich?

Hallo Habr! Ich präsentiere Ihnen die Übersetzung des Artikels "Sind Online-Transkriptionsdienste sicher und privat?" Autor Matthew Hughes .

Die Transkription war einst ein manueller, langwieriger Prozess. Ärzte, Journalisten und eine ganze Menge von Fachleuten zeichneten ihre Notizen und Gespräche auf dem Rekorder auf und setzten sich dann vor den Computer, um sie auf der Tastatur einzugeben.

Im Jahr 2020 gibt es eine Reihe von Diensten, mit denen Sie Ihre Audioaufnahme in Text umwandeln können. Die Frage bleibt jedoch: Sind sie sicher? Sie können beispielsweise Aufzeichnungen vertraulicher Konversationen und privater Voicemail herunterladen.

Schauen wir uns diese Dienste an und wie Sie Ihre Informationen schützen können.

Bild
Illustration von Yangard
Creative Commons License
Dieses Bild ist unter einer Creative Commons Namensnennung-Weitergabe unter gleichen Bedingungen 4.0 Global License lizenziert .

Wie Audio-Transkriptionsdienste funktionieren


Audio-Transkriptionsdienste sind in der Regel in drei Kategorien unterteilt. Die erste ist vollständig computergesteuert und verwendet vorhandene KI- und maschinelle Lernmodelle, um die Konversation zu führen. Die zweite ist die teuerste, wenn die Leute den gesamten Prozess abschließen. Die dritte ist eine Kombination aus Computerverarbeitung und Mensch.

Höchstwahrscheinlich kennen Sie die erste Kategorie am besten. Sprachtranskriptionsdienste wie Google, Apple und Otter.ai wandeln die von Ihrer Stimme erzeugten analogen Wellen in eine digitale Darstellung um. Dann werden sie in kleine Segmente (manchmal eine Tausendstelsekunde) unterteilt und mit den bekannten "Phonemen" oder Elementen der Sprache verglichen.

Dann versuchen diese Algorithmen, sie im Kontext anderer Phoneme zu betrachten und sie durch statistische und KI-Modelle zu leiten, die letztendlich Text erzeugen. Da diese Transkriptionsdienste vollständig computergesteuert sind, sind sie normalerweise die kostengünstigsten. Die Genauigkeit ist jedoch nicht immer auf dem neuesten Stand, insbesondere wenn es darum geht, Text aus einer lauten oder Mehrbenutzerumgebung zu extrahieren.

Die menschliche Transkription umfasst bestimmte Plattformen wie Rev , die Clients mit einem Pool vorab genehmigter Transkriptoren verbinden. Sie können auch jemanden von freiberuflichen Mitarbeitern wie Upwork oder Fiverr einstellen .

Schließlich gibt es eine Mischung aus beiden. Um den Transkriptionsprozess zu beschleunigen, erlauben einige Sites der KI Vorarbeiten, und dann entfernt jemand die Ausgabe und korrigiert alle Fehler.

Transkriptionsdienste verhalten sich schlecht


In den letzten Jahren sind viele Transkriptionsdienste Gegenstand von Verstößen und Skandalen geworden.

Das vielleicht älteste (und vielleicht ungeheuerlichste) war SpinVox, das in den „Noughties“ einen Dienst anbot, der Voicemail in SMS-Nachrichten verwandelt. Zu dieser Zeit galt es als technologischer Durchbruch. Das Unternehmen erhielt schnell positive Bewertungen von Presse, Kunden und umfangreiche Finanzmittel.

Was ist das Problem? Heimlich von Kunden wurden ihre Sprachnachrichten von Mitarbeitern in Büros in Pakistan, Mauritius und Südafrika verarbeitet . Ein Insiderunternehmen gab an, dass nur 2% der Voicemail maschinell verarbeitet wurden und der Rest von ungefähr 10.000 Beschäftigten.

Als das pakistanische Büro von SpinVox nicht bezahlt wurde, begannen sie aus Protest, Nachrichten direkt an Kunden zu senden. Am Ende kam die Wahrheit heraus und SpinVox verlor den größten Teil seines Wertes und der Rest des Unternehmens wurde an Nuance , einen der größten Spracherkennungsdienstleister der Welt, verkauft.

In jüngerer Zeit hat der Cyber-Sicherheitsjournalist Brian Krebs bei MEDantex , einem Anbieter von Sprachtranskriptionsdiensten für Gesundheitsdienstleister in Kansas , einen schwerwiegenden Verstoß festgestellt . Es gab ein Datenleck (von denen einige aus dem Jahr 2007 stammen), das vertrauliche medizinische Unterlagen enthielt. Ihr Inhalt kann in Form von Microsoft Word-Dateien von einem unsicheren Portal heruntergeladen werden.

Selbst vollständig digitale Transkriptionsdienste sind unsicher. Sie bestellen einen solchen computergestützten Dienst, und das Unternehmen kann damit die Qualität der im Rahmen des Vertrags tätigen Personen kontrollieren.

Im Jahr 2019 stellte die belgische Nachrichtenseite VRT NWS fest , dass Google-Auftragnehmer Gespräche zwischen Personen und ihren intelligenten Assistenten bei Google Home mithören. Einer der Auftragnehmer gewährte VRT NWS sogar Zugang zu Gesprächen, von denen viele äußerst sensibel und in einigen Fällen sexuell intim waren.

Amazon, Apple und Microsoft verwendeten ebenfalls Auftragnehmer. Mit anderen Worten, jemand könnte sich die Sprachaufzeichnungen Ihres virtuellen Assistenten anhören .

Aktuelle Frage: Sind Online-Transkriptionsdienste sicher?


Die Antwort auf diese Frage ist etwas kompliziert.

Im Moment ist der Markt weitgehend reif für Transkriptionsdienste, und die offensichtlich schlechtesten Spieler wurden eliminiert.

Wenn Sie Ihre Daten (in diesem Fall private Gespräche) einem Dritten anvertrauen, erwarten Sie jedoch, dass diese ausreichend geschützt sind. Unabhängig davon, ob es sich um einen Onlinedienst oder einen Dienst mit Transkriptionsarbeitern handelt.

Stellen Sie sich auf jeden Fall zwei Fragen: Vertrauen Sie diesem Service und wie heikel sind Ihre Gespräche?

Wenn Sie einen Transkriptionsdienst studieren, sollten Sie immer etwas recherchieren. Hat dieses Unternehmen einen guten Ruf? Hat sie sich gut etabliert? Hatte sie in der Vergangenheit irgendwelche Verstöße? Gibt es eine Datenschutzrichtlinie, in der klar festgelegt ist, wie Ihre Daten verarbeitet und geschützt werden?

Wie bereits erwähnt, sind AI-basierte Dienste häufig auf Mitarbeiter und Fremdfirmen angewiesen, um Qualitätsprüfungen durchzuführen. Obwohl diese Überprüfungen nur einen Bruchteil aller Bestellungen ausmachen, besteht immer die Möglichkeit, dass jemand Ihre Aufnahmen anhören kann.

In vielen Fällen stört dies die Transaktion jedoch nicht. Wenn Ihre Konversation jedoch sehr privat oder kommerziell sensibel ist, sollten Sie einen Texteditor öffnen und sich selbst transkribieren.

All Articles