Os serviços de transcrição online são seguros e confidenciais?

Olá Habr! Apresento a você a tradução do artigo "Os serviços de transcrição on-line são seguros e privados?" autor Matthew Hughes .

A transcrição já foi um processo manual e tedioso. Médicos, jornalistas e toda uma multidão de profissionais anotaram suas anotações e conversas no gravador e sentaram-se em frente ao computador para digitá-las no teclado.

Em 2020, existem vários serviços que você pode usar para transformar sua gravação de áudio em texto. No entanto, a pergunta permanece: eles são seguros? Por exemplo, você pode baixar gravações de conversas confidenciais e correio de voz privado.

Vejamos esses serviços e como você pode proteger suas informações.

imagem
Ilustração de Yangard
Licença Creative Commons
Esta imagem está licenciada sob uma Licença Global Creative Commons Attribution-ShareAlike 4.0 .

Como os serviços de transcrição de áudio funcionam


Os serviços de transcrição de áudio, em regra, são divididos em três categorias. O primeiro é totalmente controlado por computador e usa modelos existentes de IA e aprendizado de máquina para lidar com a conversa. O segundo é o mais caro, quando as pessoas concluem todo o processo. O terceiro é uma combinação de processamento de computador e humano.

Provavelmente, você está mais familiarizado com a primeira categoria. Os serviços de transcrição de voz - como Google, Apple e Otter.ai - convertem as ondas analógicas geradas por sua voz em uma representação digital. Então eles são divididos em pequenos segmentos (às vezes um milésimo de segundo) e comparados com os conhecidos "fonemas" ou elementos da linguagem.

Em seguida, esses algoritmos tentam considerá-los no contexto de outros fonemas e passá-los por modelos estatísticos e de IA, que acabam produzindo texto. Como esses serviços de transcrição são totalmente controlados por computador, geralmente são os mais baratos. No entanto, a precisão nem sempre é paritária, especialmente quando se trata de extrair texto de um ambiente barulhento ou multiusuário.

A transcrição humana inclui plataformas específicas, como Rev , que conectam clientes a um pool de transcritores pré-aprovados. Você também pode contratar alguém de funcionários freelancers, como Upwork ou Fiverr .

Finalmente, há uma mistura dos dois. Para acelerar o processo de transcrição, alguns sites permitem que a IA faça um trabalho preliminar e, em seguida, alguém remove a saída e corrige os erros.

Os serviços de transcrição se comportam mal


Nos últimos anos, muitos serviços de transcrição tornaram-se objeto de violações e escândalos.

Talvez o mais antigo (e talvez o mais notório) tenha sido o SpinVox, que nos anos noventa oferecia um serviço que transforma o correio de voz em mensagens SMS. Naquela época, era considerado um avanço tecnológico. A empresa rapidamente atraiu críticas positivas da imprensa, clientes e amplo financiamento.

Qual é o problema? Secretamente dos clientes, suas mensagens de voz foram processadas por pessoas que trabalham em escritórios localizados no Paquistão, Maurício e África do Sul . Uma empresa privilegiada afirmou que apenas 2% do correio de voz foi processado por máquina, e o restante foi processado por aproximadamente 10.000 trabalhadores empregados.

Quando o escritório paquistanês da SpinVox não foi pago, eles começaram a enviar mensagens diretamente aos clientes em protesto. Como resultado, a verdade veio à tona e o SpinVox perdeu grande parte de seu valor, e o restante da empresa foi vendido para a Nuance , um dos maiores provedores de serviços de reconhecimento de voz do mundo.

Mais recentemente, o jornalista de segurança cibernética Brian Krebs descobriu uma violação grave na MEDantex , uma provedora de serviços de transcrição de voz do Kansas para profissionais de saúde. Houve um vazamento de dados (alguns dos quais remontam a 2007) contendo registros médicos confidenciais. Seu conteúdo pode ser baixado de um portal não seguro na forma de arquivos do Microsoft Word.

Até serviços de transcrição totalmente digital não são seguros. Você solicita um serviço informatizado e a empresa pode usá-lo para controlar a qualidade das pessoas que trabalham sob o contrato.

Em 2019, o site de notícias belga VRT NWS descobriu que os contratados do Google estão ouvindo conversas entre pessoas e seus assistentes inteligentes na Página inicial do Google. Um dos contratados chegou a fornecer ao VRT NWS acesso a conversas, muitas das quais eram profundamente sensíveis e, em alguns casos, sexualmente íntimas.

Amazon, Apple e Microsoft também usaram empreiteiros. Em outras palavras, alguém pode ouvir as gravações de voz do seu assistente virtual .

Pergunta real: Os serviços de transcrição online são seguros?


A resposta a esta pergunta é um pouco complicada.

No momento, o mercado está em grande parte maduro para serviços de transcrição e os jogadores mais flagrantemente ruins foram eliminados.

No entanto, quando você confia seus dados (neste caso, conversas particulares) a terceiros, espera que eles sejam suficientemente protegidos. Independentemente de ser um serviço on-line ou um serviço que utiliza trabalhadores de transcrição.

Mas, de qualquer forma, faça duas perguntas: você confia neste serviço e em quão delicadas são as suas conversas?

Se você estiver estudando um serviço de transcrição, sempre faça alguma pesquisa. Esta empresa tem uma boa reputação? Ela se estabeleceu bem? Ela teve alguma violação no passado? Existe uma política de privacidade que especifique claramente como seus dados serão processados ​​e protegidos?

Como mencionado anteriormente, os serviços baseados em IA geralmente dependem de funcionários e terceirizados para realizar verificações de qualidade. Embora essas verificações sejam apenas uma fração de todos os pedidos, sempre há uma chance de alguém ouvir suas gravações.

Mas, em muitos casos, isso não interfere na transação. No entanto, se sua conversa for profundamente privada ou comercialmente sensível, considere abrir um editor de texto e transcrever-se.

All Articles