¿Los servicios de transcripción en línea son seguros y confidenciales?

Hola Habr! Le presento la traducción del artículo "¿Son seguros y privados los servicios de transcripción en línea?" autor Matthew Hughes .

La transcripción fue una vez un proceso manual y tedioso. Médicos, periodistas y una multitud de profesionales escribieron sus notas y conversaciones en la grabadora, y luego se sentaron frente a la computadora para escribirlas en el teclado.

En 2020, hay una serie de servicios que puede usar para convertir su grabación de audio en texto. Sin embargo, la pregunta sigue siendo: ¿son seguros? Por ejemplo, puede descargar grabaciones de conversaciones sensibles y correo de voz privado.

Veamos estos servicios y cómo puede proteger su información.

imagen
Ilustración de Yangard.
Licencia Creative Commons
Esta imagen está licenciada bajo una licencia global Creative Commons Attribution-ShareAlike 4.0 .

Cómo funcionan los servicios de transcripción de audio


Los servicios de transcripción de audio, por regla general, se dividen en tres categorías. El primero está totalmente controlado por computadora y utiliza los modelos existentes de inteligencia artificial y aprendizaje automático para manejar la conversación. El segundo es el más caro, cuando las personas completan todo el proceso. El tercero es una combinación de procesamiento informático y humano.

Lo más probable es que esté más familiarizado con la primera categoría. Los servicios de transcripción de voz, como Google, Apple y Otter.ai , convierten las ondas analógicas creadas por su voz en una representación digital. Luego se dividen en pequeños segmentos (a veces una milésima de segundo) y se comparan con los conocidos "fonemas" o elementos del lenguaje.

Luego, estos algoritmos intentan considerarlos en el contexto de otros fonemas y pasarlos a través de modelos estadísticos y de inteligencia artificial, que finalmente producen texto. Dado que estos servicios de transcripción están totalmente controlados por computadora, generalmente son los más económicos. Sin embargo, la precisión no siempre está a la altura, especialmente cuando se trata de extraer texto de un entorno ruidoso o multiusuario.

La transcripción humana incluye plataformas específicas, como Rev , que conectan a los clientes a un grupo de transcriptores preaprobados. También puede contratar a alguien de empleados independientes, como Upwork o Fiverr .

Finalmente, hay una mezcla de los dos. Para acelerar el proceso de transcripción, algunos sitios permiten que la IA haga un trabajo preliminar, y luego alguien elimina la salida y corrige los errores.

Los servicios de transcripción se comportan mal


En los últimos años, muchos servicios de transcripción se han convertido en objeto de violaciones y escándalos.

Quizás el más antiguo (y tal vez el más atroz) fue SpinVox, que en los "noughties" ofreció un servicio que convierte el correo de voz en mensajes SMS. En ese momento se consideraba un avance tecnológico. La compañía rápidamente atrajo críticas positivas de la prensa, los clientes y una amplia financiación.

¿Cuál es el problema? Secretamente de los clientes, sus mensajes de voz fueron procesados ​​por personas que trabajan desde oficinas ubicadas en Pakistán, Mauricio y Sudáfrica . Una compañía interna afirmó que solo el 2% del correo de voz fue procesado por máquina, y el resto fue procesado por aproximadamente 10,000 trabajadores empleados.

Cuando no se pagó la oficina paquistaní de SpinVox, comenzaron a enviar mensajes directamente a los clientes en protesta. Al final, se supo la verdad, y SpinVox perdió la mayor parte de su valor, y el resto de la compañía fue vendida a Nuance , uno de los proveedores de servicios de reconocimiento de voz más grandes del mundo.

Más recientemente, el periodista de seguridad cibernética Brian Krebs descubrió una violación grave en MEDantex , un proveedor de servicios de transcripción de voz de Kansas para proveedores de atención médica. Hubo una fuga de datos (algunos de los cuales datan de 2007) que contienen registros médicos confidenciales. Sus contenidos se pueden descargar desde un portal inseguro en forma de archivos de Microsoft Word.

Incluso los servicios de transcripción totalmente digital no son seguros. Usted solicita dicho servicio computarizado, y la compañía puede usarlo para controlar la calidad de las personas que trabajan bajo el contrato.

En 2019, el sitio de noticias belga VRT NWS descubrió que los contratistas de Google están escuchando conversaciones entre las personas y sus asistentes inteligentes en Google Home. Uno de los contratistas incluso proporcionó a VRT NWS acceso a conversaciones, muchas de las cuales eran profundamente sensibles y, en algunos casos, íntimas sexualmente.

Amazon, Apple y Microsoft también usaron contratistas. En otras palabras, alguien podría escuchar las grabaciones de voz de su asistente virtual .

Pregunta real: ¿Son seguros los servicios de transcripción en línea?


La respuesta a esta pregunta es un poco complicada.

Por el momento, el mercado está en gran medida maduro para los servicios de transcripción, y los jugadores más descaradamente malos han sido eliminados.

Sin embargo, cuando confía sus datos (en este caso, conversaciones privadas) a un tercero, espera que estén suficientemente protegidos. Independientemente de si se trata de un servicio en línea o un servicio que utiliza trabajadores de transcripción.

Pero, en cualquier caso, hágase dos preguntas: ¿confía en este servicio y cuán delicadas son sus conversaciones?

Si está estudiando un servicio de transcripción, siempre debe investigar un poco. ¿Esta empresa tiene una buena reputación? ¿Se ha establecido bien? ¿Tenía alguna violación en el pasado? ¿Existe una política de privacidad que explique claramente cómo se procesarán y protegerán sus datos?

Como se mencionó anteriormente, los servicios basados ​​en IA a menudo dependen de empleados y contratistas externos para realizar controles de calidad. Aunque estos controles son solo una fracción de todos los pedidos, siempre existe la posibilidad de que alguien pueda escuchar sus grabaciones.

Pero en muchos casos, esto no interfiere con la transacción. Sin embargo, si su conversación es muy privada o comercialmente sensible, considere abrir un editor de texto y transcribirse.

All Articles