A conversão de áudio em texto já foi uma tarefa árdua e manual. Profissionais de diversas áreas, como médicos e jornalistas, gravavam seus apontamentos e diálogos em fitas de ditafone e, posteriormente, dedicavam tempo para transcrevê-los em seus computadores.
Em contraste, atualmente, existem inúmeras plataformas que simplificam a transformação de gravações sonoras em texto digital. Contudo, surge uma questão crucial: quão seguras são essas ferramentas? Afinal, frequentemente, compartilhamos gravações de voz com informações confidenciais e mensagens de voz pessoais.
Vamos analisar essas alternativas e explorar formas de proteger suas informações.
Mecanismos dos Serviços de Transcrição de Áudio
Os serviços de transcrição de áudio geralmente se enquadram em três categorias. A primeira é totalmente automatizada, utilizando inteligência artificial e modelos de aprendizado de máquina para processar as falas. A segunda opção envolve o trabalho manual de transcritores humanos, o que a torna mais dispendiosa. A terceira abordagem combina processamento digital com intervenção humana.
Provavelmente, a primeira categoria é a mais conhecida. Plataformas como Google, Apple e Otter.ai transformam as ondas sonoras da voz em uma representação digital. Em seguida, dividem essa representação em pequenos segmentos (em alguns casos, milésimos de segundo) e os relacionam a “fonemas” ou componentes da linguagem.
Posteriormente, algoritmos analisam esses fonemas em contexto e os inserem em modelos estatísticos e de IA, que geram o texto final. Por serem totalmente automatizados, esses serviços são geralmente mais acessíveis. Contudo, sua precisão pode ser comprometida, principalmente em ambientes ruidosos ou com múltiplas vozes.
A transcrição realizada por humanos envolve empresas como Rev, que conectam clientes a uma rede de transcritores qualificados. É também possível contratar profissionais independentes em plataformas como Upwork ou Fiverr.
Por fim, a opção híbrida combina os dois métodos. Nesses casos, a inteligência artificial faz a transcrição inicial, e transcritores humanos revisam e corrigem o texto.
Falhas de Segurança em Serviços de Transcrição
Nos últimos anos, vários serviços de transcrição foram envolvidos em incidentes de segurança e escândalos.
Um dos casos mais antigos e notórios foi o da SpinVox, que oferecia um serviço de conversão de mensagens de voz em SMS. Na época, a tecnologia foi considerada um avanço. A empresa rapidamente atraiu atenção da mídia, clientes e investimentos.
O problema era que, sem o conhecimento dos usuários, as mensagens de voz eram processadas por pessoas em escritórios no Paquistão, Ilhas Maurício e África do Sul. Uma fonte interna revelou que apenas 2% das mensagens eram processadas por máquinas, e o restante por cerca de 10.000 trabalhadores.
Quando os funcionários de um escritório da SpinVox no Paquistão deixaram de receber seus pagamentos, eles começaram a enviar mensagens diretamente aos clientes. A verdade veio à tona e a SpinVox perdeu muito valor. Posteriormente, a empresa foi vendida para a Nuance, uma das maiores empresas de reconhecimento de voz do mundo.
Mais recentemente, o jornalista de segurança cibernética Brian Krebs revelou uma grande violação na MEDantex, uma empresa de transcrição de voz para profissionais médicos. Dados, incluindo registros médicos confidenciais datados de 2007, foram vazados de um portal inseguro como arquivos do Microsoft Word.
Até mesmo os serviços de transcrição digital podem apresentar riscos. Mesmo que um serviço seja totalmente automatizado, é possível que a empresa contrate revisores humanos para o controle de qualidade.
Em 2019, o site de notícias belga VRT NWS descobriu que funcionários contratados pelo Google estavam ouvindo conversas de usuários com seus assistentes inteligentes do Google Home. Um desses contratados chegou a compartilhar conversas, algumas de natureza bastante sensível, com o VRT NWS.
Amazon, Apple e Microsoft também foram descobertas utilizando o mesmo método. Isso significa que existe a possibilidade de alguém estar ouvindo gravações de voz do seu assistente virtual.
Quão Seguros São os Serviços de Transcrição Online?
A grande pergunta é se os serviços de transcrição online são seguros. Infelizmente, a resposta não é simples.
O mercado de transcrição de voz está bastante consolidado. Os principais infratores já foram identificados.
No entanto, ao confiar seus dados, como conversas particulares, a terceiros, você depende deles para protegê-los. Isso se aplica tanto a serviços online quanto a transcritores humanos.
Em última análise, é importante considerar dois pontos: o nível de confiança que você tem na plataforma e a sensibilidade das suas conversas.
Ao escolher um serviço de transcrição, vale a pena pesquisar a reputação da empresa. Ela é confiável? Possui um histórico sólido? Já esteve envolvida em vazamentos de dados? Existe uma política de privacidade que detalhe como seus dados serão tratados e protegidos?
Como mencionado, serviços baseados em IA frequentemente dependem de terceirizados para o controle de qualidade. Apesar dessas revisões representarem uma pequena parte de todas as transcrições, sempre existe a chance de alguém ouvir sua conversa.
Em muitos casos, isso pode não ser um problema. Contudo, se sua conversa for altamente confidencial, pode ser melhor transcrevê-la manualmente.