Os serviços de transcrição online são seguros e privados?

A transcrição já foi um processo manual e tedioso. Médicos, jornalistas e vários profissionais gravavam suas anotações e conversas em fitas dictaphone ásperas e depois se sentavam na frente de seus computadores para digitá-las.

Avance para 2020, e há uma variedade de serviços que você pode usar para transformar uma gravação de áudio em texto na tela do computador. No entanto, uma questão permanece: eles estão seguros? Afinal, você pode estar enviando gravações de voz de conversas confidenciais e correios de voz particulares.

Vamos dar uma olhada nesses serviços e como você pode proteger suas informações.

Como funcionam os serviços de transcrição de áudio

Os serviços de transcrição de áudio tendem a se enquadrar em três campos. O primeiro é inteiramente controlado por computador e usa modelos de aprendizado de máquina e IA existentes para processar a conversa. O segundo é o mais caro porque as pessoas fazem o trabalho pesado. O terceiro é uma combinação de processamento de computador e humanos.

Provavelmente, você está mais familiarizado com a primeira categoria. Serviços de transcrição de voz, como os oferecidos pelo Google, Apple e Otter.ai– converta as ondas analógicas que sua voz cria em uma representação digital. Em seguida, ele os divide em pequenos (às vezes, um milésimo de segundo) segmentos e os associa a “fonemas” conhecidos ou elementos de uma língua.

Esses algoritmos, então, tentam examiná-los dentro do contexto de outros fonemas e colocá-los em modelos estatísticos e de IA que, em última análise, produzem texto. Como esses serviços de transcrição são inteiramente controlados por computador, eles tendem a ser os mais baratos de operar. No entanto, a precisão nem sempre é precisa, principalmente quando se trata de extrair texto de ambientes barulhentos ou com várias pessoas.

A transcrição acionada por humanos envolve plataformas dedicadas, como Rev, que conecta os clientes a um grupo de transcritores pré-aprovados. Você também pode contratar alguém de um mercado autônomo, como Upwork ou Fiverr, para transcrever para você.

Finalmente, há a mistura dos dois. Para agilizar o processo de transcrição, alguns sites permitem que a IA faça o trabalho preliminar e, em seguida, alguém organiza a saída e corrige quaisquer erros.

Os serviços de transcrição estão se comportando mal

Nos últimos anos, muitos serviços de transcrição foram sujeitos a violações e escândalos.

Talvez o mais antigo (e, sem dúvida, o mais chocante) fosse o SpinVox, que, nos anos 2000, oferecia um serviço que transformava correios de voz em mensagens SMS. Na época, isso foi considerado nada menos que um avanço tecnológico. A empresa atraiu rapidamente imprensa positiva, clientes e vastos fundos de financiamento.

O problema? Sem o conhecimento dos clientes, seus correios de voz eram processado por pessoas que trabalham em escritórios em lugares como Paquistão, Maurício e África do Sul. Uma fonte da empresa afirmou que apenas 2 por cento das mensagens de voz eram processadas por máquina e o restante por cerca de 10.000 trabalhadores explorados.

Quando os funcionários de um escritório da SpinVox no Paquistão não eram pagos, eles começaram a enviar mensagens diretamente aos clientes para protestar. Eventualmente, a verdade veio à tona e SpinVox perdeu muito de seu valor. No final das contas, os remanescentes da empresa foram vendidos para Nuance, um dos maiores provedores de reconhecimento de voz do mundo.

Mais recentemente, o jornalista de segurança cibernética Brian Krebs descobriu uma grande violação que ocorreu na MEDantex, um provedor de serviços de transcrição de voz para profissionais médicos com sede em Kansas. Previsivelmente, dados (alguns dos quais datados de 2007) contendo registros médicos confidenciais vazaram. O conteúdo pode ser baixado de um portal inseguro como arquivos do Microsoft Word.

Mesmo os serviços de transcrição digital não são seguros. Afinal, quando você usa um serviço inteiramente controlado por computador, a empresa pode usar contratados humanos para realizar o controle de qualidade.

Em 2019, o site de notícias belga, VRT NWS, descobriu que os contratados do Google estavam ouvindo conversas entre indivíduos e seus assistentes inteligentes do Google Home. Um contratante até forneceu à VRT NWS acesso a conversas, muitas das quais de natureza profundamente sensível (e, em alguns casos, sexualmente íntima).

Amazon, Apple e Microsoft também estavam usando empreiteiros dessa forma. Em outras palavras, alguém pode estar ouvindo gravações de voz de seu assistente virtual.

Os serviços de transcrição online são seguros?

A questão mais pertinente é se os serviços de transcrição online são seguros. Infelizmente, a resposta é um pouco complicada.

O espaço de transcrição de voz é, neste ponto, bastante maduro. Os maus atores mais notórios foram eliminados.

No entanto, quando você confia seus dados (neste caso, conversas privadas) a um terceiro, você confia neles para protegê-los. Isso é tão verdadeiro para serviços online quanto para transcritores humanos.

Em última análise, você tem que se perguntar duas coisas: você confia no serviço e quão delicadas são suas conversas?

Quando você examina um serviço de transcrição, sempre vale a pena fazer alguma pesquisa. A empresa tem boa reputação? Está bem estabelecido? Ele já foi sujeito a uma violação de dados no passado? Existe uma política de privacidade que especifica explicitamente como seus dados serão tratados e protegidos?

Como mencionamos anteriormente, os serviços baseados em IA frequentemente dependem de funcionários e contratados terceirizados para fazer verificações de controle de qualidade. Embora essas verificações representem uma fração de todas as transcrições, sempre há a chance de alguém estar ouvindo sua conversa.

Em muitos casos, porém, isso não é um obstáculo. No entanto, se sua conversa for profundamente privada ou comercialmente sensível, você pode querer abrir um editor de texto e transcrever à moda antiga.