A diferença entre dados anonimizados, dados pseudonimizados e dados pessoais

Dados anonimizados

Dados anonimizados são quaisquer dados relativos a titular que não possa ser identificado, considerando a utilização de meios técnicos razoáveis e disponíveis na ocasião de seu tratamento.

Embora seja essa a definição da Lei Geral de Proteção de Dados Pessoais (LGPD), na prática a anonimização de dados não é tão simples e segura como parece.

Para entender melhor a complexidade do tema, veremos neste artigo:

Vamos começar definindo exatamente o que são dados anonimizados.

O que são dados anonimizados

A LGPD dispõe, em seu art. 5º, inciso III, que dado anonimizado é o “dado relativo a titular que não possa ser identificado, considerando a utilização de meios técnicos razoáveis e disponíveis na ocasião de seu tratamento”.

Já no inciso XI do mesmo artigo, a lei dispõe que anonimização é a “utilização de meios técnicos razoáveis e disponíveis no momento do tratamento, por meio dos quais um dado perde a possibilidade de associação, direta ou indireta, a um indivíduo”.

Observa-se que a lei utiliza o chamado Filtro da Razoabilidade para dispor acerca dos meios técnicos razoáveis para a anonimização de um dado.

Como é feita a anonimização de dados

O processo de anonimização de dados é feito retirando a associação do dado a uma pessoa.

Por exemplo, um banco de dados com nome completo, CEP e CPF, depois de anonimizado, passa a ter apenas o primeiro nome e partes do CEP e do CPF:

Tabela 1: Dados Pessoais

NomeCPFCEPData de Nascimento
João Silva de Souza123.456.789-0001234-56715/03/1985
Maria Oliveira Santos987.654.321-1187654-32122/07/1990
Carlos Pereira Almeida456.789.123-2234567-89009/11/1978
Ana Beatriz Lima Costa789.123.456-3365432-10903/05/1983
Bruno Henrique Azevedo321.654.987-4443210-98719/12/1992

Tabela 2: Dados Anonimizados

NomeCPFCEPIdade
João123..-**012**-***39
Maria987..-**876**-***34
Carlos456..-**345**-***45
Ana Beatriz789..-**654**-***41
Bruno321..-**432**-***31

Na primeira tabela, os dados pessoais são apresentados de forma completa, permitindo a identificação direta dos indivíduos. 

Na segunda tabela, os dados foram anonimizados, ocultando informações críticas e reduzindo o risco de identificação, atendendo aos critérios de anonimização da LGPD.

A diferença entre anonimização de dados e pseudonimização

Pseudonimização, segundo o § 4º do art. 13 da LGPD, é “o tratamento por meio do qual um dado perde a possibilidade de associação, direta ou indireta, a um indivíduo, senão pelo uso de informação adicional mantida separadamente pelo controlador em ambiente controlado e seguro”.

Na pseudonimização, existem em regra dois bancos de dados: um com os dados anonimizados e outro com informações adicionais que, se utilizadas, permitem que os dados voltem a ser associados a uma pessoa.

É como se fosse uma anonimização que pode ser revertida quando você associa dois ou mais dados. 

Diferente do que ocorre com os dados anonimizados, aqui sempre é possível reverter a desassociação, bastando apenas o acesso às informações adicionais.

A pseudonimização é mencionada pela LGPD no caso de realização de estudos em saúde pública, que devem, sempre que possível, utilizar dados anonimizados ou pseudonimizados.

A falsa dicotomia entre dados pessoais e dados anonimizados

O art. 12 da LGPD dispõe que dados anonimizados não serão considerados dados pessoais, salvo quando o processo de anonimização ao qual foram submetidos for revertido, utilizando exclusivamente meios próprios, ou quando, com esforços razoáveis, puder ser revertido.

A interpretação literal dos incisos III e XI do art. 5º da LGPD leva a crer que dado anonimizado é o dado que não se relaciona a uma pessoa, ou seja, não é dado pessoal. A ele, portanto, não se aplica a LGPD.

Essa é a regra geral: dado anonimizado não é dado pessoal. 

Existe, porém, uma zona cinzenta em que não dá para separar completamente o que é dado pessoal e o que é dado anonimizado.

Apenas como exemplo, basta lembrar que necessariamente para se anonimizar um dado, o agente está obrigatoriamente realizando uma operação de tratamento de dados pessoais.

Vale repetir: o processo inicial de anonimização é sempre um tratamento de dado pessoal.

Se a origem desse dado pessoal é ilícita, por romper alguma disposição da LGPD, o processo de anonimização não vai “limpar” o dado agora anonimizado.

Além disso, a anonimização não reduz a zero a probabilidade de reidentificação de um conjunto de dados.

O próprio § 2º do art. 12 deixa isso claro ao dispor que podem ser considerados dados pessoais os dados utilizados para formação do perfil comportamental de determinada pessoa natural, se identificada.

Há muitos estudos mostrando que é relativamente fácil chegar a um dado pessoal a partir de um banco de dados anonimizados. A doutrina chama isso de Risco de Reidentificação.

Por isso, o agente de tratamento precisa sempre analisar a probabilidade de Risco de Reidentificação, saindo da falsa dicotomia entre o que é dado pessoal e o que é dado anonimizado.

Os casos de uso de dados anonimizados

A LGPD dispõe sobre situações em que o uso de dados anonimizados é recomendável e outras nas quais o uso é obrigatório.

No caso de realização de estudos por órgão de pesquisa, deve ser garantida, sempre que possível, a anonimização dos dados pessoais, sejam eles dados pessoais sensíveis ou não. 

O mesmo vale para a realização de estudos em saúde pública, com a ressalva de que, neste caso, o art. 13 da lei fala em “anonimização ou pseudonimização dos dados”.

A anonimização de dados coletados em estudos por órgão de pesquisa também é recomendada caso o agente de tratamento queira manter os dados após o término do tratamento.

Já no caso em que o controlador queira manter dados após o término do tratamento para seu uso exclusivo, a lei obriga a anonimização dos dados ao mesmo tempo em que veda o acesso por terceiros a esses dados.

Não fica claro se, diante de uma requisição de eliminação de dados por parte do titular, o controlador pode simplesmente anonimizar tais dados.

O que fica evidente é que o titular pode requerer ao controlador a anonimização de dados desnecessários, excessivos ou tratados em desconformidade com o disposto na LGPD.

Além disso, Autoridade Nacional de Proteção de Dados (ANPD) poderá dispor sobre padrões e técnicas utilizados em processos de anonimização e realizar verificações acerca de sua segurança, ouvido o Conselho Nacional de Proteção de Dados Pessoais.

Conclusão

Dados anonimizados são dados relativos a uma pessoa que não possa ser identificado, considerando a utilização de meios técnicos razoáveis e disponíveis na ocasião de seu tratamento.

Em regra, um dado anonimizado não seria um dado pessoal, por não se ligar diretamente a uma pessoa.

Existe, contudo, um razoável Risco de Reidentificação, uma possibilidade de que meios técnicos consigam partir de um dado anonimizado e chegar a uma pessoa.

A ANPD ainda não publicou um guia específico sobre dados anonimizados. 

Assim, cabe aos agentes de tratamento a gestão de risco ao tratar dados anonimizados para evitar que eles possam ser religados a um indivíduo identificado.

Foto: Kaique Rocha

Escrito por
Walmar Andrade
Walmar Andrade