Eu, Estudante

Enem

Inep remove microdados do Censo Escolar e do Enem e oculta informações

Dados do sistema são imprescindíveis para formulação de políticas públicas educacionais no país

O Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (Inep), vinculado ao Ministério da Educação, retirou do ar toda a série histórica com dados sobre o Censo Escolar da educação básica e do Exame Nacional do Ensino Médio (Enem) anteriores a 2020, que norteava a formulação de políticas públicas educacionais. O Centro de Estudos Sociedade, Universidade e Ciência (Sou Ciência), ligado à Universidade Federal de São Paulo (Unifesp), argumenta que a medida vai na contramão das boas práticas da gestão pública e promete disponibilizar os dados em seu site.


A medida impede o acesso a microdados importantes, como matrículas de estudantes, suias trajetórias, condições de trabalho dos profissionais da educação, sua formação, condições de infraestrutura das instituições de ensino, seu financiamento, além de resultados de avaliações externas. O Inep alega que a medida foi adotada visando a adequação à Lei Geral de Proteção de Dados Pessoais (LGPD).


Os arquivos foram removidos do site do Inep no último sábado (18), quando o órgão divulgou os microdados do Censo Escolar 2021 e do Enem 2020, os únicos disponíveis atualmente. Os documentos divulgados passaram a apresentar, então, padrão diferente do que vinha sendo observado nos últimos anos. Os dados do Enem 2020 registram agora quase metade a menos das informações que costumavam a integrar o documento, enquanto os do Censo 2020 e 2021 tiveram a grande maioria das informações suprimidas.

Arquivo Pessoal - .

A vice-coordenadora do Sou Ciência e professora do Departamento de Educação da Unifesp, Maria Angélica Minhoto alerta que a medida atinge frontalmente a capacidade de governos, pesquisadores e sociedade em geral de planejarem, elaborarem, monitorarem, avaliarem e participarem ativamente das decisões sobre políticas educacionais no país em todos os níveis de ensino. "A falta de acesso é um problema grave para a formulação, acompanhamento e democratização das políticas educacionais", frisa. Respondendo a questionamentos do instituto sobre o ocorrido, o Inep argumentou que os dados foram omitidos "por haver por haver problemas com a anonimização de dados". O Centro dispõe de cópia de todos os arquivos que estavam disponíveis no site do MEC/Inep até a semana passada e está decidido a disponibilizar as informações em seu site o mais breve possível, caso não haja nada que contrarie a legislação em vigor. "Se for possível, algo que estamos avaliando ainda, vamos disponibilizar", afirma Minhoto.

Por meio de nota, o Inep informou que o formato de apresentação dos arquivos “foram reestruturados para suprimir a possibilidade de identificação de pessoas, em atendimento às normas previstas na Lei n.º 13.709, de 14 de agosto de 2018 (Lei Geral de Proteção de Dados Pessoais – LGPD).” A autarquia frisou ainda que removeu do ar a série histórica do Censo e do Enem “para que os arquivos sejam adequados ao novo formato, tendo em vista o atendimento às normas da LGPD”. Leia abaixo a ínegra da nota oficial do Inep.


Nota de esclarecimento | Divulgação dos microdados

O Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (Inep) esclarece que a adequação dos microdados disponíveis em seu portal está sendo realizada com base em estudos técnicos e análises jurídicas que priorizam o pleno atendimento às exigências previstas na Lei n.º 13.709, de 14 de agosto de 2018 — Lei Geral de Proteção de Dados Pessoais (LGPD). A necessidade de adequação das divulgações da Autarquia se dá em observação a critérios objetivos que reduzem o risco potencial de identificação das pessoas a quem os dados estatísticos se referem.

O controle de privacidade nos censos educacionais do Inep foi analisado por meio de Termo de Execução Descentralizada (TED) firmado entre o Instituto e a Universidade Federal de Minas Gerais (UFMG), executado pelo Laboratório Inscrypt (Laboratory of Information Security, Cryptography, Privacy, and Transparency) do Departamento de Ciência da Computação (DCC) da universidade. A instituição educacional concluiu, por meio de estudos, pesquisas e experimentos, que as técnicas de proteção de privacidade utilizadas nos microdados para retirada de identificadores individuais, como nome e número do Cadastro de Pessoas Físicas (CPF) e do Registro Civil, estão sujeitas a riscos já identificados.

Os resultados das análises promovidas pela UFMG apontam que, somente no Censo Escolar da Educação Básica 2019, o uso de três identificadores (mês, ano de nascimento e código da escola em que estuda) permite a identificação com probabilidade de acerto de até 29,64%. Se usados quatro identificadores, a chance de sucesso aumenta para 49,86% e, com o uso de todos os dez identificadores, o risco é elevado para 75,51%. Diante disso, o estudo técnico da universidade concluiu que “a atual forma de divulgação dos censos educacionais pelo Inep submete os titulares dos dados a consideráveis riscos de violação de privacidade, incluindo reidentificacao e inferência de atributos sensíveis” e que “tal situação poderia constituir violação da Lei Geral de Proteção de Dados Pessoais”.

Diante dos resultados alcançados pela UFMG, a Diretoria de Estudos Educacionais (Deed) do Inep produziu nota técnica na qual sugere um conjunto de ações para solucionar o tratamento da privacidade nos microdados públicos, visto que o modelo até então disponibilizado se mostra ineficaz para o contexto atual. Uma das iniciativas, nesse sentido, foi o tratamento dos arquivos que continham dados individualizados e pessoais, já que ficou comprovada a possibilidade de identificação pessoal. A LGPD, vigente desde agosto de 2020, sancionou o sistema protetivo dos dados pessoais no direito brasileiro, estabelecendo princípios norteadores da coleta, do compartilhamento e do tratamento de dados pessoais, além de um conjunto de obrigações aos controladores e responsáveis por essas atividades.

A Diretoria de Avaliação da Educação Básica (Daeb) do Inep também elaborou nota técnica para adequações no formato de divulgação dos microdados do Exame Nacional do Ensino Médio (Enem), tendo em vista que os estudos realizados apontavam para risco de identificação de pessoas nos dados divulgados dos demais exames, pesquisas e avaliações da Autarquia. No documento é proposta a retirada e a mudança de variáveis para disponibilização da base de dados de maneira simplificada, enquanto o Instituto desenvolve outros estudos específicos para seus exames.

Os microdados do Enem 2020 foram reformulados, considerando que há evidências de que disponibilizar a informação do código da escola permite, em alguns casos, a identificação dos participantes por parte dos gestores dessas instituições. Por isso, essa variável foi retirada. Já a variável de idade foi agrupada em uma nova, chamada “faixa etária”. As variáveis “município de nascimento” e “residência do participante” foram retiradas, pois também permitem a identificação pessoal, caso sejam combinadas com outros dados cadastrais. Além disso, as informações referentes aos pedidos de atendimento especializado enquadram-se no conceito de dados pessoais sensíveis, previsto na LGPD, e facilitariam a identificação indevida do participante, devido ao número reduzido de inscritos que solicitam atendimento. Optou-se por manter a variável “cor/raça”, mesmo sendo um dado sensível, pois foi concluído que esta não facilitaria a identificação indevida, considerando o elevado número de participantes em cada categoria.

Com base nos documentos técnicos citados, a Procuradoria Federal especializada junto ao Inep (Projur) emitiu parecer jurídico, no qual apresenta os resultados das análises realizadas no processo de construção para tomada de decisão do Instituto. Destaca-se que os filtros de critérios utilizados pela Autarquia para cumprimento da LGPD foram detalhados pela Autoridade Nacional de Proteção de Dados (ANPD), no Guia de Tratamento de Dados Pessoais pelo Poder Público, documento publicado em janeiro de 2022. Além disso, foi analisado um entendimento fixado pelo Supremo Tribunal Federal (STF) em processo que tratou sobre o compartilhamento de dados pessoais, que prevê a necessidade de observar os limites definidos pela legislação para proteção da liberdade individual.

O parecer jurídico emitido pela Projur do Instituto conclui que, “se a divulgação dos censos ou outras bases de dados mantidos pelo Inep puder resultar em acesso, por terceiros, a microdados pessoais não anonimizados ou que permitam a reidentificação de seus titulares, a divulgação não poderá ser realizada, de acordo com a LGPD”. O documento explica, ainda, que o Instituto tem o “poder-dever” de suspender a divulgação de dados que apresentem risco de violação à legislação, sem descumprimento da Lei n.º 12.527, de 18 de novembro de 2011 – Lei de Acesso à Informação (LAI), pois, caso contrário, poderia responder por improbidade, omissão e ilegalidade em caso de representação junto à ANPD.

O Inep continuará a promover pesquisas e estudos para avaliar alternativas que permitam a ampliação progressiva da utilidade desse produto de disseminação de dados e assegurem, ainda, a privacidade dos titulares dos dados da pesquisa, além de garantir a transparência nas divulgações, como o desenvolvimento de painéis dinâmicos de informação. Um cronograma com as datas previstas para disponibilização dos microdados removidos será divulgado em breve.

Reforça-se, nesse contexto, que as pesquisas com a utilização dos dados tratados pelo Inep, eventualmente restringidos nos microdados, não estão inviabilizadas. Entre os diversos meios de acessar as informações produzidas pelo Instituto está o Serviço de Acesso a Dados Protegidos (Sedap), que possibilita o uso de bases restritas por pesquisadores. Para tanto, as pesquisas devem observar o protocolo do serviço, que pode ser consultado no portal do Instituto. Por meio do Sedap, é possível o desenvolvimento de estudos amplos e detalhados, considerando tendências, padrões e trajetórias educacionais que podem ser traçados a partir de evidências apuradas pela Autarquia.

Nesta semana, o Inep irá apresentar uma forma de expandir a sua capacidade de disponibilização de dados de forma segura nos estados, por meio de parcerias com instituições federais de educação superior.