Inep omite dados do Enem
Inep omite dados do Enem; mudança compromete análise de desempenho de alunos e desigualdade, diz ex-diretora
Dados da edição de 2020 foram disponibilizados sem escola e município dos participantes, e detalhes de provas anteriores foram retiradas do site. Instituto diz que alteração visa a atender a Lei Geral de Proteção de Dados.
Por Ana Carolina Moreno e Emily Santos, TV Globo e g1 — São Paulo
O Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (Inep) omitiu informações sobre a escola e município dos participantes do do Exame Nacional do Ensino Médio (Enem) 2020 ao divulgar os dados detalhados sobre o exame, na última sexta-feira (18). No caso do Censo da Educação Básica de 2021, quatro das cinco bases de dados detalhados divulgadas anualmente foram suprimidas. Apenas um arquivo foi divulgado, com detalhes resumidos de cada escola. Ao divulgar os documentos na sexta, o Inep tirou do ar a série histórica dos dados do Censo da Educação Básica e do Enem, além de todos os microdados de outros censos, como o da Educação Superior, e avaliações.
A ausência dessas informações prejudica a análise do desempenho dos estudantes e a avaliação sobre as desigualdades entre eles, segundo especialistas ouvidos pelo G1 e pela TV Globo.
Em publicação, a entidade afirmou que o formato da apresentação do conteúdo foi reestruturado para "suprimir a possibilidade de identificação de pessoas", atendendo aos dispositivos da Lei Geral de Proteção de Dados (LGPD) e da Lei de Acesso à Informação (LAI).
Com base nesse argumento, o Inep tirou do ar, ainda, os microdados de edições anteriores do exame, e do censo da educação básica, com o argumento de adequá-los a um novo modelo de divulgação. Mas o instituto não informou quando eles serão novamente disponibilizados.
A LGPD é uma lei entrou em vigor em 2020 que rege formas de divulgação de dados para proteger as informações pessoais dos cidadãos. Já a LAI, em atividade há 10 anos, determina os processos de transparência dos órgãos públicos, e determina, entre outras regras, a divulgação ativa de dados sobre programas e políticas públicas.
Retrocesso de 15 anos no Censo da Educação Básica
Para Ernesto Martins Faria, diretor-fundador do Interdisciplinaridade e Evidências no Debate Educacional (Iede), a decisão do Inep não se justifica com base na LGPD. No caso do Censo da Educação Básica, ele afirma que o documento divulgado na sexta não pode ser considerado “microdados”.
“Microdados é você chegar na unidade de observação”, explicou ele. “Uma unidade de observação do Censo Escolar são os alunos. Ali no Censo Escolar da Educação Básica eu vou olhar características dos alunos, que é quem é atendido pelo sistema da educação básica. Vou olhar, por exemplo, questões específicas das escolas. Do professor.”
Os dados disponíveis atualmente mostram, por exemplo, o total de matrículas de cada escola segundo a raça ou a faixa etária de cada estudante, entre outros. Mas, sem uma tabela onde cada aluno é detalhado em cada linha, não é possível fazer recortes mais específicos e análises mais aprofundadas. Não é possível fazer um cruzamento de dados para descobrir, por exemplo, se a idade média dos estudantes negros de uma escola é mais alta do que a de estudantes brancos na mesma escola ou município, um indicador de que a distorção idade-série (indicador que mede o atraso de um estudante em relação à série em que ele deveria estar naquela idade) afeta os alunos e alunas de maneira desigual.
Faria afirma que a mudança na divulgação representa um retrocesso de 15 anos, para uma época em que o Inep não divulgava dados detalhados ao nível de cada estudante. “A gente conseguiu evoluir muito desde 2007, é como se a gente estivesse voltando 15, 16 anos no tempo.”
Segundo o especialista, as mudanças aplicadas não são as necessárias para adequar os microdados à LGPD. "Tem ajustes que deveriam ser feitos para dificultar a identificação dos alunos. Mas poderiam ter adotado estratégias para dificultar essa identificação. Por exemplo: tirar a data de nascimento e colocar só a idade em diferentes datas de referência", sugeriu ele.
Microdados do Enem também tiveram análise prejudicada
Os microdados do Enem 2020, como são chamados, foram divulgados em um novo modelo que não descreve o código de identificação da escola, os municípios de nascimento e de residência do participante e informações sobre os pedidos de atendimento especializado, específico e de recursos para atendimento especializado.
Para a economista Fabiana de Felício, diretora da consultoria Metas Sociais, a omissão destes dados pode impactar no levantamento de parâmetros importantes para a avaliação educacional. Um estudo sobre a desigualdade de acesso à escolas de qualidade por raça/cor, por exemplo, fica impossibilitado.
Para ela, que atuou como diretora de Estudos Educacionais do próprio Inep entre 2005 e 2008, quem é prejudicada é a população.
"O público principal dos microdados do Enem são pesquisadores, que querem entender como está a infraestrutura das escolas, o desempenho dos alunos de áreas rurais, por exemplo. O resultado disso pode vir em investimentos na educação ou em cobranças por parte da sociedade civil. Sem estes dados, o pesquisador pode mudar de área e ninguém vai saber como está o panorama da educação".
Importância dos dados
Fabiana de Felício explica que não é a população que cruza os dados dos estudantes, mas que este é um passo importante para pesquisadores da área da educação. Isso porque identificar o participante do levantamento permitiria ao profissional acompanhar o desenvolvimento do aluno ao longo de sua vida acadêmica, por exemplo.
"Os dados são de interesse do pesquisador. O profissional precisa saber se aquele aluno que prestou o Enem chegou ao ensino superior, se prestou o Enade. As informações são cruzadas apenas para fins como este", explica ela.
Segundo o Inep, pesquisadores ainda poderão ter acesso aos dados através do Serviço de Acesso a Dados Protegidos (Sedap), que possibilita solicitar acesso a bases restritas da entidade.
Para Felício, a decisão não supre a necessidade, já que o sistema é burocrático e pode negar ao profissional acesso a dados importantes.
Nota de esclarecimento | Divulgação dos microdados
Publicado em 22/02/2022
Colaboradores: Assessoria de Comunicação Social do Inep
O Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (Inep) esclarece que a adequação dos microdados disponíveis em seu portal está sendo realizada com base em estudos técnicos e análises jurídicas que priorizam o pleno atendimento às exigências previstas na Lei n.º 13.709, de 14 de agosto de 2018 — Lei Geral de Proteção de Dados Pessoais (LGPD). A necessidade de adequação das divulgações da Autarquia se dá em observação a critérios objetivos que reduzem o risco potencial de identificação das pessoas a quem os dados estatísticos se referem.
O controle de privacidade nos censos educacionais do Inep foi analisado por meio de Termo de Execução Descentralizada (TED) firmado entre o Instituto e a Universidade Federal de Minas Gerais (UFMG), executado pelo Laboratório Inscrypt (Laboratory of Information Security, Cryptography, Privacy, and Transparency) do Departamento de Ciência da Computação (DCC) da universidade. A instituição educacional concluiu, por meio de estudos, pesquisas e experimentos, que as técnicas de proteção de privacidade utilizadas nos microdados para retirada de identificadores individuais, como nome e número do Cadastro de Pessoas Físicas (CPF) e do Registro Civil, estão sujeitas a riscos já identificados.
Os resultados das análises promovidas pela UFMG apontam que, somente no Censo Escolar da Educação Básica 2019, o uso de três identificadores (mês, ano de nascimento e código da escola em que estuda) permite a identificação com probabilidade de acerto de até 29,64%. Se usados quatro identificadores, a chance de sucesso aumenta para 49,86% e, com o uso de todos os dez identificadores, o risco é elevado para 75,51%. Diante disso, o estudo técnico da universidade concluiu que “a atual forma de divulgação dos censos educacionais pelo Inep submete os titulares dos dados a consideráveis riscos de violação de privacidade, incluindo reidentificação e inferência de atributos sensíveis” e que “tal situação poderia constituir violação da Lei Geral de Proteção de Dados Pessoais”.
Diante dos resultados alcançados pela UFMG, a Diretoria de Estudos Educacionais (Deed) do Inep produziu nota técnica na qual sugere um conjunto de ações para solucionar o tratamento da privacidade nos microdados públicos, visto que o modelo até então disponibilizado se mostra ineficaz para o contexto atual. Uma das iniciativas, nesse sentido, foi o tratamento dos arquivos que continham dados individualizados e pessoais, já que ficou comprovada a possibilidade de identificação pessoal. A LGPD, vigente desde agosto de 2020, sancionou o sistema protetivo dos dados pessoais no direito brasileiro, estabelecendo princípios norteadores da coleta, do compartilhamento e do tratamento de dados pessoais, além de um conjunto de obrigações aos controladores e responsáveis por essas atividades.
A Diretoria de Avaliação da Educação Básica (Daeb) do Inep também elaborou nota técnica para adequações no formato de divulgação dos microdados do Exame Nacional do Ensino Médio (Enem), tendo em vista que os estudos realizados apontavam para risco de identificação de pessoas nos dados divulgados dos demais exames, pesquisas e avaliações da Autarquia. No documento é proposta a retirada e a mudança de variáveis para disponibilização da base de dados de maneira simplificada, enquanto o Instituto desenvolve outros estudos específicos para seus exames.
Os microdados do Enem 2020 foram reformulados, considerando que há evidências de que disponibilizar a informação do código da escola permite, em alguns casos, a identificação dos participantes por parte dos gestores dessas instituições. Por isso, essa variável foi retirada. Já a variável de idade foi agrupada em uma nova, chamada “faixa etária”. As variáveis “município de nascimento” e “residência do participante” foram retiradas, pois também permitem a identificação pessoal, caso sejam combinadas com outros dados cadastrais. Além disso, as informações referentes aos pedidos de atendimento especializado enquadram-se no conceito de dados pessoais sensíveis, previsto na LGPD, e facilitariam a identificação indevida do participante, devido ao número reduzido de inscritos que solicitam atendimento. Optou-se por manter a variável “cor/raça”, mesmo sendo um dado sensível, pois foi concluído que esta não facilitaria a identificação indevida, considerando o elevado número de participantes em cada categoria.
Com base nos documentos técnicos citados, a Procuradoria Federal especializada junto ao Inep (Projur) emitiu parecer jurídico, no qual apresenta os resultados das análises realizadas no processo de construção para tomada de decisão do Instituto. Destaca-se que os filtros de critérios utilizados pela Autarquia para cumprimento da LGPD foram detalhados pela Autoridade Nacional de Proteção de Dados (ANPD), no Guia de Tratamento de Dados Pessoais pelo Poder Público, documento publicado em janeiro de 2022. Além disso, foi analisado um entendimento fixado pelo Supremo Tribunal Federal (STF) em processo que tratou sobre o compartilhamento de dados pessoais, que prevê a necessidade de observar os limites definidos pela legislação para proteção da liberdade individual.
O parecer jurídico emitido pela Projur do Instituto conclui que, “se a divulgação dos censos ou outras bases de dados mantidos pelo Inep puder resultar em acesso, por terceiros, a microdados pessoais não anonimizados ou que permitam a reidentificação de seus titulares, a divulgação não poderá ser realizada, de acordo com a LGPD”. O documento explica, ainda, que o Instituto tem o “poder-dever” de suspender a divulgação de dados que apresentem risco de violação à legislação, sem descumprimento da Lei n.º 12.527, de 18 de novembro de 2011 – Lei de Acesso à Informação (LAI), pois, caso contrário, poderia responder por improbidade, omissão e ilegalidade em caso de representação junto à ANPD.
O Inep continuará a promover pesquisas e estudos para avaliar alternativas que permitam a ampliação progressiva da utilidade desse produto de disseminação de dados e assegurem, ainda, a privacidade dos titulares dos dados da pesquisa, além de garantir a transparência nas divulgações, como o desenvolvimento de painéis dinâmicos de informação. Um cronograma com as datas previstas para disponibilização dos microdados removidos será divulgado em breve.
Reforça-se, nesse contexto, que as pesquisas com a utilização dos dados tratados pelo Inep, eventualmente restringidos nos microdados, não estão inviabilizadas. Entre os diversos meios de acessar as informações produzidas pelo Instituto está o Serviço de Acesso a Dados Protegidos (Sedap), que possibilita o uso de bases restritas por pesquisadores. Para tanto, as pesquisas devem observar o protocolo do serviço, que pode ser consultado no portal do Instituto. Por meio do Sedap, é possível o desenvolvimento de estudos amplos e detalhados, considerando tendências, padrões e trajetórias educacionais que podem ser traçados a partir de evidências apuradas pela Autarquia.
Nesta semana, o Inep irá apresentar uma forma de expandir a sua capacidade de disponibilização de dados de forma segura nos estados, por meio de parcerias com instituições federais de educação superior.
Acesse a Nota Técnica da Diretoria de Estudos Educacionais do Inep (Deed)
Acesse a Nota Técnica da Diretoria de Avaliação da Educação Básica do Inep (Daeb)
Acesse o Parecer Jurídico da Procuradoria Federal Especializada junto ao Inep (Projur)
Assessoria de Comunicação Social do Inep