Resumo
Objetivo: descrever a incompletude da informação sobre profissão/ocupação nas bases de dados de síndrome respiratória aguda grave (SRAG), síndrome gripal (SG) e no Sistema de Informações sobre Mortalidade (SIM) no Brasil.
Métodos: estudo descritivo utilizando os bancos de dados de SRAG, SG e SIM. Calcularam-se percentuais de incompletude na variável profissão/ocupação segundo sexo, macrorregiões e unidades da federação, em 2020-2021.
Resultados: o percentual de incompletude foi de 94,7% no banco de SG; 97,7% no de SRAG; e 17,0% no SIM. Em todas as macrorregiões a incompletude foi superior a 91,0% nos bancos de SG e SRAG; e superior a 13,0% no SIM. Todas as unidades da federação apresentaram percentuais de incompletude acima de 90,0% para SG; de 74,0% para SRAG; e de 6,8% para óbitos. Amapá apresentou maior percentual de incompletude na base de dados de SG (98,1%); Rio Grande do Sul (99,4%) na de SRAG; e Alagoas (45,0%) no SIM.
Conclusões: observaram-se elevados percentuais de incompletude da variável profissão/ocupação nos sistemas de informação estudados. Recomenda-se uma articulação intersetorial, envolvendo representantes dos governos e dos trabalhadores, para formulação de estratégias que contornem a falta de informação sobre ocupação/profissão nas bases de dados relevantes para a vigilância em saúde.
Palavras-chave: vigilância epidemiológica, saúde do trabalhador, epidemiologia descritiva, síndrome respiratória aguda grave, registros de mortalidade.
Abstract
Objective: to describe the incomplete filling out of the profession/occupation variable in the flu-like syndrome, severe acute respiratory syndrome and mortality databases in Brazil.
Methods: descriptive study with secondary data from flu-like syndrome (FLS), severe acute respiratory syndrome (SARS) and mortality databases (SIM). We calculeted the absolute and relative filling frequencies of the profession/occupation variable according to State, gender, regions, and federative units, for 2020 and 2021.
Results: we found a 94.7% incompleteness on the FLS database, 97.7% of missing profession/occupation data on the SARS, and 17.0% on the SIM database. Incompleteness frequency was above 91.0% in all Brazilian regions for FLS and SARS. Incompleteness on the mortality database was over 13.0%. All federative units presented incompleteness above 90.0% for FLS, 74.0% for SARS, and 6.8% for mortality in all genders. Higher levels of missing data were found in the states of Amapá for FLS (98.1%), Rio Grande do Sul for SARS and Alagoas (45.0%) for mortality (99.4%).
Conclusions: all databases showed a high incompleteness of the profession/occupation variable. We recommend an articulation between the Ministry of Health, Ministry of Labor and workers’ representations to solve this lack of data on occupation/profession in public databases.
Keywords: Epidemiologic surveillance, occupational health, descriptive epidemiology, severe acute respiratory syndrome, mortality registries.
Comunicação breve/Dossiê Epidemiologia, Saúde e Trabalho
Incompletude da variável profissão/ocupação nos bancos de síndrome gripal, síndrome respiratória aguda grave e mortalidade, Brasil, 2020-2021
Incompleteness of the profession/occupation variable in the flu-like syndrome, severe acute respiratory syndrome and mortality databases, Brazil, 2020-2021
Recepção: 12 Julho 2022
Revised document received: 02 Outubro 2023
Aprovação: 12 Outubro 2023
A ocorrência de dados faltantes é um grande desafio para os estudos epidemiológicos e para a vigilância em saúde1. A falta de informações pode causar vieses nos estudos2, bem como pode prejudicar a interpretação dos dados e a formulação de estratégias de prevenção de agravos, inclusive aqueles de natureza ocupacional3.
Durante emergências em saúde pública, como a pandemia de covid-19, a se torna ainda mais primordial para o enfrentamento da doença. Em 2015 e 2016, por exemplo, o adequado preenchimento de variáveis sobre malformações congênitas no Sistema de Informações sobre Nascidos Vivos (Sinasc) contribuiu para evidenciar a associação temporal entre o aumento de nascimentos de crianças com microcefalia e/ou alterações no sistema nervoso central e a epidemia pelo vírus Zika4. Ou seja, o acesso a dados abertos de boa qualidade em tempo real, durante a ocorrência de surtos, permite que pesquisadores e tomadores de decisão possam utilizar as evidências científicas para subsidiar o controle de doenças e agravos à saúde5.
O registro consistente de informações epidemiológicas é essencial para o entendimento dos fatores de risco de uma doença, sua dispersão geográfica e transmissibilidade. Adicionalmente, a integridade do conteúdo de sistemas de informação é imprescindível para a modelagem de dados que podem auxiliar no planejamento de respostas de contenção e controle de doenças, a fim de reduzir sua carga5.
Durante a pandemia de covid-19, por sua vez, informações sobre o perfil sociodemográfico e socioeconômico das populações mais atingidas foram fundamentais para a gestão da vigilância em saúde, sobretudo em um cenário de recrudescimento das desigualdades socioeconômicas. Nesse momento, as atividades laborais mobilizaram intenso fluxo de pessoas - a despeito das recomendações de distanciamento físico - e cada indivíduo infectado tornou-se um potencial agente transmissor do vírus SARS-CoV-2, seja nos transportes públicos, no ambiente de trabalho ou até mesmo no próprio domicílio6),(7.
Nesse contexto, as notificações de síndrome respiratória aguda grave (SRAG), que incluem internações e óbitos, foram amplamente utilizadas pela vigilância e por estudos como uma medida proxy para os casos de covid-19, pois correspondiam a cerca de 98% dos casos notificados de SRAG8)-(14.
Portanto, não saber a profissão ou ocupação dos indivíduos - nos casos leves e graves da doença e nos óbitos - se torna um problema para atuação e intervenção do setor da saúde, principalmente no que diz respeito à saúde do trabalhador, dado o impacto da covid-19 enquanto doença relacionada ao trabalho7),(15.
Estrutural e historicamente, o campo da Epidemiologia aplicado aos serviços de saúde sofre com baixa qualidade de informações disponíveis acerca de sua força de trabalho em sistemas de informação nacionais16.
Este estudo teve por objetivo descrever a incompletude da variável profissão ou ocupação nas bases de dados de síndrome gripal (SG), SRAG e de mortalidade por todas as causas do Sistema de Informação de Mortalidade (SIM), durante os anos de 2020 e 2021, no Brasil.
Trata-se de um estudo descritivo, que quantifica a incompletude da variável profissão/ocupação, nos registros de notificação de SG, de SRAG e de mortalidade por todas as causas do SIM.
Foram considerados todos os registros de casos em pessoas com 18 anos de idade ou mais, no período de 2020 a 2021.
Foram utilizados dados secundários provenientes dos sistemas de informação em saúde gerenciados pela Secretaria de Vigilância em Saúde, do Ministério da Saúde do Brasil. Os dados de notificação de SG foram coletados do eSUS VE Notifica17),(18. As notificações de SRAG foram provenientes do Sistema de Informação da Vigilância Epidemiológica da Gripe (Sivep-Gripe) (18),(19. Os registros de óbitos por todas as causas foram obtidos no SIM19),(20. Todos os bancos de dados contêm informações anonimizadas no nível do indivíduo, sem permitir acesso a dados sensíveis e/ou rastreáveis. Informações mais detalhadas sobre os bancos de dados, como extensão e dicionário de dados, podem ser vistas nas referências citadas17)-(20.
A variável de interesse para o estudo é a profissão/ocupação. Ela deve ser preenchida com um código referente à Classificação Brasileira de Ocupações (CBO) (21. Considerou-se incompletude no registro a ausência do código CBO no respectivo campo. As demais variáveis de interesse foram sexo, UF e macrorregião.
Foram calculadas as frequências absolutas e relativas de incompletude variável profissão/ocupação, segundo sexo, UF e macrorregião. Os percentuais de incompletude foram obtidos segundo a fórmula:
<mml:math><mml:mfenced><mml:mrow><mml:mn>1</mml:mn><mml:mo>-</mml:mo><mml:mfenced><mml:mfrac><mml:mrow><mml:mi>casos</mml:mi><mml:mo> </mml:mo><mml:mi>ou</mml:mi><mml:mo> </mml:mo><mml:mi>óbitos</mml:mi><mml:mo> </mml:mo><mml:mi>com</mml:mi><mml:mo> </mml:mo><mml:mi>CBO</mml:mi></mml:mrow><mml:mrow><mml:mi>total</mml:mi><mml:mo> </mml:mo><mml:mi>de</mml:mi><mml:mo> </mml:mo><mml:mi>casos</mml:mi><mml:mo> </mml:mo><mml:mi mathvariant="normal">e</mml:mi><mml:mo> </mml:mo><mml:mi>óbitos</mml:mi><mml:mo> </mml:mo><mml:mi>notificados</mml:mi><mml:mo>/</mml:mo><mml:mi>declarados</mml:mi></mml:mrow></mml:mfrac></mml:mfenced></mml:mrow></mml:mfenced><mml:mo>×</mml:mo><mml:mn>100</mml:mn><mml:mo>.</mml:mo></mml:math>
Todas as análises foram realizadas no software R, versão 4.1.222, e o código utilizado está disponível online no repositório “Missing_data_br” da plataforma Github.(23
Este estudo foi realizado exclusivamente com dados secundários de acesso aberto e domínio público. Não houve apreciação por Comitê de Ética em Pesquisa.
As tabelas a seguir mostram as porcentagens de incompletude da variável profissão/ocupação nas três bases de dados em foco, estratificadas por sexo, segundo UF, macrorregiões e total, na população com 18 anos ou mais.
A Tabela 1 exibe os resultados das notificações de síndrome gripal. Verificou-se que todas as UFs apresentaram incompletude da profissão/ocupação acima de 90,0% na população com 18 anos ou mais, em ambos os sexos. Ao se considerar o sexo feminino, no Amapá, foi observada a maior porcentagem de incompletude da variável profissão/ocupação (97,8% de dados faltantes). Já no sexo masculino, o maior percentual de incompletude foi encontrado em Santa Catarina (98,9%). A UF com o menor percentual de incompletude foi Espírito Santo (91,0% de dados faltantes); e a UF com o maior foi Amapá (98,1% de ausência). Quanto às macrorregiões, a Centro-Oeste obteve os percentuais mais elevados de incompletude da variável profissão/ocupação para o sexo feminino (93,8%); e a região Sul, para o sexo masculino (97,8%).

Na Tabela 2 estão presentes os resultados para as notificações de síndrome respiratória aguda grave. O Rio Grande do Sul apresentou os maiores percentuais de incompletude para ambos os sexos, com 99,5% para o sexo feminino e 99,3% para o sexo masculino. A UF com menor percentual de incompletude foi Amapá para o sexo feminino (82,4%) e Roraima (74,2%) para o sexo masculino. Considerando o total de notificações, a UF com menor percentual de incompletude da variável profissão/ocupação no banco SRAG foi Roraima (78,5%); e com o maior, o Rio Grande do Sul (99,4%). A região Sul foi a macrorregião com o maior percentual de incompletude na base de SRAG, em ambos os sexos (98,8% para o sexo feminino e 98,2% para o sexo masculino).

Por fim, a Tabela 3 mostra os resultados do percentual de incompletude no SIM. Os resultados por sexo não se diferiram significativamente dos resultados agregados. O Paraná apresentou menor incompletude para ambos os sexos, com 6,8% para o sexo feminino e 7,8% para o sexo masculino. A UF com maior percentual de incompletude para o sexo feminino foi Alagoas (46,9%); e para o sexo masculino (46,3%), a Paraíba. Entre as UF, o menor percentual de incompletude foi no Paraná (7,3%); e o maior, em Alagoas (45,0%). A região Nordeste apresentou os maiores percentuais de incompletude tanto no sexo feminino (19,4%) quanto no masculino (22,7%).

Neste estudo, foram observados grandes percentuais de incompletude da variável profissão/ocupação em todas as bases de dados analisadas, destacando-se aqueles dos bancos de SG e SRAG. A elevada incompletude foi observada principalmente nos registros de casos, em indivíduos de ambos os sexos e de forma generalizada nas UF e nas grandes regiões brasileiras.
Apesar da existência de diversos métodos para lidar com informações faltantes em bancos de dados (e.g., regressão linear, multiple imputation, bootstrap e bayesian bootstrap), os elevados percentuais de incompletude em todos os estratos impossibilitam a investigação de quaisquer relações entre a ocupação e o risco à saúde24)-(28.
Dados precisos e confiáveis sobre a saúde do trabalhador e possíveis doenças ocupacionais são considerados o ponto de partida essencial para o desenvolvimento de programas de prevenção29. Esses dados nos informam sobre quem ficou doente e como, quando e onde o agravo ocorreu. Portanto, eles têm o potencial de identificar alvos para medidas preventivas e de controle. Adicionalmente, tais informações exibem potencial considerável como ferramentas na avaliação do progresso no cumprimento das metas de prevenção.
Comparando-se as bases de dados estudadas, o SIM, por se basear no registro de óbito e ser a principal fonte de dados sobre mortalidade no Brasil, apresenta menores percentuais de incompletude na variável ocupação. O SIM é o sistema de informação mais antigo do Brasil, havendo maior conhecimento dos profissionais sobre a necessidade de seu adequado preenchimento, além de existir campos específicos para informar caso o óbito seja resultado de uma atividade laboral (ex: acidente de trabalho). Ainda, os óbitos são considerados desfechos duros, ou definitivos (do inglês hard endpoint), ou seja, são eventos bem definidos. Dessa forma, naturalmente, espera-se maior ocorrência de preenchimento dos dados individuais na declaração de óbito30.
Especificamente no cenário da pandemia de covid-19, o Brasil apresentou uma das menores taxas de testagem do mundo31)-(33. Alguns trabalhos utilizaram dados de taxa de mortalidade geral como forma de quantificar a carga da doença em nível nacional, com uso de dados de séries históricas de mortalidade e cálculo do excesso de mortalidade, porém tais métodos se tornam impraticáveis ao se desagregar por categorias profissionais34),(35.
Como previamente exposto, para a quantidade de óbitos é possível obter dados precisos sobre o número de casos, ou seja, o numerador da taxa de mortalidade. No entanto, a interpretação desses dados costuma ser difícil na ausência de dados confiáveis sobre o número de trabalhadores sob risco, quantitativo essencial para compor seu denominador. Normalmente, utilizam-se dados de censo ou pesquisas sobre a força de trabalho para fornecer estimativas do número de trabalhadores em grupos ocupacionais, industriais e sociodemográficos. Contudo, deve-se atentar que os dados advindos do censo, por exemplo, são frequentemente desatualizados e inadequados para alguns grupos ocupacionais, como trabalhadores sazonais, trabalhadores informais ou temporários, assim como imigrantes. De tal forma, os indicadores calculados podem não ser confiáveis36)-(38.
Em algumas situações, dados de várias fontes podem ser combinados para desenvolver denominadores mais apropriados para uma análise particular39. No entanto, deve-se reconhecer que, embora seja possível obter dados precisos para alguns resultados, as limitações nos dados do denominador disponíveis podem introduzir viés e erros aleatórios no cálculo das taxas.
Embora as fontes de dados utilizadas forneçam informações valiosas, compreendem apenas um subconjunto de casos. O relacionamento entre base de dados (em inglês, linkage) fornece um meio de combinar dados de duas ou mais fontes e, assim, permitir o aproveitamento de mais informações. Ao vincular os registros de um mesmo indivíduo em diferentes bases de dados, as informações dessa pessoa podem ser reunidas em um único arquivo. Isso permitiria que as pessoas representadas em vários conjuntos de dados fossem identificadas, assim como forneceria informações mais abrangentes sobre esses casos. Essa melhoria já foi observada para doenças como a tuberculose39. Tal abordagem fornece um mecanismo para que os dados disponíveis sejam mais eficientes. Na prática, no entanto, as oportunidades de vincular bases de dados são severamente limitadas pela falta de um identificador pessoal exclusivo nos arquivos de dados, além de fragilidades em relação à privacidade dos usuários.
A qualidade desses e de outros sistemas de informação nacionais também poderia ser aprimorada, a partir da contínua avaliação. Analogamente, é necessário agir para a capacitação e conscientização dos profissionais de saúde a respeito da importância do adequado preenchimento das informações das fichas de notificação, a fim de melhorar o cuidado aos indivíduos, bem como aprimorar as ações de vigilância em saúde e ambiente.
Em todas as bases de dados analisadas, verificou-se elevado percentual de incompletude da variável profissão/ocupação no Brasil, em 2020 e 2021. Os achados corroboram o processo de invisibilização dos trabalhadores mais impactados ao longo do período de estudo, durante a pandemia de covid-19. No contexto pandêmico, quando foram recomendadas medidas de distanciamento social com restrições de atividades produtivas, a ausência de informações sobre a saúde dos trabalhadores e o impacto da doença em grupos específicos, como profissionais de saúde e da educação, dificultaram as orientações de políticas públicas, tanto para restrição quanto para retorno das atividades.
A falta de preenchimento de variáveis nas declarações/fichas de notificação afeta a qualidade da informação necessária para subsidiar a tomada de decisão em todos os níveis de gestão do sistema de saúde. A melhoria na qualidade das bases de dados quanto à completude pode impactar positivamente a saúde pública e as políticas públicas.
Por fim, ressaltamos que é essencial a união de esforços por parte dos diversos atores envolvidos - incluindo Ministério do Trabalho e Previdência, Ministério da Saúde, Ministério da Educação e grupos de trabalhadores, como sindicatos - para articular, em conjunto, a formulação de soluções para o problema da falta de dados no campo da saúde do trabalhador.
Contato: Cleber Vinicius Brito dos Santos E-mail: santos.cleber@posgraduacao.uerj.br


