Skip to content

Latest commit

 

History

History
134 lines (86 loc) · 6.88 KB

trabalho-final.md

File metadata and controls

134 lines (86 loc) · 6.88 KB

Trabalho Final da disciplina Fundamentos e Ética do Jornalismo de Dados, do Master em Jornalismo de Dados, Automação e Data Storytelling, do Insper

Integrantes do grupo: Gabriela Bertolo, Melissa Duarte, Michelly Neris, Nicole Lacerda e Paulo Fehlauer

Professores: Luiz Fernando Toledo e Natália Mazotte

O objetivo do projeto final é demonstrar conhecimentos aplicados de entrevista a bases de dados utilizando planilha eletrônica e/ou SQL.

1.Escolha ao menos uma base de dados pública para trabalhar. Justifique em um parágrafo sua escolha, incluindo também informações básicas sobre a base (fonte, metodologia de coleta, data de atualização e limitações mais evidentes).

a) Escolhemos a base de dados do SINASC - Sistema de Informações sobre Nascidos Vivos, na versão tratada pela Plataforma de Ciência de Dados aplicada à Saúde (PCDaS), da Fiocruz.

b) A escolha se deu pelo interesse do grupo no tema da natalidade e pelo fato de se tratar de uma base já tratada, padronizada e enriquecida pela equipe da Fiocruz.

c) Os dados originais provêm do DATASUS e são obtidos a partir da coleta da “Declaração de Nascidos Vivos” (DN), documento padrão e de preenchimento obrigatório em todo o território nacional.

d) O tratamento feito pelo PCDaS resulta em um dataset anual com todos os registros das declarações de nascidos vivos contidas no SINASC. Os dados disponíveis hoje no sistema compreendem os anos de 1996 a 2021 e as bases são entregues em formato .csv separadas por estado e ano.

e) Por conta do tamanho das bases de dados, optamos por restringir a análise ao estado de São Paulo, entre 2019 e 2021.

2.Crie um roteiro de entrevista para aplicar a essa base de dados.

  • Como se distribuem os partos natural e cesáreo ao longo da semana?

  • Há alguma correlação entre a proporção de cesáreas e os finais de semana?

  • E entre a proporção de cesáreas e vésperas de feriados?

  • Como a pandemia de Covid-19 afetou esse cenário?

3.Documente no github as funções e cálculos aplicados para obter as respostas.

a) Baixamos as bases de dados do SINASC em formato .csv disponíveis em https://pcdas.icict.fiocruz.br/conjunto-de-dados/sistema-de-informacao-sobre-nascidos-vivos/

b) Criamos um banco de dados SQLite no DB Browser importando as 3 tabelas selecionadas: ETLSINASC.DNRES_SP_2019_t.csv ETLSINASC.DNRES_SP_2020_t.csv ETLSINASC.DNRES_SP_2021_t.csv

c) Filtramos e agrupamos os dados por data de nascimento e tipo de parto, repetindo o processo para cada ano, utilizando o seguinte código:

EXECUTANDO TUDO EM 'estrutura da tabela'

Na linha 1:
SELECT * 
	FROM SP2021
	LIMIT 10
Resulto: 10 linhas retornadas em 79 ms
EXECUTANDO TUDO EM 'total nascidos'

Na linha 1:
SELECT DTNASC, COUNT(*) AS total_ocorrencias
FROM SP2021
GROUP BY DTNASC;
Resulto: 365 linhas retornadas em 2242 ms
EXECUTANDO TUDO EM 'SQL 3'

Na linha 1:
SELECT PARTO, DTNASC, COUNT(*) AS total_ocorrencias
FROM SP2021
GROUP BY PARTO, DTNASC;
Resulto: 798 linhas retornadas em 3170 ms
EXECUTANDO TUDO EM 'SQL 4'

Na linha 1:
SELECT 
    DTNASC,
    SUM(CASE WHEN PARTO = 1 THEN 1 ELSE 0 END) AS Vaginal,
    SUM(CASE WHEN PARTO = 2 THEN 1 ELSE 0 END) AS Cesarea,
    SUM(CASE WHEN PARTO = 3 THEN 1 ELSE 0 END) AS Outros,
    COUNT(*) AS Total_Ocorrencias
FROM 
    SP2021
GROUP BY 
    DTNASC;
Resulto: 365 linhas retornadas em 2575 ms

d) Filtramos e agrupamos os dados por dia da semana e tipo de parto, repetindo o processo para cada ano, utilizando o seguinte código:

SELECT PARTO, dia_semana_nasc,
count(*) as resultado
from SP2019
GROUP by dia_semana_nasc, PARTO
ORDER by PARTO

e) Exportamos os dados obtidos para o formato .csv e importamos em uma planilha do Google Sheets, realizando as seguintes operações:

4.Indique um caminho inicial de pauta que poderia ser explorado a partir dos insights obtidos.

A nossa investigação começou a partir da conversa com especialistas que alegam que alguns obstetras, da saúde suplementar, principalmente, fazem 4 ou 5 cesáreas no mesmo dia, porque existe a possibilidade de agendamento. Logo, existem situações em que o profissional adianta o parto para se beneficiar. Há relatos em que as cesarianas se concentram antes de feriados, por exemplo.

Na análise que fizemos com dados de São Paulo, nós observamos uma correlação evidente entre a proporção de cesáreas em relação ao dia da semana. Ao longo dos anos, é consistente a queda na proporção de cesáreas nos sábados e domingos. Em 2021, por exemplo, apenas 2 domingos registraram número de cesáreas maior do que 50%, sendo que a média diária para o mesmo ano é de aproximadamente 57% de cesáreas. Não foi possível identificar correlação específica entre a proporção de cesáreas e vésperas de feriados. Um possível refinamento dessa pergunta poderia partir da diferenciação entre dados da rede pública e da rede privada.

Especialistas alegam que não é admitido fazer uma cesariana antes das 39 semanas de gestação - quando não tem recomendação médica. A ideia da nossa pauta é mostrar quais são os riscos de uma cesariana antes deste período para a saúde da mãe e do bebê. Vamos investigar o motivo da taxa tão elevada de cesarianas no Brasil, que pode inclusive estar relacionada aos casos de violência obstétrica.

Possíveis entrevistados:

  • Dr. Eduardo de Souza, médico da Unifesp e integrante da Associação de Obstetrícia e Ginecologia do Estado de São Paulo (Sogesp); Carmen Simone Grilo Diniz, professora da Faculdade de Saúde Pública da USP;

  • Advogada Ruth Rodrigues, Coletivo Nacional de Enfrentamento à Violência Obstétrica - Nascer Direito;

  • Personagens: mães que fizeram uma cesariana - sem indicação - antes da hora e tiveram algum tipo de complicação ou que sofreram violência obstétrica; mulheres que não se sentiram amparadas pelo médico;

  • Representante ou posicionamento do Ministério da Saúde;

  • Representante ou posicionamento da Agência Nacional de Saúde Suplementar (ANS).

CONTATO DA EQUIPE

Gabriela Bertolo ([email protected])

Melissa Duarte ([email protected])

Michelly Neris ([email protected])

Nicole Lacerda ([email protected])

Paulo Fehlauer ([email protected])