-
-
Notifications
You must be signed in to change notification settings - Fork 25
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Caso: "Buraco" de diários de Barreiras-BA #63
Comments
CONTEXT:Requesting a complete scraping of the Barreiras-BA website, it is expected to obtain all editions available on the website from the oldest possible to the day of today. In this case, it is expected to obtain journals from 01/02/2008 (edition 601) to 06/06/2023 (edition 3930). This is the file that lists all the journals obtained in this action: https://drive.google.com/file/d/1jl5EARsdFMNZvv3wHhrf1kDoNY52pk8n/view?usp=drive_link With the archive, it is possible to notice that there is a hole of missing diaries in the historical series: from edition 890 it jumps to 925, collecting only 3 diaries in the middle. When browsing the barreiras diaries page, in the year 2009, which is the time of diaries numbered 890 to 925, it is possible see several pages not found, but by the pattern of the links, it seems more plausible to just be an error on the site. SUGGESTED ACTION: Contact us to report an error on the site. If unsuccessful, an LAI request can be attempted.
|
Neste caso, como propõe a solução do problema, @trevineju ? Pedindo o fornecimento dos Diários ou a publicação deles no site? |
In this case, how do you propose the solution to the problem, @trevineju ? Asking for the Diaries to be provided or for them to be published on the website? |
@jedibruno acho que podemos assumir que sempre é publicar no site (vou até atualizar o leia-me com isso), porque o QD ter ou não, é apenas uma consequência de estar publicado no site. |
@jedibruno I think we can assume that it's always published on the site (I'll even update the readme with that), because whether QD has it or not, it's just a consequence of being published on the site. |
CONTEXTO:
Solicitando uma raspagem completa do site de Barreiras-BA, espera-se obter todas as edições disponíveis no site desde a mais antiga possível até o dia de hoje. No caso, é esperado obter diários de 02/01/2008 (edição 601) até 06/06/2023 (edição 3930).
Este é o arquivo que lista todos os diários obtidos nessa ação: https://drive.google.com/file/d/1jl5EARsdFMNZvv3wHhrf1kDoNY52pk8n/view?usp=drive_link
Com o arquivo, é possível perceber que há um buraco de diários faltantes na série histórica: da edição 890 pula para 925, coletando apenas 3 diários no meio.
Ao navegar na página de diários de Barreiras, no ano de 2009, que é a época dos diários de número 890 até 925, é possível constatar várias páginas não encontradas, mas, pelo padrão dos links, parece mais plausível ser apenas um erro no site.
AÇÃO SUGERIDA: Entrar em contato para sinalizar erro no site. Se não houver sucesso, um pedido de LAI pode ser tentado.
The text was updated successfully, but these errors were encountered: