Resumo
Acompanhar os preços da cesta básica alimentária é fundamental para garantir a segurança alimentar e a estabilidade econômica de um país. Para esse fim, neste trabalho, foi desenvolvido um conjunto de scripts em Python com os quais foram coletados dados de preços de cinco sites de supermercados. Para isso, utilizou-se o automatizador de navegadores Selenium, que, juntamente com bibliotecas como Pandas e Numpy, permitiu consolidar as informações relativas ao nome dos produtos, suas descrições, seus preços e as datas de captura de informações para um período de 100 dias. Por fim, foram criados uma série de painéis de controle no Power BI com o objetivo de conhecer a experiência de um grupo de usuários com as informações apresentadas. Os resultados do teste de conceito com usuários permitiram identificar aspectos relacionados à apresentação, busca, compreensão, inferência e tomada de decisões a partir das visualizações apresentadas. Em relação a este último aspecto, os usuários apontaram que a ausência de informações relacionadas ao preço por grama ou por mililitro dos produtos não lhes permite fazer comparações que os conduzam a diferenciar claramente os preços desses produtos. Este é um ponto que será abordado em um próximo trabalho.
Referências
ACIS (2022). Análisis sobre los efectos del aumento de precios en la canasta básica. Informe técnico, Bogotá, Colombia.
DANE-Índice de Precios al Consumidor (IPC). (2024). https://www.dane.gov.co/index.php/estadisticas-por-tema/precios-y-costos/indice-de-precios-al-consumidor-ipc/ da Silva F., Almeida R., & Santos G. (2023). Web scraping techniques for consumer price index calculation. Statistical Research Journal, 45(3), 150–165.
Departamento Nacional de Planeación (2022). Informe anual sobre los efectos de la inflación en los hogares colombianos. Bogotá, Colombia.
Faramarzi, A., Hadizadeh, R., Fayyaz, S., Sajadimanesh, S. & Moradi, A. (2022). Web Scraping Technique for Producing Iranian Consumer Price Index. Statistical Journal of the IAOS, 38(1), 263–276.
Federico, L., Franco P., Minelli, A., Perri, A., Caroprese, L., Picarelli, R., Tradigo, G., Vocaturo, E., Dattola, F., Fortunato, A., Lambardi, P., Laurita, S., Pellegrino, I., Garro, A., Pugliese, A., Tagarelli, A., Veltri, P. & Zumpano E. (2016). SINSE+: a software for the acquisition and analysis of open data in health and social area. In Bochicchio, M. A. & Mecca, G. (2016) (eds.), SEBD (pp. 310-317), Matematicamente.it. ISBN: 9788896354889.
Financial Managers’ Forum (2005). Financial Analysis Planning & Reporting, 5(5), 15.
Khder, M.A. (2021). Web Scraping or Web Crawling: State of Art Techniques, Approaches, and Application. International Journal of Advances in Soft Computing and its Applications.
Kotler, P. & Armstrong, G. (2012). Principios de Marketing. 14ª edición. Pearson Educación. Madrid, España.
Krummert, B. (2016). Millennials ramp up restaurant spending. Restaurant Hospitality Exclusive Insight, 3.
Lima R., & Cruz E.F. (2019). Extraction and Multidimensional Analysis of Data from Unstructured Data Sources: A Case Study. International Conference on Enterprise Information Systems.
Loy, J.-P. & Ren, Y. (2022). Web scraping of food retail prices. In: Gandorfer, M., Hoffmann, C., El Benni, N., Cockburn, M., Anken, T. & Floto, H. (Hrsg.), 42. GIL-Jahrestagung Künstliche Intelligenz in der Agrar- und Ernährungswirtschaft, Bonn: Gesellschaft für Informatik e.V. (pp. 177-182).
Martínez, F. (2022). Impacto del aumento de los precios de los combustibles en la canasta básica alimentaria. Reporte económico, Universidad Nacional.
Singrodia, V., Mitra, A. & Paul, S. (2019). A Review on Web Scrapping and its Applications. 2019 International Conference on Computer Communication and Informatics (ICCCI) (pp. 1-6). Coimbatore, India. doi: 10.1109/ICCCI.2019.8821809.
Taylor N. G. A., Luongo G., Jago E., & Mah C. L. (2023). Observational study of population level disparities in food costs in 2021 in Canada: A digital national nutritious food basket (dNNFB). Preventive Medicine Reports, 32, 102162. https://doi.org/10.1016/j.pmedr.2023.102162.

Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.