Text mining applied to the analysis of environmental impact studies of small hydroelectric plants in the State of Mato Grosso

Authors

DOI:

https://doi.org/10.20435/multi.v30i74.4727

Keywords:

Natural Language Processing (NLP), preprocessing, word frequency

Abstract

With the advancement of environmental regulations and techniques to control environmental impacts, the amount of data generated has significantly increased, but much of this data is underutilized. Text mining, which extracts valuable information from unstructured textual data, emerges as an essential tool for analyzing environmental impact reports and identifying patterns that can improve public policies and management strategies. This study focused on the textual analysis of Environmental Impact Studies (EIA) for Small Hydroelectric Plants (PCHs) in Mato Grosso, using techniques such as text mining, word clouds, and graphs to identify recurring themes and interrelationships in the texts. The research also highlighted the importance of text preprocessing to ensure accurate analysis and the need for a revision of regulations and improvements in the organization of documents available on the SEMA-MT website to facilitate access and public consultation.

Author Biographies

Lucas Michelotti Baldini, Universidade Federal de Mato Grosso (UFMT)

Mestre em recursos hídricos pela Universidade Federal de Mato Grosso (UFMT) e coordenador geral da Faculdade Católica de Cuiabá.

Anderson Castro Soares de Oliveira, Universidade Federal de Mato Grosso (UFMT)

Doutor em Estatística e Experimentação Agropecuária pela Universidade Federal de Lavras e professor do departamento de estatística da Universidade Federal de Mato Grosso (UFMT).

Ibraim Fantin da Cruz, Universidade Federal de Mato Grosso (UFMT)

Doutor em Recursos Hídricos e Saneamento Ambiental pelo Instituto de Pesquisas Hidráulicas da Universidade Federal do Rio Grande do Sul (UFRGS) e professor do departamento de engenharia sanitária e ambiental da Universidade Federal de Mato Grosso (UFMT).

Lia Hanna Martins Morita, Universidade Federal de Mato Grosso (UFMT)

Doutora em Estatística pela Universidade Federal de São Carlos (UFSCar) e professora do departamento de estatística da Universidade Federal de Mato Grosso (UFMT).

References

AYKURT, A. Y.; SESEN, E. Social media in social organization. European Scientific Journal, [S. l.], v. 13, n. 20, p. 1, 2017. DOI: 10.19044/esj.2017.v13n20p1.

BENOIT, K.; MUHR, D.; WATANABE, K. Multilingual stopword lists. CRAN, [S. l.], 2021.

BOVEN ENERGIA. EIA do Complexo Hidrelétrico Rancho Grande Volume III. São Paulo: BOVEN Energia, 2020.

BRASIL. Ministério do Meio Ambiente [MMA]. Conselho Nacional do Meio Ambiente [CONAMA]. Resolução CONAMA n. 237, de 19 de dezembro de 1997 Publicada no DOU no 247, de 22 de dezembro de 1997, Seção 1, páginas 30841-30843. Brasília, DF: MMA; CONAMA, 1997.

BRASIL. Decreto no 99.274, de 6 de junho de 1990. Regulamenta a Lei nº 6.902, de 27 de abril de 1981, e a Lei nº 6.938, de 31 de agosto de 1981, que dispõem, respectivamente sobre a criação de Estações Ecológicas e Áreas de Proteção Ambiental e sobre a Política Nacional do Meio Ambiente, e dá outras providências. Brasília, DF: Presidência da República; Casa Civil; Subchefia para Assuntos Jurídicos, 1990.

BRASIL. Ministério do Meio Ambiente [MMA]. Conselho Nacional do Meio Ambiente [CONAMA]. Resolução CONAMA n. 001, de 23 de janeiro de 1986. Dispõe sobre critérios básicos e diretrizes gerais para a avaliação de impacto ambiental. Brasília, DF: MMA; CONAMA, 1986.

BULEGON, H.; MORO, C. M. C. Mineração de texto e o processamento de linguagem natural em sumários de alta hospitalar. Journal of Health Informatics, [S. l.], v. 2, n. 2, 2010.

CHOWDHURY, G. G. Natural language processing. Annual Review of Information Science and Technology, [S. l.], v. 37, n. 1, p. 51-89, 31 jan. 2005.

CTE. Estudo de Impacto Ambiental da PCH Galera Volume III. Goiânia: Centro Tecnológico De Engenharia ltda, 2013.

CTE. Estudo de Impacto Ambiental da PCH Itiquira III Volume III. Goiânia: Centro Tecnológico De Engenharia ltda, 2012.

DUTT-ROSS, S.; CRUZ, B. P. A. Análise Quantitativa de Textos: apresentação e operacionalização da técnica via Twitter. Administração: Ensino e Pesquisa, Rio de Janeiro, v. 22, n. 1, jan./abr. 2021. DOI: https://doi.org/10.13058/raep.2021.v22n1.1859.

ENERGIA CONSULT. Estudo de Impacto Ambiental de Pequenas Centrais Hidrelétricas PCH Mogno. São Paulo: Energia Consult Engenharia, Consultoria e Gerenciamento de Projetos Ltda, 2012.

ESRI. ArcGIS 10.8: geographic information system software. Redlands: Environmental Systems Research Institute, 2020.

FEINERER I.; HORNIK K.; MEYER, D. Text Mining Infrastructure in R. Journal of Statistical Software, [S. l.], v. 25, n. 5, mar. 2008. Disponível em: CRAN: Package tm (r-project.org). Acesso em: 26 mar. 2024

FELDMAN, R.; SANGER, J. The Text Mining Handbook: advanced approaches in analyzing unstructured data. Cambridge: University Press, 2007.

JESUS, E. N.; FEITOSA, F. R. S.; SOBRAL, I. S.; SILVA, H. P. Educação ambiental e o licenciamento: um olhar sobre os relatórios de impactos ambientais do estado de Sergipe. Revista de Ciências Ambientais, Canoas, v. 12, n. 1, 2018. DOI: https://doi.org/10.18316/rca.v12i1.3449

MLT. Estudo de Impacto Ambiental de Pequenas Centrais Hidrelétricas PCH Barra da Onça e Alto Garças. Belo Horizonte: MLT Engenharia de Projetos Ambientais, 2016.

MOHAMMAD, S. M.; TURNEY, P. D. Crowdsourcing a word-emotion association lexicon. Computational Intelligence, [S. l.], v. 29, n. 3, p. 436-65, 2013.

MRS. Estudo de Impacto Ambiental de Pequenas Centrais Hidrelétricas PCH Otacílio Lucion. Brasília: MRS Ambiental, 2021.

MRS. Estudo de Impacto Ambiental de Pequenas Centrais Hidrelétricas PCH’s Cumbuco e Geóloga Lucimar Gomes. Brasília: MRS Ambiental, 2020a.

MRS. Estudo de Impacto Ambiental de Pequenas Centrais Hidrelétricas PCH Entre Rios. Brasília: MRS Ambiental, 2020b.

MRS. Estudo de Impacto Ambiental de Pequenas Centrais Hidrelétricas PCH Vila União. Brasília: MRS Ambiental, 2020c.

NAVEGA, S. Princípios essenciais do data mining. Intelliwise Research and Training, São Paulo, ago. 2002.

PROAMB. Estudo de Impacto Ambiental de Pequenas Centrais Hidrelétricas PCH Estivadinho III. Bento Gonçalves: PROAMB, 2017

PROAMB. Estudo de Impacto Ambiental de Pequenas Centrais Hidrelétricas PCH Sacre 14. Bento Gonçalves: PROAMB Projetos e Consultoria Ambiental ltda, 2016. 385 p. Disponível em: http://sema.mt.gov.br/eia-rima. Acesso em: 12 jul.

PROAMB. Estudo de Impacto Ambiental de Pequenas Centrais Hidrelétricas PCH Juina 117. Bento Gonçalves: PROAMB, 2013.

PROGEPLAN. Estudo de Impacto Ambiental (EIA) Volume III - Análise e Avaliação dos Impactos Ambientais; Medidas Mitigadoras Preventivas e Compensatórias; Programas Ambientais; Alternativas Locacionais; Prognóstico Ambiental e Análise de Risco. Brasília: PROGEPLAN, 2021.

R CORE TEAM. R: a language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, 2023.

SÁNCHEZ, L. E. Avaliação de impacto ambiental: conceitos e métodos. 2. ed. São Paulo: Oficina de Textos, 2013. 87p.

SEIVA. Estudo de Impacto Ambiental das pequenas centrais hidrelétricas formoso I, II e III, Volume VI, Capitulo VII, Cuiabá-MT: Seiva, 2011. 90 p.

SRIVASTAVA, A. N.; SAHAMI, M. (Ed.). Text Mining: classification, clustering, and applications. Boca Raton: Chapman & Hall/CRC, 2009.

SUHAIDI, M.; KADIR, R. A.; TIUN, S. The impact of preprocessing techniques towards word embedding. In: BADIOZE ZAMAN, H. et al. (Ed.). Advances in Visual Informatics: IVIC 2023. Singapore: Springer, 2023. DOI: https://doi.org/10.1007/978-981-99-7339-2_35

TURBAN, E.; WETHERBE, J. C.; MCLEAN, E.; LEIDNER, D. E. Tecnologia da informação para gestão: transformando os negócios na economia digital. 6. ed. Porto Alegre: Bookman, 2010. 680 p.

UR-RAHMAN, N. Textual data mining for knowledge discovery and data classification: a comparative study. European Scientific Journal, [s. l.], v. 13, n. 21, p. 429-53, 2017. DOI: http://dx.doi.org/10.19044/esj.2017.v13n21p429.

UYSAL, A. K.; GUNAL, S. The impact of preprocessing on text classification. Information Processing & Management, [S. l.], v. 50, n. 1, p. 104-112, 2014. ISSN 0306-4573. DOI: https://doi.org/10.1016/j.ipm.2013.08.006.

WIJFFELS, J. UDPipe Natural Language Processing - Basic Analytical Use Cases. CRAN, [S. l.], 2023.

ŽIŽKA, J.; DAŘENA, F.; SVOBODA, A. Text mining with machine learning: principles and techniques. Boca Raton: CRC Press, 2019.

Published

2025-03-07

How to Cite

Michelotti Baldini, L., Castro Soares de Oliveira, A., Fantin da Cruz, I., & Hanna Martins Morita, L. (2025). Text mining applied to the analysis of environmental impact studies of small hydroelectric plants in the State of Mato Grosso. Multitemas, 30(74), 25–54. https://doi.org/10.20435/multi.v30i74.4727