Comparison of cluster methods agglomerative hierarchical in sustainability indicators in municipalities of Pará state

Authors

DOI:

https://doi.org/10.33448/rsd-v9i2.2067

Keywords:

Ward's method; Euclidean distance; Validation index; Dendrogram.

Abstract

This study aimed to compare the performance of hierarchical agglomerative clustering methods using a data set composed of several sustainability indicators referring to the municipalities of the state of Pará. As well as determining the number of initial groups to be formed by applying of validity indexes. For the selection of indicators, a check-list of national, regional and local scientific studies addressing the theme of sustainability was carried out. Subsequently, the indicators were standardized due to the units and scales of different measures, not interfering in the result and having similar weights in the calculation of the coefficient of similarity. The measure of dissimilarity used was the Euclidean distance, and to determine the hierarchical grouping method was used the agglomerative coefficient (AC). Validation indexes were used to establish the initial grouping number. The agglomerative method with the best performance regarding the (AL) was Ward with 0.94, indicating a better strength and quality among the agglomerative techniques. The Davies Bouldin (DB), Dunn (D) and Silhouette (SIL) validation indexes indicated that the ideal amount of initial clusters to be formed is 2, however the PBM index found that the ideal formation is with 4 groups. Regarding the municipalities with greater homogeneity, it was found that in the composition with 2 groups, the most similar observations were m105 (Salinópolis) and m109 (Santa Izabel do Pará), followed by the observations m102 (Rio Maria) and m144 (Xinguara), all inserted in group 1.

Author Biography

Lindemberg Lima Fernandes, Universidade Federal do Pará

Engenheiro civil, Doutor em Desenvolvimento Sustentável Trópico Úmido, Professor da Faculdade de Engenharia Sanitária e Ambiental e Pós-Graduação em Engenharia Civil da Universidade Federal do Pará

References

Abson, D. J., von Wehrden, H., Baumgärtner, S., Fischer, J., Hanspach, J., Härdtle, W., & Walmsley, D. (2014). Ecosystem services as a boundary object for sustainability. Ecological Economics, 103, 29-37.

Albuquerque, N. C., Portal, L. C., Nogueira, L. M. V., & Rodrigues, I. L. A. (2016). Busca ativa de hanseníase por meio de educação em saúde entre populações ribeirinhas. Rev Enferm UFPE, 10(7), 2634-40.

Bem, J. S. D., Giacomini, N. M. R., & Waismann, M. (2015). Utilização da técnica da análise de clusters ao emprego da indústria criativa entre 2000 e 2010: estudo da Região do Consinos, RS. Interações (Campo Grande), 16(1), 27-41

Bertussi, G. L. (2008). Análise do processo de convergência de renda na América Latina e no leste Asiático. 2008. 90 f. Dissertação (Mestrado do Centro de Desenvolvimento e Planejamento Regional) - Faculdade de Ciências Econômicas, Universidade Federal de Minas Gerais, 2008.

Brabo, M. F. (2014). Piscicultura no Estado do Pará: situação atual e perspectivas. Acta Fish. Aquat. Res., 2(1), 1-7.

Brabo, M. F.; Pereira; L. F. S.; Santana; J. V. M.; Campelo; D. A. V.; Veras; G. C. (2016). Cenário atual da produção de pescado no mundo, no Brasil e no estado do Pará: ênfase na aquicultura. Acta Fish, 4(2), 50-58.

Cardoso, A.S.; Toledo, P.M.; Vieira, I.C.G. (2016). Barômetro da sustentabilidade aplicado ao município de Moju, estado do Pará. Revista Brasileira de Gestão e Desenvolvimento Regional, 12(1), 234-263.

Carvalho, J. R. M., Curi, W. F., de Araújo Carvalho, E. K. M., & Curi, R. C. (2011). Proposta e validação de indicadores hidroambientais para bacias hidrográficas: estudo de caso na sub-bacia do alto curso do rio Paraíba, PB. Sociedade & Natureza, 23(2), 295-310.

Chaves, E. C., Costa, S. V., Flores, R. L. D. R., & Neves, E. O. S. D. (2017). Índice de carência social e hanseníase no Estado do Pará em 2013: análise espacial. Epidemiologia e Serviços de Saúde, 26, 807-816.

Clain, N. (1997). Les indicateurs de développement durable en agriculture, aspects écologiques et environnementaux. Paris: Université de Paris 7.

Comunello, É., de Araújo, L. B., Sentelhas, P. C., Araújo, M. F. C., dos Santos Dias, C. T., & Fietz, C. R. (2013). O uso da análise de cluster no estudo de características pluviométricas. Sigmae, 2(3), 29-37.

Cordeiro, I. M. C. C., Arbage, M. J. C., & Schwartz, G. (2017). Nordeste do Pará: configuração atual e aspectos identitários. Embrapa Amazônia Oriental-Capítulo em livro científico (ALICE), 19-58.

Crispim, D. L.; Fernandes, L. L.; Albuquerque, R. L. De O. (2019). Aplicação de técnica estatística multivariada em indicadores de sustentabilidade nos municípios do Marajó-PA. Revista Principia - Divulgação Científica e Tecnológica do IFPB, (46), 145-154.

Fávero, L. P. L., Belfiore, P. P., Silva, F. L. D., & Chan, B. L. (2009). Análise de dados: modelagem multivariada para tomada de decisões.

Frainer, D. M., Souza, C. C. D., Reis Neto, J. F., & Castelão, R. A. (2017). Uma aplicação do Índice de Desenvolvimento Sustentável aos municípios do estado de Mato Grosso do Sul. Interações (Campo Grande), 18(2), 145-156.

Gomes, S.C.; Andrade, L.C. (2011). Análise espacial do crescimento econômico dos municípios paraenses no período 2002- 2006.

Instituto Brasileiro de Geografia e Estatística. (2017). IBGE divulga o rendimento domiciliar per capita 2017. Rio de Janeiro: IBGE. Disponível em:https://agenciadenoticias.ibge.gov.br/agencia-sala-deimprensa/2013agencia denoticias/rele

ases/20154-ibge-divulga-o-rendimento-domiciliar-per-capita2017.html. Acesso em: 16 abr. 2018.

Instituto Brasileiro de Geografia e Estatística. (2010). Censo Demográfico. Rio de Janeiro: IBGE.

Instituto Brasileiro de Geografia e Estatística. (2018). Pará [Internet]. Disponível em: https://cidades.ibge.gov.br/brasil/pa/panorama. Acesso em: 15 abr. 2018.

Hair, J. F., Black, W. C., Babin, B. J., Anderson, R. E., & Tatham, R. L. (2009). Análise multivariada de dados. Bookman Editora.

Halkidi, M., Batistakis, Y., & Vazirgiannis, M. (2002). Cluster validity methods: part I. ACM Sigmod Record, 31(2), 40-45.

Hammond, A., & World Resources Institute. (1995). Environmental indicators: a systematic approach to measuring and reporting on environmental policy performance in the context of sustainable development (Vol. 36). Washington, DC: World Resources Institute.

Jeunon, E. E., & Santos, L. M. (2014). Indicadores de Desempenho na Gestão de Projetos Sociais Sustentáveis: Proposição de Modelo para os Centros Vocacionais Tecnológico. Revista Gestão & Tecnologia, 14(2), 225-248.

Juwana, I., Muttil, N., & Perera, B. J. C. (2012). Indicator-based water sustainability assessment—A review. Science of the Total Environment, 438, 357-371.

Lacerda, C. D. S., & Cândido, G. A. (2013). Modelos de indicadores de sustentabilidade para gestão de recursos hídricos. Gestão sustentável dos recursos naturais: uma abordagem participativa [online]. Campina Grande: EDUEPB, 13-30.

Loureiro, R. D., Saraiva, J. M., Saraiva, I., Senna, R. C., & Fredó, A. S. (2014). Estudo dos eventos extremos de precipitação ocorridos em 2009 no estado do Pará. Rev Bras Meteorol, 29, 83-94.

Macedo, L. O. B., Cândido, G. A., de Aguiar Costa, C. G., & da Silva, J. V. F. (2016). Avaliação da sustentabilidade dos municípios do estado de Mato Grosso mediante o emprego do IDSM–Índice de Desenvolvimento Sustentável Para Municípios. Revista Brasileira de Gestão e Desenvolvimento Regional, 12(3), 323-345.

Marzall, K., & Almeida, J. (2000). INDICADORES DE SUSTENTABILIDADE PARA AGROECOSSISTEMAS Estado da arte, limites e potencialidades de uma nova ferramenta para avaliar o desenvolvimento sustentável. Cadernos de Ciência & Tecnologia, 17(1), 41-59.

Menezes, F. P., Fernandes, L. L., & da Rocha, E. J. P. (2015). O uso da estatística para regionalização da precipitação no Estado do Pará, Brasil. Revista Brasileira de Climatologia, 16(11), 64-71.

Mingoti, S. A. (2005). Análise de dados através de métodos de estatística multivariada: uma abordagem aplicada. Editora UFMG.

Neves, M. R. D. S., & Vanzella, E. (2017). Tempo de máquinas paradas numa indústria têxtil: um estudo por meio de análise de agrupamento. Revista Mangaio Acadêmico, 2(1), 58-65.

Parchure, A. S., & Gedam, S. K. (2019). Homogeneous regionalization via L-moments for Mumbai City, India. Meteorology Hydrology and Water Management. Research and Operational Applications, 7(2), 73-83.

Programa das Nações Unidas para o Desenvolvimento. (2010). Ranking IDHM Municípios 2010. Disponível em:http://www.pnud.org.br/atlas/ranking/raking-IDHM-Municipios-2010.aspx. Acesso em: 21 out. 2019.

Rezende, G. B., G. B., Cândido, G. A., Rezende, H. L., & Silva, F. P. (2017). Sustentabilidade de Barra do Garças sob a ótica do índice de desenvolvimento sustentável para municípios. Desenvolvimento em Questão, 15(39), 203-235.

Rodrigues, A., Fachel, J. M. G., & Passuello, A. C. (2014). Estatística espacial e análise de cluster em dados de desastres naturais: mapeamento das inundações no Rio Grande do Sul entre 2003 e 2009. Revista de Iniciação Científica, 10(1), 48-67.

Rohan, U., Branco, R. R., & Soares, C. A. P. (2018). Potencialidades e Limitações dos Instrumentos de Mensuração da Sustentabilidade. Engenharia Sanitária e Ambiental, 23(5), 857-869.

Roth, K. L., Casas, A., Huesca, M., Ustin, S. L., Alsina, M. M., Mathews, S. A., & Whiting, M. L. (2016). Leaf spectral clusters as potential optical leaf functional types within California ecosystems. Remote Sensing of Environment, 184, 229-246.

Seidel, E. J., Júnior, F. D. J. M., Ansuj, A. P., & Noal, M. R. C. N. C. (2008). Comparação entre o método Ward e o método K-médias no agrupamento de produtores de leite. Ciência e Natura, 30(1), 07-15.

Sharma, M., Kumari, P., & Rizvi, M. A. (2018, November). An Analysis to Find the Efficient Clustering Algorithm for Identification of User Access Pattern. In 2018 8th International Conference on Communication Systems and Network Technologies (CSNT) (pp. 72-77). IEEE.

Silva, M. D. N. A. D., Pessoa, F. C. L., Silveira, R. N. P. D. O., Rocha, G. S., & Mesquita, D. A. (2018). Determination of the Homogeneity and Tendency of Precipitations in the Tapajós River Basin. Revista Brasileira de Meteorologia, 33(4), 665-675.

Sousa, L.C.R.; Santos; R.B.N.; Sousa, D.S.P. (2016). Desenvolvimento e pobreza multidimensional na Amazônia Legal. Revista Espacios, 37(21).

Starczewski, A. (2017). A new validity index for crisp clusters. Pattern Analysis and Applications, 20(3), 687-700.

Vieira, I. C. G. (2019). Abordagens e desafios no uso de indicadores de sustentabilidade no contexto amazônico. Ciência e Cultura, 71(1), 46-50.

Published

01/01/2020

How to Cite

CRISPIM, D. L.; FERNANDES, L. L.; FILHO, D. F. F.; LIRA, B. R. P. Comparison of cluster methods agglomerative hierarchical in sustainability indicators in municipalities of Pará state. Research, Society and Development, [S. l.], v. 9, n. 2, p. e60922067, 2020. DOI: 10.33448/rsd-v9i2.2067. Disponível em: https://rsdjournal.org/index.php/rsd/article/view/2067. Acesso em: 4 nov. 2024.

Issue

Section

Exact and Earth Sciences