Este trabalho teve como objetivo investigar a utilização de um algoritmo de agrupamento K-Means paralelo, com base no modelo de programação MapReduce, para melhorar o tempo de resposta da mineração de dados. O desempenho do algoritmo foi avaliado quanto ao SpeedUp e ScaleUp. Para isso foram executados experimentos em um cluster Hadoop formado por seis computadores de hardware comum. Os dados agrupados são medições de torres de fluxo de regiões agrícolas e pertencem a Ameriflux. Os experimentos foram executados usando 3, 4 e 6 máquinas, respectivamente. Os resultados mostraram que com o aumento do número de máquinas houve ganho no desempenho, sendo que o melhor tempo obtido foi usando seis máquinas, chegando ao SpeedUp de 3,25. Verificou-se que a aplicação escala bem com o aumento equivalente do tamanho dos dados e do número de máquinas no cluster, atingindo um desempenho próximo nos testes.

Detalhes do livro:

ISBN-13:

978-3-8417-2353-6

ISBN-10:

3841723535

EAN:

9783841723536

Idioma do livro:

Português

Por (autor):

Lays Helena Lopes Veloso
Luciano José Senger

Números de páginas:

68

Publicado em:

14.03.2016

Categoria:

Monografias