Notice: Undefined index: linkPowrot in C:\wwwroot\wwwroot\publikacje\publikacje.php on line 1275
Publikacje
Pomoc (F2)
[79440] Artykuł:

Analysis of parallel computational models for clustering

Czasopismo: Proceedings of SPIE   Tom: 10808, Strony: 492-502
ISSN:  1996-756X
ISBN:  978-1-5106-2204-3
Wydawca:  SPIE-INT SOC OPTICAL ENGINEERING, 1000 20TH ST, PO BOX 10, BELLINGHAM, WA 98227-0010 USA
Opublikowano: Pażdziernik 2018
Seria wydawnicza:  Proceedings of SPIE
 
  Autorzy / Redaktorzy / Twórcy
Imię i nazwisko Wydział Katedra Do oświadczenia
nr 3
Grupa
przynależności
Dyscyplina
naukowa
Procent
udziału
Liczba
punktów
do oceny pracownika
Liczba
punktów wg
kryteriów ewaluacji
Małgorzata Płaza orcid logo WEAiIKatedra Systemów Informatycznych *Niespoza "N" jednostkiAutomatyka, elektronika, elektrotechnika i technologie kosmiczne203.75.00  
Roman Stanisław Deniziak orcid logo WEAiIKatedra Systemów Informatycznych *Takzaliczony do "N"Automatyka, elektronika, elektrotechnika i technologie kosmiczne203.753.00  
Mirosław Płaza orcid logo WEAiIKatedra Systemów Informatycznych *Takzaliczony do "N"Automatyka, elektronika, elektrotechnika i technologie kosmiczne203.753.00  
Radosław Belka orcid logo WEAiIKatedra Systemów Informatycznych *Niezaliczony do "N"Informatyka techniczna i telekomunikacja2015.003.00  
Paweł Pięta orcid logo WEAiIKatedra Systemów Informatycznych *Takzaliczony do "N"Automatyka, elektronika, elektrotechnika i technologie kosmiczne203.753.00  

Grupa MNiSW:  Materiały z konferencji międzynarodowej (zarejestrowane w Web of Science)
Punkty MNiSW: 15
Klasyfikacja Web of Science: Proceedings Paper


Pełny tekstPełny tekst     DOI LogoDOI     Web of Science Logo Web of Science    
Keywords:

big data  clustering  cluster analysis  data mining  machine learning  parallel algorithms 



Abstract:

Clustering is one of the main task of data mining, where groups of similar objects are discovered and grouping of similar data as well as outliers detection are performed. Processing of huge datasets requires scalable models of computations and distributed computing environments, therefore efficient parallel clustering methods are required for this purpose. Usually for parallel data analytics the MapReduce processing model is used. But growing computer power of heterogeneous platforms based on graphic processors and FPGA accelerators causes that CUDA and OpenCL models may be interesting alternative to MapReduce. This paper presents comparative analysis of effectiveness of applying MapReduce and CUDA/OpenCL processing models for clustering. We compare different methods of clustering in terms of their possibilities of parallelization using both models of computation. The conclusions indicate directions for further work in this area.