Abstrakt
In the article we describe the approach to parallelimplementation of elementary operations for textual data categorization.In the experiments we evaluate parallel computations ofsimilarity matrices and k-means algorithm. The test datasets havebeen prepared as graphs created from Wikipedia articles relatedwith links. When we create the clustering data packages, wecompute pairs of eigenvectors and eigenvalues for visualizationsof the datasets. We describe the method used for evaluation ofthe clustering quality. Finally we discuss achieved results, pointsome improvements and perspectives for future development.
Cytowania
-
0
CrossRef
-
0
Web of Science
-
0
Scopus
Autorzy (2)
Cytuj jako
Pełna treść
pełna treść publikacji nie jest dostępna w portalu
Słowa kluczowe
Informacje szczegółowe
- Kategoria:
- Aktywność konferencyjna
- Typ:
- materiały konferencyjne indeksowane w Web of Science
- Tytuł wydania:
- 2nd International Conference on Innovative Computing Technology (INTECH) strony 293 - 298
- Język:
- angielski
- Rok wydania:
- 2012
- Opis bibliograficzny:
- Szymański J., Krawczyk H..: Towards Effective Processing of Large Text Collections, W: 2nd International Conference on Innovative Computing Technology (INTECH), 2012, ,.
- DOI:
- Cyfrowy identyfikator dokumentu elektronicznego (otwiera się w nowej karcie) 10.1109/intech.2012.6457784
- Weryfikacja:
- Politechnika Gdańska
wyświetlono 79 razy