Abstrakt
The paper presents an approach to the large scale text documents classification problem in parallel environments. A two stage classifier is proposed, based on a combination of k-nearest neighbors and support vector machines classification methods. The details of the classifier and the parallelisation of classification, learning and prediction phases are described. The classifier makes use of our method named one-vs-near. It is an extension of the one-vs-all approach, typically used with binary classifiers in order to solve multiclass problems. The experiments were performed on a large scale dataset, with use of many parallel threads on a supercomputer. Results of the experiments show that the proposed classifier scales well and gives reasonable quality results. Finally, it is shown that the proposed method gives better performance compared to the traditional approach.
Cytowania
-
4
CrossRef
-
0
Web of Science
-
6
Scopus
Autorzy (2)
Cytuj jako
Pełna treść
pełna treść publikacji nie jest dostępna w portalu
Słowa kluczowe
Informacje szczegółowe
- Kategoria:
- Aktywność konferencyjna
- Typ:
- publikacja w wydawnictwie zbiorowym recenzowanym (także w materiałach konferencyjnych)
- Tytuł wydania:
- Pattern Recognition and Machine Intelligence strony 279 - 289
- Język:
- angielski
- Rok wydania:
- 2015
- Opis bibliograficzny:
- Kępa M., : Two Stage SVM and kNN Text Documents Classifier// Pattern Recognition and Machine Intelligence/ : , 2015, s.279-289
- DOI:
- Cyfrowy identyfikator dokumentu elektronicznego (otwiera się w nowej karcie) 10.1007/978-3-319-19941-2_27
- Weryfikacja:
- Politechnika Gdańska
wyświetlono 114 razy