Abstrakt
The paper summarizes our research in the area of unsupervised categorization of Wikipedia articles. As a practical result of our research, we present an application of spectral clustering algorithm used for grouping Wikipedia search results. The main contribution of the paper is a representation method for Wikipedia articles that has been based on combination of words and links and used for categoriation of search results in this repository. We evaluate the proposed approach with Primary Component projections and show, on the test data, how usage of cosine transformation to create combined representations influence data variability. On sample test datasets, we also show how combined representation improves the data separation that increases overall results of data categorization. To implement the system, we review the main spectral clustering methods and we test their usability for text categorization. We give a brief description of the system architecture that groups online Wikipedia articles retrieved with user-specified keywords. Using the system, we show how clustering increases information retrieval effectiveness for Wikipedia data repository.
Cytowania
-
2
CrossRef
-
0
Web of Science
-
2
Scopus
Autorzy (2)
Cytuj jako
Pełna treść
- Wersja publikacji
- Accepted albo Published Version
- DOI:
- Cyfrowy identyfikator dokumentu elektronicznego (otwiera się w nowej karcie) 10.3389/frobt.2016.00078
- Licencja
- otwiera się w nowej karcie
Słowa kluczowe
Informacje szczegółowe
- Kategoria:
- Publikacja w czasopiśmie
- Typ:
- artykuły w czasopismach
- Opublikowano w:
-
FRONTIERS IN ROBOTICS AND AI
nr 3,
ISSN: 2296-9144 - Język:
- angielski
- Rok wydania:
- 2017
- Opis bibliograficzny:
- Szymański J., Dziubich T.: Spectral Clustering Wikipedia Keyword-Based search Results// FRONTIERS IN ROBOTICS AND AI -Vol. 3, (2017), s.78-
- DOI:
- Cyfrowy identyfikator dokumentu elektronicznego (otwiera się w nowej karcie) 10.3389/frobt.2016.00078
- Weryfikacja:
- Politechnika Gdańska
wyświetlono 221 razy