Search results for: KLASYFIKACJA DOKUMENTÓW
-
Wielkoskalowa hierarchiczna klasyfikacja dokumentów tekstowych
PublicationNiniejszy rozdział przedstawia problematykę wielkoskalowej, hie-rarchicznej i wieloetykietowej klasykacji dokumentów tekstowych naprzykładzie problemu automatycznego przyporządkowywania artykułuencyklopedycznego do jednej lub kilku (wieloetykietowość) kategorii,spośród setek tysięcy (wielkoskalowość) kategorii tematycznych Wi-kipedii zorganizowanych hierarchicznie. Praca opisuje różne wariantyrozwiązania zagadnienia, analizując...
-
Text Documents Classification with Support Vector Machines
Publication -
Automatyczna klasyfikacja artykułów Wikipedii
PublicationWikipedia- internetowa encyklopedia do organizacji artykułów wykorzystuje system kategorii. W chwili obecnej proces przypisywania artykułu do odpowiednich kategorii tematycznych realizowany jest ręcznie przez jej edytorów. Zadanie to jest czasochłonne i wymaga wiedzy o strukturze Wikiedii. Ręczna kategoryzacja jest również podatna na błędy wynikające z faktu, że przyporządkowanie artykułu don kategorii odbywa się w oparciu o arbitralną...
-
Wydobywanie wiedzy i klasyfikacja danych w systemie typu Web Farming
PublicationW rozdziale zaprezentowano metodę wydobywania informacji z dokumentów WWW oraz sposób klasyfikacji danych w prototypowym systemie typu Web Farming. Wydobywanie informacji z dokumentów bazuje na analizie syntaktycznej i porównywaniu występowania grup fraz obecnych w ich treści. Przedstawiono model semantyczny świata i jego reprezentacji w postaci dokumentów internetowych, oparty na pojęciu konceptu i kategorii tematycznej. Następnie...
-
Towards automatic classification of Wikipedia content
PublicationArtykuł opisuje podejście do automatycznej klasyfikacji artykułów w Wikipedii. Przeanalizowane zostały reprezentacje tekstu bazujące na treści dokumentu i wzajemnych powiązaniach. Przedstawiono rezultaty zastosowania klasyfikatora SVM.
-
Text classifiers for automatic articles categorization
PublicationThe article concerns the problem of automatic classification of textual content. We present selected methods for generation of documents representation and we evaluate them in classification tasks. The experiments have been performed on Wikipedia articles classified automatically to their categories made by Wikipedia editors.