DEVELOPMENT OF THE ALGORITHM OF POLISH LANGUAGE FILM REVIEWS PREPROCESSING - Publikacja - MOST Wiedzy

Wyszukiwarka

DEVELOPMENT OF THE ALGORITHM OF POLISH LANGUAGE FILM REVIEWS PREPROCESSING

Abstrakt

The algorithm and the software for conducting the procedure of Preprocessing of the reviews of films in the Polish language were developed. This algorithm contains the following steps: Text Adaptation Procedure; Procedure of Tokenization; Procedure of Transforming Words into the Byte Format; Part-of-Speech Tagging; Stemming / Lemmatization Procedure; Presentation of Documents in the Vector Form (Vector Space Model) Procedure; Forming the Documents Models Database Procedure. The experiments of this algorithm conduction on the test sampling of reviews analysis was performed and the main conclusion was formulated.

Autorzy (2)

Cytuj jako

Pełna treść

pobierz publikację
pobrano 1152 razy
Wersja publikacji
Accepted albo Published Version
Licencja
Copyright (Wydział Zarządzania w Ciechanowie (WSM w Warszawie))

Słowa kluczowe

Informacje szczegółowe

Kategoria:
Publikacja w czasopiśmie
Typ:
artykuły w czasopismach recenzowanych i innych wydawnictwach ciągłych
Opublikowano w:
Rocznik Naukowy Wydzialu Zarzadzania w Ciechanowie strony 167 - 188,
ISSN: 1897-4716
Język:
angielski
Rok wydania:
2017
Opis bibliograficzny:
Rizun N., Taranenko J.: DEVELOPMENT OF THE ALGORITHM OF POLISH LANGUAGE FILM REVIEWS PREPROCESSING// Rocznik Naukowy Wydzialu Zarzadzania w Ciechanowie. -., nr. 1-4 (XI) (2017), s.167-188
Bibliografia: test
  1. The most frequently observed Dominant terms (from the sample) were defined, with their division into speech parts (Table 6): otwiera się w nowej karcie
  2. Vanyushkin A. S., Grashchenkov L.A. (2016);
  3. Methods and algorithms extracted key- words. New information technologies for automated. № 19. otwiera się w nowej karcie
  4. Rizun N., Kapłanski P. & Taranenko Y. (2016); otwiera się w nowej karcie
  5. The Method of a Two-Level Text-Meaning Similarity Approximation of the Customers' Opinions. Czasopismo "Studia Ekonomic- zne -Zeszyty Naukowe". Uniwersytet Ekonomiczny w Katowicach. № 296, pp.64-85. otwiera się w nowej karcie
  6. Rizun N., Kapłanski P. & Taranenko Y. (2016); otwiera się w nowej karcie
  7. Development and Research of the Text Messages Semantic Clustering Methodology, The Third European Network Intelli- gence Conference (ENIC 2016). Proceedings. DOI: 10.1109/ENIC.2016.33. In book: 2016 Third European Network Intelligence Conference, Publisher: ENIC.2016.33, pp.180-187. otwiera się w nowej karcie
  8. Kapłanski P., Rizun N., Taranenko Y. & Seganti A. (2016);
  9. Text-mining Similarity Approximation Operators for Opinion Mining in BI tools. Proceeding of the 11th Sci- entific Congerence "Internet in the Information Society-2016", Publisher: University of Dąbrowa Górnicza, Editors: Maciej Rostancki, Piotr Pikiewicz, Krystian Mączka, Paweł Buchwald, pp.121-141. otwiera się w nowej karcie
  10. Feinerer, I., Hornik, K. & Meyer, D. (2008); Text mining infrastructure in: "R Journal of statistical software." 25(5). American Statistical Association. otwiera się w nowej karcie
  11. Segalovich I. (2003);
  12. A fast-morphological algorithm with unknown word guessing induced by a dictionary for a web search engine. MLMTA-2003. otwiera się w nowej karcie
  13. Koreniu T., Laurikkala Y, Järvelin K. & Juhola M. (2004); Stemming and Lemmatiza- tion in the Clustering of Finnish Text Documents. CIKM'04, November 8-13, Washing- ton, DC, USA. otwiera się w nowej karcie
  14. Alkula, R. (2001) From plain character strings to meaningful words: Producing better full text databases for inflectional and compounding languages with morphological analysis software. "Information Retrieval" № 4, pp.195-208. otwiera się w nowej karcie
  15. Weiss D. & Stempelator A. (2013); otwiera się w nowej karcie
  16. Hybrid Stemmer for the Polish Language. otwiera się w nowej karcie
  17. Lewandowska-Tomaszczyk B., James Melia P. (1997) PALC'97: Practical Applications in Language Corpora, pages 496-505, Łódź University Press. otwiera się w nowej karcie
  18. Hajnicz, E. & Kupść, A. (2001); otwiera się w nowej karcie
  19. Przegląd analizatorów morfologicznych dla języka pol- skiego. IPI PAN Research Report 937, Institute of Computer Science, Polish Academy of Sciences, Warsaw. otwiera się w nowej karcie
  20. Vetulani, Z. & Obrębski, T. (1997); Morphological tagging of texts using the lemmatizer of the 'POLEX' electronic dictionary. In: Lewandowska-Tomaszczyk, B. & Melia P. J. (Eds.) Practical Applications in Language Corpora, Proceedings, University Press, pp. 496-505. otwiera się w nowej karcie
  21. Obrębski, T. & Stolarski, M. (2006);
  22. UAM text tools -a flexible NLP architecture. In Proceedings of the Fifth International Conference on Language Resources and Evalu- ation, LREC 2006, pages 2259-2262, Genoa. ELRA otwiera się w nowej karcie
  23. Miłkowski, M. (2010); otwiera się w nowej karcie
  24. Developing an open-source, rule-based proofreading tool. Soft- ware: "Practice and Experience". 40(7): pp. 543-566. otwiera się w nowej karcie
  25. Wolinski, M, Miłkowski, M., Ogrodniczuk, M., Przepiórkowski, A. & Szałkiewicz, L. (2010) PoliMorf: a (not so) new open morphological dictionary for Polish.
  26. Przepiórkowski A. & Wolinski, M. (2003); The unbearable lightness of tagging: A case study in morphosyntactic tagging of Polish. In Proceedings of the 4th International Workshop on Linguistically Interpreted Corpora. EACL 2003, pp. 109-116. otwiera się w nowej karcie
  27. Radziszewski A. & Maziarz M. (2011); otwiera się w nowej karcie
  28. Developing free morphological data for Polish, "Cognitive Studies / Etudes Cognitives" (lista ERIH), 11. otwiera się w nowej karcie
  29. Rizun N., Taranenko Y. & Waloszek, W. (2017); otwiera się w nowej karcie
  30. The Algorithm of Modelling and Analysis of Latent Semantic Relations: Linear Algebra vs. Probabilistic Topic Models. Knowledge Engineering and Semantic Web. Knowledge Engineering and Semantic Web, Publisher: Proceedings of the 8th International Conference (KESW 2017), pp.53- 68. DOI: 10.1007/978-3-319-69548-8 5. otwiera się w nowej karcie
Weryfikacja:
Politechnika Gdańska

wyświetlono 97 razy

Publikacje, które mogą cię zainteresować

Meta Tagi