Inteligentne wyszukiwanie informacji w Internecie.
PublicationPrzedstawiono krótką charakterystykę architektury i technologii stosowanych w wyszukiwarkach. Zaproponowano algorytm działania wyszukiwarki spełniającej oczekiwania Nowego Internetu - Semantic Web, jej wykorzystywanie do zastosowań medycznych oraz w systemach bibliotecznych.
Inteligentne wyszukiwanie informacji w internecie
PublicationW pracy przedstawiono krótką charakterystykę architektury i technologii wykorzystywanych przy wyszukiwaniu informacji w Internecie. Zaproponowano koncepcje inteligentnej wyszukiwarki spełniającej różnorodne wymagania użytkownika. Przedyskutowano jej wykorzystanie w telemedycynie, w celu wsparcia inteligentnych funkcji rekomendacji.
Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych
PublicationW artykule przedstawione zostały architektura oraz projekt systemu, którego celem jest umożliwienie zbudowania platformy pozwalającej na indeksowanie dużych kolekcji tekstowych oraz wyszukiwania w nich, za pomocą autorskich algorytmów, opartych o zysk informacjny oraz interaktywną komunikację z użytkownikiem. Przeprowadzono ocenę skuteczności zastosowanych algorytmów pod względem zarówno klasteryzacji jak i zbieżności algorytmu...
Wyszukiwanie informacji z wykorzystaniem algorytmu Ontology Clustering by Directions
PublicationArtykuł opisuje algorytm Ontology Clustering by Directions. Algorytm ten ma na celu wspieranie użytkowników w formułowaniu ontologicznych zapytań. Ontologiczne zapytania służą do wydobywania informacji sformułowanych za pomocą ontologii opisanych np. językiem OWL. Artykuł przedstawia rodzaje języków wykorzystywanych do formułowania ontologicznych zapytań. W szczególności opisuje języki, które mają być przyjazne użytkownikom. Na...
Music Information Retrieval – Soft Computing versus Statistics . Wyszukiwanie informacji muzycznej - algorytmy uczące versus metody statystyczne
PublicationMusic Information Retrieval (MIR) is an interdisciplinary research area that covers automated extraction of information from audio signals, music databases and services enabling the indexed information searching. In the early stages the primary focus of MIR was on music information through Query-by-Humming (QBH) applications, i.e. on identifying a piece of music by singing (singing/whistling), while more advanced implementations...
Estimation the rhythmic salience of sound with association rules and neural networks
PublicationW referacie przedstawiono eksperymenty mające na celu automatyczne wyszukiwanie wartości rytmicznych we frazie muzycznej. W tym celu wykorzystano metody data mining i sztuczne sieci neuronowe.
Harmony Search for Data Mining with Big Data
PublicationIn this paper, some harmony search algorithms have been proposed for data mining with big data. Three areas of big data processing have been studied to apply new metaheuristics. The first problem is related to MapReduce architecture that can be supported by a team of harmony search agents in grid infrastructure. The second dilemma involves development of harmony search in preprocessing of data series before data mining. Moreover,...
Data Mining Applications and Methods in Medicine
PublicationIn this paper we describe the research area of data mining and its applications in medicine. The origins of data mining and its crucial features are shortly presented. We discuss the specificity of medicine as an application area for computer systems. Characteristic features of the medical data are investigated. Common problems in the area are also presented as well as the strengths and capabilities of the data mining methods....
Frequent Sequence Mining in Web Log Data
PublicationThe amount of information available even on a single web server can be huge. On the other hand, the amount of visitors (users) can often reach a number of at least six digits. Users vary in gender, age and education, and in consequence their information needs are different. Moreover, they subconsciously expect to get more adequate content after visiting the first few pages. The scope of this kind of problem relates to the domain...
Music Data Processing and Mining in Large Databases for Active Media
PublicationThe aim of this paper was to investigate the problem of music data processing and mining in large databases. Tests were performed on a large data-base that included approximately 30000 audio files divided into 11 classes cor-responding to music genres with different cardinalities. Every audio file was de-scribed by a 173-element feature vector. To reduce the dimensionality of data the Principal Component Analysis (PCA) with variable...
Choosing Exploration Process Path in Data Mining Processes for Complex Internet Objects
PublicationWe present an experimental case study of a novel and original framework for classifying aggregate objects, i.e. objects that consist of other objects. The features of the aggregated objects are converted into the features of aggregate ones, by use of aggregate functions. The choice of the functions, along with the specific method of classification can be automated by choosing of one of several process paths, and different paths...
Data Reduction Algorithm for Machine Learning and Data Mining
Ensemble Classifier for Mining Data Streams
Multimedia data mining for e-Commerce.
PublicationPrzedstawiono studium porównawcze metod eksploracji danych dla e-Commerce.Skupiono się na studium przypadku aplikacji medycznych - wyszukiwania przypadków podobnych.
Application of decisional DNA in web data mining
PublicationPrzedstawiono pilotową koncepcję i aplikację integracji reprezentacji wiedzy opartej na decyzyjnym DNA oraz systemów pozyskiwania wiedzy i danych z Internetu. Wskazano na zalety proponowanej integracji oraz przedstawiono kierunki przyszłych badań w tym zakresie.
Frequent Sequence Mining in Web Log Data
Researching Digital Society: Using Data-Mining to Identify Relevant Themes from an Open Access Journal
PublicationOpen Access scholarly literature is scientific output free from economic barriers and copyright restrictions. Using a case study approach, data mining methods and qualitative analysis, the scholarly output and the meta-data of the Open Access eJournal of e-Democracy and Open Government during the time interval 2009–2020 was analysed. Our study was able to identify the most prominent research topics (defined as thematic clusters)...
On a Certain Research Gap in Big Data Mining for Customer Insights
Mining e-mail message sequences from log data
Publication -
Machine Learning and data mining tools applied for databases of low number of records
Mapping of the Covid-19 Vaccine Uptake Determinants From Mining Twitter Data
PublicationOpinion polls on vaccine uptake clearly show that Covid-19 vaccine hesitancy is increasing worldwide. Thus, reaching herd immunity not only depends on the efficacy of the vaccine itself, but also on overcoming this hesitancy of uptake in the population. In this study, we revealed the determinants regarding vaccination directly from people’s opinions on Twitter, based on the framework of the 6As taxonomy. Covid-19 vaccine acceptance...
Ensemble Online Classifier Based on the One-Class Base Classifiers for Mining Data Streams
Precise Identification of Different Cervical Intraepithelial Neoplasia (CIN) Stages, Using Biomedical Engineering Combined with Data Mining and Machine Learning
PublicationCervical cancer (CC) is one of the most common female cancers worldwide. It remains a significant global health challenge, particularly affecting women in diverse regions. The pivotal role of human papillomavirus (HPV) infection in cervical carcinogenesis underscores the critical importance of diagnostic strategies targeting both HPV infection and cervical...
Comprehensive Comparison of a Few Variants of Cluster Analysis as Data Mining Tool in Supporting Environmental Management
PublicationA few variants of hierarchical cluster analysis (CA) as tool of assessment of multidimensional similarity in environmental dataset are compared. The dataset consisted of analytical results of determination of metals (Na, K, Ca, Sc, Fe, Co, Zn, As, Br, Rb, Mo, Sb, Cs, Ba, La, Ce, Sm, Hf and Th) in ambient air dried and kept alive, by the means of hydroponics, moss baskets collected in 12 locations on the area of Tricity (Poland)....
Estimating Water Retention in Post-mining Excavations Using LiDAR ALS Data for the Strzelin Quarry, in Lower Silesia
High-Speed Videoendoscopy Enhances the Objective Assessment of Glottic Organic Lesions: A Case-Control Study with Multivariable Data-Mining Model Development
Cytokine TGFβ Gene Polymorphism in Asthma: TGF-Related SNP Analysis Enhances the Prediction of Disease Diagnosis (A Case-Control Study With Multivariable Data-Mining Model Development)
Intelligent methods for musical rhythm retrieval.
PublicationW pracy przedstawiono postać funkcji rankingujacej poszczególnych dźwięków frazy muzycznej. Opracowano metodę tworzenia wszystkich możliwych hierarchicznych struktur rytmicznych, zwanych hipotezami rytmicznymi. Otrzymane hipotezy są następnie porządkowane w kolejności malejącej wartości funkcji rankingującej, aby ustalić, która ze znalezionych hipotez będzie uznana za właściwą strukturę rytmiczną utworu muzycznego. Postać funkcji...
Big Data i 5V – nowe wyzwania w świecie danych (Big Data and 5V – New Challenges in the World of Data)
PublicationRodzaje danych, składające się na zbiory typu Big Data, to dane generowane przez użytkowników portali internetowych, dane opisujące transakcje dokonywane poprzez Internet, dane naukowe (biologiczne, astronomiczne, pomiary fizyczne itp.), dane generowane przez roboty w wyniku automatycznego przeszukiwania przez nie Internetu (Web mining, Web crawling), dane grafowe obrazujące powiązania pomiędzy stronami WWW itd. Zazwyczaj,...
Processing of musical metadata employing Pawlak's flow graphs.
PublicationW artykule przedstawiono problemy wyszukiwania informacji muzycznej. W eksperymentach posłużono się meta opisem oraz wykorzystano metodę grafów przepływowych Pawlaka. Opisano skonstruowaną bazę nagrań muzycznych. Słowa kluczowe: meta opis, wyszukiwanie informacji muzycznej, baza danych muzycznych
Metody wspomagania wyszukiwania informacji
PublicationWyszukiwanie informacji analizowane może być z perspektywy użytkownika i w kontekście tego, jakie czynności może on podjąć, aby odnaleźć interesujące go informacje bez wsparcia ze strony analizatora języka. Użytkownicy stosują wyszukiwarki internetowe, jednak często nie są świadomi pełnego zakresu ich możliwości. Wyszukiwanie za pomocą wyszukiwarek polega na wprowadzaniu zapytań w polu tekstowym. Opracowane zostały liczne metody...
Collective citizens' behavior modelling with support of the Internet of Things and Big Data
PublicationIn this paper, collective human behaviors are modelled by a development of Big Data mining related to the Internet of Things. Some studies under MapReduce architectures have been carried out to improve an efficiency of Big Data mining. Intelligent agents in data mining have been analyzed for smart city systems, as well as data mining has been described by genetic programming. Furthermore, artificial neural networks have been discussed...
Forming and Ranking Musical Rhythm Hypotheses.
PublicationW pracy przedstawiono podstawowe pojęcia i definicje zwiazne z wyszukiwaniem informacji rytmicznej w utworach muzycznych. W muzykologii przyjmuje się, że atrybuty dźwięku, takie jak długość, częstotliwość oraz amplituda dźwięku determinują wagę rytmiczną dźwięku. W artykule przebadano te właściwości fizyczne dźwięku w kontekście okreslenia wagi rytmicznej, czyli miary określającej tendencję dźwięku do znalezienia się na początku...
Analityka środowiskowa i monitoring: problemy i wyzwania = Environmental analytics and monitoring: problems and challenges
PublicationW wystąpieniu przedstawiono informacje na temat nowych rozwiązań metodycznych i aparaturowych związanych z:- bezrozpuszczalnikowymi technikami przygotowania próbek do analizy (solventless techniques of sample pretreatment),- wytwarzaniem nowych typów materiałów odniesienia,- zastosowaniem nowych technik pobierania próbek analitów z mediów środowiskowych.W referacie zwrócono uwagę na znaczenie technik chemometrycznych i sztucznej...
JeromeDL, MarcOnt, FOAFRealm - technologie semantyczne dla bibliotek cyfrowych
PublicationWysokiej jakości informacje są bardzo często przechowywane w dedykowanych bibliotekach cyfrowych, które stają się rozrastajacymi wyspami wysoko zorganizowanej informacji. Pomimo to, zarzadzanie tak dużą ilością informacji nadal stwarza noiwe wyzwania. Sieć Semantyczna dostarcza technologii, które pomogą sprostać tym wyzwaniom. W tym artykule prezentujemy JeromeDL, w pełni funkcjonalną, wdrożoną w wielu lokalizacjach, pierwszą semantyczną...
Mining inconsistent emotion recognition results with the multidimensional model
PublicationThe paper deals with the challenge of inconsistency in multichannel emotion recognition. The focus of the paper is to explore factors that might influence the inconsistency. The paper reports an experiment that used multi-camera facial expression analysis with multiple recognition systems. The data were analyzed using a multidimensional approach and data mining techniques. The study allowed us to explore camera location, occlusions...
Remote Sensing Methods In the Study of the Impact of Long-Term Process of Sulphur Mining on Environmental Changes of the Carpathian Foreland
PublicationThe paper presents research on the extent of impact of sulphur mining process and post-mining activities upon properties of selected elements of the environment, as well as the assessment of the influence of indirect effects resulting from many years' process of exploitation of sulphur deposits in the areas of the Carpathian Foreland (south-east Poland). Within the scope of research conducted, the assessment of the extent of...
Agile Commerce in the light of Text Mining
PublicationThe survey conducted for this study reveals that more than 84% of respondents have never encountered the term “agile commerce” and do not understand its meaning. At the same time, they are active participants of this strategy. Using digital channels as customers more often than ever before, they have already been included in the agile philosophy. Based on the above, the purpose of the study is to analyse major text sets containing...
Metody wyszukiwania informacji oparte na wyznaczaniu kierunków
PublicationRozprawa doktorska poświęcona jest nowej, oryginalnej metodzie klasteryzacji kierunkowej przeznaczonej do wyszukiwania informacji. Metoda ma zastosowanie w przypadku, gdy przeprowadzane jest wyszukiwanie za pomocą zapytań. Mogą to być zarówno zapytania wprowadzane w polu tekstowym wyszukiwarki internetowej, jak i zapytania stosowane podczas wydobywania danych zawartych w sieci semantycznej. Metoda służy do przeprowadzania interaktywnego...
Identification of category associations using a multilabel classifier
PublicationDescription of the data using categories allows one to describe it on a higher abstraction level. In this way, we can operate on aggregated groups of the information, allowing one to see relationships that do not appear explicit when we analyze the individual objects separately. In this paper we present automatic identification of the associations between categories used for organization of the textual data. As experimental data...
Exploring the Usability and User Experience of Social Media Apps through a Text Mining Approach
PublicationThis study aims to evaluate the applicability of a text mining approach for extracting UUX-related issues from a dataset of user comments and not to evaluate the Instagram (IG) app. This study analyses textual data mined from reviews in English written by IG mobile application users. The article’s authors used text mining (based on the LDA algorithm) to identify the main UUX-related topics. Next, they mapped the identified topics...
Preliminary Citation and Topic Analysis of International Conference on Agile Software Development Papers (2002-2018)
PublicationThis study utilizes citation analysis and automated topic analysis of papers published in International Conference on Agile Software Development (XP) from 2002 to 2018. We collected data from Scopus database, finding 789 XP papers. We performed topic and trend analysis with R/RStudio utilizing the text mining approach, and used MS Excel for the quantitative analysis of the data. The results show that the first five years of XP...
Report of the ISMIS 2011 Contest : Music Information Retrieval
PublicationThis report presents an overview of the data mining contestorganized in conjunction with the 19th International Symposiumon Methodologies for Intelligent Systems (ISMIS 2011), in days betweenJan 10 and Mar 21, 2011, on TunedIT competition platform. The contestconsisted of two independent tasks, both related to music information retrieval:recognition of music genres and recognition of instruments, for agiven music sample represented...
Decision making techniques for electronic communication: an example for Turkey
PublicationCommunication is the way for people exchanging information with each other by using various tools. Electronic communication or Ecommunication is the process of sending, receiving and processing information or messages electronically. Electronic communication that is closely related to the development levels of countries, has made considerable progress especially in terms technology, innovation and entrepreneur. In this study, it...
Review of the Complexity of Managing Big Data of the Internet of Things
PublicationTere is a growing awareness that the complexity of managing Big Data is one of the main challenges in the developing feld of the Internet of Tings (IoT). Complexity arises from several aspects of the Big Data life cycle, such as gathering data, storing them onto cloud servers, cleaning and integrating the data, a process involving the last advances in ontologies, such as Extensible Markup Language (XML) and Resource Description...
Analysis of the objects images on the sea using Dempster-Shafer Theory
PublicationThe paper presents the concept of using aerial and satellite imagery or images coming from the marine radar to identify and track vessels at sea. The acquired data were subjected to a highly advanced image analysis. The development of remote sensing techniques allows to gain a huge amount of data. These data are useful information source however usually we have to use different data mining methods to gain interested information....
PublicationIn this paper we present our approach to RecSys Challenge 2015. Given a set of e-commerce events, the task is to predict whether a user will buy something in the current session and, if yes, which of the item will be bought. We show that the data preparation and enrichment are very important in finding the solution for the challenge and that simple ideas and intuitions could lead to satisfactory results. We also show that simple...