Filters
total: 628
filtered: 454
-
Catalog
Chosen catalog filters
Search results for: DOCUMENTS CATEGORIZATION
-
Categorization of Wikipedia articles with spectral clustering
PublicationAbstract. The article reports application of clustering algorithms for creating hierarchical groups withinWikipedia articles.We evaluate three spectral clustering algorithms based on datasets constructed with usage ofWikipedia categories. Selected algorithm has been implemented in the system that categorize Wikipedia search results in the fly.
-
Text classifiers for automatic articles categorization
PublicationThe article concerns the problem of automatic classification of textual content. We present selected methods for generation of documents representation and we evaluate them in classification tasks. The experiments have been performed on Wikipedia articles classified automatically to their categories made by Wikipedia editors.
-
Categorization of Cloud Workload Types with Clustering
PublicationThe paper presents a new classification schema of IaaS cloud workloads types, based on the functional characteristics. We show the results of an experiment of automatic categorization performed with different benchmarks that represent particular workload types. Monitoring of resource utilization allowed us to construct workload models that can be processed with machine learning algorithms. The direct connection between the functional...
-
Parallel Computations of Text Similarities for Categorization Task
PublicationIn this chapter we describe the approach to parallel implementation of similarities in high dimensional spaces. The similarities computation have been used for textual data categorization. A test datasets we create from Wikipedia articles that with their hyper references formed a graph used in our experiments. The similarities based on Euclidean distance and Cosine measure have been used to process the data using k-means algorithm....
-
LEVEL OF DETAIL CATEGORIZATION FOR THE APPLICATION IN URBAN DESIGN
PublicationUrban planning and urban design involve complex processes that require detailed information about the visual information of a place at various scales. Different graphic tools, such as game engines, are evolving to use urban representation fields. The concept of "level of detail" (LOD) has been used to categorize the level of detail in AEC applications such as BIM and GML for urban representation models. However, there is a need...
-
Text Categorization Improvement via User Interaction
PublicationIn this paper, we propose an approach to improvement of text categorization using interaction with the user. The quality of categorization has been defined in terms of a distribution of objects related to the classes and projected on the self-organizing maps. For the experiments, we use the articles and categories from the subset of Simple Wikipedia. We test three different approaches for text representation. As a baseline we use...
-
Schema mining in XML documents.
PublicationW artykule przedstawiono algorytm COBWEB S+T służący do wywodzenia schematów z kolekcji dokumentów XML. Algorytm wykorzystuje model danych semistrukturalnych oraz alorytm COBWEB służący do grupowania koncepcyjnego. W artykule zaprezentowano również wyniki testów działania algorytmu.
-
Text categorization with semantic commonsense knowledge: First results
PublicationDo przetwarzania tekstów typowo wykorzystuje się reprezentacjeBOW. Podejście takie nie daje jednak dobrych rezultatów w sytuacjigdy podobne dokumenty nie współdzielą ze sobą słów.W artykule zaprezentowano podejście do konstrukcji funkcjijądra dla klasyfikatorów SVM opartego na zewnętrznej bazie wiedzyo pojęciach językowych.
-
Knowledge management implementation in small and micro KIBS : A categorization
Publicationhe main goal of the paper is to provide a statistical categorization of small and micro knowledge-intensive business service (KIBS) companies, based on their knowledge management (KM) attitude. Since knowledge is the main production factor and output of these companies, it is essential to achieve a better understanding of how they manage this resource. A questionnaire-based survey was conducted on a sample of Polish small and micro...
-
Augmenting digital documents with negotiation capability
PublicationActive digital documents are not only capable of performing various operations using their internal functionality and external services, accessible in the environment in which they operate, but can also migrate on their own over a network of mobile devices that provide dynamically changing execution contexts. They may imply conflicts between preferences of the active document and the device the former wishes to execute on. In the...
-
Green energy in municipal planning documents
Publication -
Ruling lines removal in handwritten documents
Publication -
Querying the digital database of musical documents
PublicationW rozdziale zaprezentowano program Melody Explorer służący do formułowania zapytań dla bazy danych dokumentów muzycznych. Przedstawiono problemy związane z konwersją informacji wprowadzanych przez użytkownika na zapis nutowy. Zaproponowano ulepszenia istniejących rozwiązań mające na celu poprawę dokładności i stabilności systemu. Oprócz cyfrowego zapisu dźwięku również podany przez użytkownika rytm melodii wykorzystywany jest do...
-
Linking music data in executable documents
PublicationThis paper presents the application of Interactive Open Document Architecture (IODA) to music and video data. This architecture was design to create multilayer documents which consist of many files. The paper shows the method of creating media documents on the basis of IODA. These kind of documents were called IODA Media Documents (IMD). IMD have links that connect many different kinds of files containing music and video data....
-
The categorization of the tourist services quality perception determinants in hierarchical conception
PublicationW niniejszym rozdziale zaprezentowano kategoryzację determinant percepcji jakości usług turystycznych. Omówione zostały główne grupy oraz determinanty elementarne z wykorzystaniem ujęcia modeli hierarchicznych.
-
Categorization of emotions in dog behavior based on the deep neural network
PublicationThe aim of this article is to present a neural system based on stock architecture for recognizing emotional behavior in dogs. Our considerations are inspired by the original work of Franzoni et al. on recognizing dog emotions. An appropriate set of photographic data has been compiled taking into account five classes of emotional behavior in dogs of one breed, including joy, anger, licking, yawning, and sleeping. Focusing on a particular...
-
Intelligent system for editing and analysis of examination documents
PublicationOpisano ogólną koncepcję systemu IATE - systemu do edycji i automatycznej analizy testów egzaminacyjnych. Edytor systemu umożliwia generację 4 typów testów o dowolnej liczbie pytań (do 8 stron tekstu), różnej formie udzielania odpowiedzi oraz możliwością tworzenia wariantów testu. Bardziej szczegółowo opisano wybrane fragmenty systemu: analizę nagłówka testu, edycję i organizację segmentu tworzenia wariantów testu oraz organizację...
-
Planning documents and sustainable development of a commune in Poland
Publication -
Text Documents Classification with Support Vector Machines
Publication -
Deep learning for recommending subscription-limited documents
PublicationDocuments recommendation for a commercial, subscription-based online platform is important due to the difficulty in navigation through a large volume and diversity of content available to clients. However, this is also a challenging task due to the number of new documents added every day and decreasing relevance of older contents. To solve this problem, we propose deep neural network architecture that combines autoencoder with...
-
Computer analysis of multiple-choice examination documents
PublicationOpisany system AATE wyposażony jest w edytor testów, za pomocą którego egzaminator przygotowuje test egzaminacyjny. Utworzony test ze swoimi parametrami jest pamiętany w bazie danych i następnie może być wydrukowany. Po przeprowadzeniu egzaminu wypełnione formularze za pomocą skanera z podajnikiem wprowadza się do komputera. W komputerze system analizuje formularze i odczytane odpowiedzi porównuje się z wzorcami przechowywanymi...
-
The potential of computational methods for the categorization of architectural objects on the example of media architecture
PublicationThe paper presents an example of the categorization of architectural objects and assessment of the characteristics of urban space, based on the analysis of specific features of architectural objects and urban landscape. The conducted analysis refers to media architecture and is presented in the complex context of the development of media solutions. The field of influence of IT on architecture is also stressed, both on the architect’s...
-
Document centric knowledge processes
Publication.
-
External Validation Measures for Nested Clustering of Text Documents
PublicationAbstract. This article handles the problem of validating the results of nested (as opposed to "flat") clusterings. It shows that standard external validation indices used for partitioning clustering validation, like Rand statistics, Hubert Γ statistic or F-measure are not applicable in nested clustering cases. Additionally to the work, where F-measure was adopted to hierarchical classification as hF-measure, here some methods to...
-
Agent System for Managing Distributed Mobile Interactive Documents
PublicationThe MIND architecture of distributed mobile interactive document is a new processing model defined for facilitate informed decision-making in non-algorithmic decision-making processes carried out by knowledge-based organizations. The aim of this architecture is to change the static document to mobile agents, which are designed to implement the structure of the organization through autonomous migration between knowledge workers...
-
For Your Eyes Only – Biometric Protection of PDF Documents
PublicationThe paper introduces a concept of a digital document content encryption/decryption with facial biometric data coming from a legitimate user. Access to the document content is simple and straightforward, especially during collaborative work with mobile devices equipped with cameras. Various contexts of document exchange are presented with regard to the next generation pro-active digital documents proposed by authors. An important...
-
Semantic Driven Table Understanding in Born-Digital Documents
PublicationThis paper presents a new approach to table understanding, suitable for born-digital PDF documents. Advance beyond the current state of the art in table understanding is provided by the proposed reverse MVC method, which takes advantage of only partial logic structure loss (degradation) in born-digital PDF documents, as opposed to unrecoverable loss (deterioration) taking place in scan based PDF documents.
-
Two Stage SVM and kNN Text Documents Classifier
PublicationThe paper presents an approach to the large scale text documents classification problem in parallel environments. A two stage classifier is proposed, based on a combination of k-nearest neighbors and support vector machines classification methods. The details of the classifier and the parallelisation of classification, learning and prediction phases are described. The classifier makes use of our method named one-vs-near. It is...
-
Document Agents with the Intelligent Negotiations Capability
PublicationThe paper focus is on augmenting proactive document-agents with built -in intelligence to enable them to recognize execution context provided by devices visited durning the business process, and to reach collaboration agreement despite of their conflicting requirements. We propose a solution based on neural networks to improve simple multi-issue negotiation between the document and the device, practically with no excessive cost...
-
Digital document life cycle development
PublicationPrzedstawiono model DDLC wytwarzania interaktywnych dokumentów cyfrowych z ich pierwowzorów papierowych. Model DDLC opracowany w ramach 5 PR UE IST-2002-33441 MEMORIAL wyróżnia 6 faz i odpowiednie grupy funkcjonalności narzędzi do ich realizacji. Cykl wytwarzanie realizuje politykę całkowitej kontroli jakości, wykorzystującej specjalnie opracowaną metodę Visual GQM.
-
Dokumenty Cyfrowe Przyszłosci
PublicationW referacie przedstawiono nowe modele architektur dokumentów elektronicznych, które pozwolą zracjonalizować wewnętrzny obieg informacji w organizacjach opartych na wiedzy i zredukować koszty ich funkcjonowania.
-
Representation of hypertext documents based on terms, Links and text compressibility
PublicationOpisano metody reprezentacji dokumentów tekstowych oparte na słowach, wzajemnych powiązaniach i metodach kompresji. Dokonano ich oceny w oparciu o klasyfikator SVM.
-
Facial data registration facility for biometric protection of electronic documents
PublicationIn modern world, information is crucial, and its leakage may lead to serious losses. Documents as the main medium of information must be therefore highly protected. Nowadays, the most common way of protecting data is using passwords, however it seems inconvenient to type complex passwords, when it is needed many times a day. For that reason a significant research has been conducted on biometric authentication...
-
Improving the Workflow for Creation of Textual Versions of Polish Historical Documents
Publication -
Visual GQM approach to quality driven development of electronic documents.
PublicationJednym z celów projektu europejskiego MEORIAL jest opracowanie nowej technologii wytwarzania webowych systemów informacyjnych wykorzystujących interaktywne dokumenty cyfrowe wytworzone z papierowych oryginałów z zastosowaniem zaawansowanych technik przetwarzania i rozpoznania obrazów. Wieloelementowy model cyklu życia dokumentu cyfrowego przedstawiony w artykule stanowi postawę opracowanej technologii.
-
Kryteria wytrzymałości gruntu na ścinanie w zagadnieniach geotechniki
PublicationPrzedstawiono wpływ zastosowania różnych kryteriów wytrzymałości gruntu na ścinanie w symulacjach numerycznych prostych praktycznych zagadnień geotechnicznych. Obliczenia wykonano metodą elementów skończonych w płaskim oraz osiowosymetrycznym stanie odkształcenia. Wyniki obliczeń porównano oraz poddano krytycznej dyskusji.
-
The Application of the IODA Document Architecture to Music Data
PublicationThis paper is concerned with storing music data with the use of document architecture called Interactive Open Document Architecture (IODA). This architecture makes it possible to create documents which are executable, mobile, interactive and intelligent. Such documents consist of many files that are semantically related to each other. Semantic links are defined in XML files which are a part of a document. IODA documents with music...
-
A document-centric processing paradigm for collaborative computing
PublicationKlasyczne modele przetwarzania rozproszonego zakładają, że dokumenty są biernymi obiektami, które rozsyła się w formie komunikatów lub pobiera z serwerów do przetwarzania jako pliki.W artykule przedstawiono koncepcję dokumentu jako aktywnego obiektu, zdolnego do samodzielnej migracji miedzy węzłami sieci i interakcji z użytkownikami w ich lokalnym środowisku. Takie podejście jest szczególnie przydatne do realizacji procesów biznesowych...
-
Document transformations for data processing in information systems
PublicationAtrykuł przedstawia podejście do automatyzacji transformacjidokumentów użytkownika bazujące na technologii XML. W artykuleprzedstawiony został system Endoscopy Recommender System.ERS wykorzystuje dedykowane transformacje XML Schema do Java, Java dodokumentów XML. Dzięki tym transformacjom procesy pobierania iprzechowywania danych zostały w pełni zautomatyzowane.Zaimplementowane podejście XML data binding umożliwia walidacjępodstawowych...
-
The lifecycle of a digital historical document: structure and content.
PublicationZaproponowno model cyklu wytwarzania dokumentu cyfrowego z papierowych oryginałów pisanych na maszynie i przedstawiono opracowany przez autorów i wdrożony w środowisku Państwowego Muzeum Stutthof w Sztutowie zestaw narzędziowy DOW do automatycznej ekstrakcji treści dokumentu. Istotę nowej metodologii, opracowanej w ramach projektu 5PR UE IST-33441 MEMORIAL, jest wykorzystanie informacji semantycznej w procesach segmentacji tła,...
-
Extraction of information from born-digital PDF documents for reproducible research
PublicationBorn-digital PDF electronic documents might reasonably be expected to preserve useful data units of their source originals that suffice to produce executable papers for reproducible research. Unfortunately, developers of authoring tools may adopt arbitrary PDF generation strategies, producing a plethora of internal data representations. Such common information units as text paragraphs, tables, function graphs and flow diagrams,...
-
Distributed MIND - A New Processing Model Based on Mobile Interactive Documents
PublicationObliczenia w trybie zespołowym pozwalają na integrację działań ludzi i agentów systemowych w otwartym środowisku rozproszonym w celu rozwiązywania problemów formułowanych dynamicznie w trakcie pracy systemu. Problemy te najczęściej nie mają charakteru algorytmicznego, tzn. generowane rozwiązania nie mogłyby zostać wyliczone w skończonej liczbie kroków na podstawie danych charakteryzujących uczestników obliczeń. Autorzy proponują...
-
Bilateral Multi-Issue Negotiation Between Active Documents and Execution Devices
PublicationMobile document-agents are often in conflict with execution devices when attempting to perform activities of the business process they implement, since preferences of device owners may change depending on their current location and the actual class of the device in use. The paper proposes a bilateral negotiation mechanism based on a simple bargaining game that can effectively resolve such conflicts without any third party support.
-
Standaryzacja - potrzeby, organizacje, dokumenty
PublicationOmówiono przyczyny powodujące, że normalizacja w dziedzinie informatyki, te-lekomunikacji, jak i organizacji służby zdrowia mają pierwszorzędne znacze-nie praktyczne. Przedstawiono stan prac normalizacyjnych i pokazano struktu=rę i zasady pracy organów działających w dziedzinie normalizacji systemówinformatycznych, ze szczególnym zwróceniem uwagi na organizacje i dokumentymające związek z aplikacjami medycznymi.
-
A prediction of the fault-induced instability of circuit under test as a new approach in categorisation of faults.
PublicationW artykule przedstawiono nowy sposób kategoryzacji uszkodzeń w analogowych układach elektronicznych. Zaproponowano kryterium oparte na predykcji niestabilności indukowanej przez uszkodzenie w testowanym układzie. Przyjeto, że granicą pomiędzy uszkodzeniem miękkim i katastroficznym jest najmniejsza odchyłka parametru elementu, która sprowadza układ testowany do granicy stabilności. Wzrost wartości odchyłki poza wyznaczony margines...
-
River valley in planning documents. The case of towns in the northern part of Gdansk agglomeration
PublicationW strukturach zurbanizowanych doliny rzek pełnią funkcję korytarzy ekologicznych - jako element systemu ekologicznego zapewniają połączenie z obszarami zasilającymi. Niektóre z nich mają znaczenie ponadlokalne. Jednocześnie doliny rzek mogą być użytkowane jako przestrzeń integracji i rekreacji lokalnej społeczności. Strategie ochrony i kształtowania powyższych funkcji są ustalane w dokumentach planistycznych różnych szczebli....
-
Agent System for Managing Distributed Mobile Interactive Documents in Knowledge-Based Organizations
PublicationThe MIND architecture of distributed mobile interactive document is a new processing model defined to facilitate obtaining a proper solution in knowledge processes carried out by knowledge-based organizations. Such organizations have an established structure that defines document templates and knowledge process. The aim of the MIND architecture is to change the static document to mobile agents, which are designed to implement the...
-
The competitive advantage of Ppomorskie Voivodeship in strategic documents based on the Regional Innovation Strategy
PublicationThe article presents and discusses the main assumptions and courses of action contained in the innovation strategy for Pomorskie voivodeship with respect to building the competitive advantage The considerations are preceded by analyses concerning the interpretation and meaning of the following concepts in contemporary economy (with special emphasis on their regional context): competitiveness, competitive advantage and innovation,...
-
The competitive advantage of Pomorskie Voivodeship in strategic documents based on the Regional Innovation Strategy
PublicationThe article presents and discusses the main assumptions and courses of action contained in the innovation strategy for Pomorskie voivodeship with respect to building the competitive advantage The considerations are preceded by analyses concerning the interpretation and meaning of the following concepts in contemporary economy (with special emphasis on their regional context): competitiveness, competitive advantage and innovation,...
-
Badania pojazdów zabytkowych - wymagane dokumenty
PublicationBadanie, jakiemu poddawany jest pojazd w stacji kontroli pojazdów, kwalifikujące go do pojazdów zabytkowych nazywane jest "Badaniem co do zgodności z warunkami technicznymi pojazdów zabytkowych". Rozporządzenie określa zakres i sposób prowadzenia badań zgodności z warunkami technicznymi pojazdów zabytkowych.