- Tytuł:
-
System of semantic integration of non-structuralized documents in natural language in the domain of metallurgy
System integracji semantycznej nieustrukturyzowanych dokumentów w języku naturalnym z zakresu metalurgii - Autorzy:
-
Kluska-Nawarecka, S.
Regulski, K.
Krzyżak, M.
Leśniak, G.
Gurda, M. - Powiązania:
- https://bibliotekanauki.pl/articles/350806.pdf
- Data publikacji:
- 2013
- Wydawca:
- Polska Akademia Nauk. Czytelnia Czasopism PAN
- Tematy:
-
knowledge engineering
documents processing
ontologies
semantic integration
technological knowledge
metallurgy
inżynieria wiedzy
przetwarzanie dokumentów
ontologia
integracja semantyczna
wiedza technologiczna
metalurgia - Opis:
-
This paper presents assumptions for a system of automatic cataloging and semantic text documents searching. As an example, a document repository for metals processing technology was used. The system by using ontological model provides the user with a new approach to the exploration of database resources - easier and more intuitive information search. In the current document storage systems, searching is often based only on keywords and descriptions created manually by the system administrator. The use of text mining methods, especially latent semantic indexing, allows automatic clustering of documents with respect to their content. The result of this clustering is integrated with the ontological model, making navigation through documents resources intuitive and does not require the manual creation of directories. Such an approach seems to be particularly useful in a situation where we are dealing with large repositories of unstructured documents from such sources as the Internet. This situation is very typical for cases of searching information and knowledge in the area of metallurgy, for example with regard to innovation and non-traditional suppliers of materials and equipment.
Artykuł prezentuje założenia systemu umożliwiającego automatyczne katalogowanie i przeszukiwanie merytoryczne dokumentów tekstowych na przykładzie repozytorium dokumentów dotyczących technologii przetwórstwa metali. System dzięki zastosowaniu modelu ontologicznego ma umożliwić użytkownikowi nowe podejście do eksploracji zasobów bazodanowych - prostsze i bardziej intuicyjne wyszukiwanie informacji. W obecnych systemach przechowywania dokumentów często jedyna forma wyszukiwania jest wyszukiwanie na podstawie katalogu słów kluczowych i deskrypcji tworzonych ręcznie przez administratora systemu. Zastosowanie metod eksploracji tekstu, w szczególności ukrytego indeksowania semantycznego umożliwia automatyczne grupowanie dokumentów pod względem ich zawartości. Wynik takiego grupowania zostaje zintegrowany z modelem ontologicznym, przez co nawigacja poprzez zasoby dokumentów staje się intuicyjna i nie wymaga tworzenia ręcznie katalogów. Takie podejście wydaje się szczególnie przydatne w sytuacji, gdy mamy do czynienia z dużymi repozytoriami nieuporzadkowanych dokumentów pochodzących m.in. z sieci Internet. - Źródło:
-
Archives of Metallurgy and Materials; 2013, 58, 3; 927-930
1733-3490 - Pojawia się w:
- Archives of Metallurgy and Materials
- Dostawca treści:
- Biblioteka Nauki