Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "Latent Semantic Analysis" wg kryterium: Temat


Wyświetlanie 1-3 z 3
Tytuł:
Classification of text documents by using expanded terms in Latent Semantic Analysis
Klasyfikacja dokumentów tekstowych przy użyciu rozbudowanych wyrażeń w niejawnej analizie semantycznej
Autorzy:
Śmiałkowska, B.
Gibert, M.
Powiązania:
https://bibliotekanauki.pl/articles/951041.pdf
Data publikacji:
2013
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
text classification
information extraction
Latent Semantic Analysis
information retrieval
text representation
Opis:
In this article attention is paid to improving the quality of text document classification. The common techniques of analysis of text documents used in classification are shown and the weakness of these methods arc stressed. Discussed here is the integration of quantitative and qualitative methods, which is increasing the quality of classification. In the proposed approach the expanded terms, obtained by using information patterns are used in the Latent Semantic Analysis. Finally empirical research is presented and based upon the quality measures of the text document classification, the effectiveness of the proposed approach is proved.
W artykule skoncentrowano się na poprawie jakości klasyfikacji dokumentów tekstowych. Zostały przybliżone najpopularniejsze techniki analizy dokumentów tekstowych wykorzystywanych w klasyfikacji. Zwrócono uwagę na słabe strony opisanych technik. Omówiono możliwość integracji metod ilościowych i jakościowych analizy tekstu i jej wpływ na poprawę jakości klasyfikacji. Zaproponowano rozwiązanie, w którym rozbudowane wyrażenia otrzymane za pomocą wzorców informacyjnych są wykorzystywane w niejawnej analizie semantycznej. Ostatecznie w oparciu o miary jakości klasyfikacji dokumentów tekstowych zaprezentowano wyniki badań testowych, które potwierdzają skuteczność zaproponowanego rozwiązania.
Źródło:
Theoretical and Applied Informatics; 2013, 25, 3-4; 239-250
1896-5334
Pojawia się w:
Theoretical and Applied Informatics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The method of a two-level text-meaning similarity approximation of the customers’ opinions
Metoda dwupoziomowego przybliżonego obliczenia podobieństwa znaczenia tekstów opinii klientów
Autorzy:
Rizun, Nina
Kapłański, Paweł
Taranenko, Yurii
Powiązania:
https://bibliotekanauki.pl/articles/590266.pdf
Data publikacji:
2016
Wydawca:
Uniwersytet Ekonomiczny w Katowicach
Tematy:
Latent Semantic Analysis
Social Network Analysis
Text-meaning
Analiza sieci społecznych
Ukryta analiza semantyczna
Znaczenie tekstu
Opis:
The method of two-level text-meaning similarity approximation, consisting in the implementation of the classification of the stages of text opinions of customers and identifying their rank quality level was developed. Proposed and proved the significance of major hypotheses, put as the basis of the developed methodology, notably about the significance of suggestions about the existence of analogies between mathematical bases of the theory of Latent Semantic Analysis, based on the analysis of semantic relationship between the variables and degree of participation of the document or term in the corresponding concept of the document data, and instruments of the theory of Social Network Analysis, directed at revealing the features of objects on the basis of information about structure and strength of their interaction. The Contextual Cluster Structure, as well as Quantitative Ranking evaluation for interpreting the quality level of estimated customers’ opinion has formed.
Opracowano metodę dwupoziomowej aproksymacji podobieństwa – metodę przetwarzania tekstu, którą zastosowano w problemie klasyfikacji oraz do określania poziomu jakości klientów. Posługując się zaproponowaną w artykule metodyką, udowodniono istotność głównych hipotez, w szczególności hipotezy o istnieniu analogii pomiędzy podstawami matematycznymi LSA (ang. Latent Semantic Analysis), bazującej na analizie relacji semantycznej związku między stopniem udziału analogicznych pojęć w zbiorze dokumentów a narzędziami teorii analizy sieci społecznych (ang. Social Network Analysis), która z kolei odsłaniania cechy obiektów na podstawie informacji na temat struktury ich wzajemnych powiązań. Z połączenia powyższych metod wyłoniła się struktura klastra kontekstu, dająca ocenę ilościową na potrzeby ranking poziomu jakości opinii szacowanych klientów.
Źródło:
Studia Ekonomiczne; 2016, 296; 64-85
2083-8611
Pojawia się w:
Studia Ekonomiczne
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Automatyczne tworzenie podsumowań tekstów metodami algebraicznymi
Automatic text summarization using algebraic approach
Autorzy:
Gramacki, J.
Gramacki, A.
Powiązania:
https://bibliotekanauki.pl/articles/156932.pdf
Data publikacji:
2011
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
automatyczne podsumowywanie
ukryta semantyka dokumentów
przekształcenie SVD
generic text summarization
sentence extraction
latent semantic analysis
singular value decomposition
Opis:
Duża liczba zwracanych (na przykład przez różnego rodzaju wyszukiwarki internetowe) dokumentów oznacza, że często zmuszeni jesteśmy do czasochłonnego ich przeglądania, celem weryfikacji trafności zwracanych wyników. Gdy dokumenty są długie, czas ich przeglądania znacznie się wydłuża. Można by go wydatnie skrócić, gdyby istniała możliwość automatycznego generowania sensownych podsumowań (streszczeń). W artykule omawiamy wybrane algebraiczne metody służące automatycznemu wydobywaniu z tekstu jego najistotniejszych słów kluczowych oraz najistotniejszych zdań.
Text summarization is a real practical problem due to explosion of the volume of textual information available nowadays. In order to solve this problem, text summarization systems which extract brief information from a given text are created. The end user, by looking only at the summary, may decide whether the document is or is not of interest to him/her. Built summaries can have 2 fundamental forms. Firstly, extractive summarization may collect important sentences from the input text to constitute the summary. Secondly, abstractive summarization tries to capture main concepts of the text and then some new sentences, summarizing the input text, are generated. Nowadays, however, it seems that the latter approach still needs extensive works to be really useful. A summary can be extracted from a single document or multiple documents. In the paper the authors build summaries of one document only. The extension into multi-document summaries is the straightforward task in the case when a set of semantically uniform texts is summarized. Summaries may also be categorized as generic and query-based summaries. In the first case, there are generated summaries con-taining main topics of a document. In the second case, summaries contain the sentences that are related to the given queries. In the paper there are built generic summaries. Summarization systems use different approaches to determine important sentences. Here there is used semantic oriented approach based on a method known as Latent Semantic Analysis (LSA). LSA is an algebraic method that extracts meaning of words and similarity of sentences using the information about usage of the words in the context. It uses Singular Value Decomposition (SVD) for finding semantically similar words and sentences. Using the results of SVD the authors try to select best sentences (which constitute the best summary of the text). The paper is organized as follows. In Section 2 there is formulated the problem. In Section 3 there is shown how a docu-ment may be represented in a useful algebraic format. The so called Term-Sentence matrix (TSM) is used. The authors also point at some preliminary tasks necessary to be performed for successful further analysis. In Subsection 3.2 there is shortly presented an idea of LSA as based on SVD decomposition. In the last section 4 two examples of text summarizations build for both Polish and English texts are given. The two methods used differ slightly from each other. The authors' extracting key words and key sentences seems to be proper content-related summaries of the input texts.
Źródło:
Pomiary Automatyka Kontrola; 2011, R. 57, nr 7, 7; 751-755
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-3 z 3

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies