
Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "language classification" wg kryterium: Temat

Kin term patterns and language familie
Pericliev, Vladimir Borissov
Data publikacji:
Polska Akademia Nauk. Instytut Slawistyki PAN
kin term patterns
language classification
computational classification
Kin term patterns and language familieThe anthropologist G. P. Murdock has found a strong correlation between the kin term patterns (or feature-values) for the relative (feature) “sibling” and language families. This important finding for language classification, however, has not been pursued further. In particular, it has not yet been tested whether the kin term patterns domain as a whole, including the patterns for other features (“grandparents”, “uncles”, “aunts”, “nephews and nieces”, etc.), is sufficient to demarcate all language families from one another. This paper presents a large-scale computational profiling of all language families in terms of their kin term patterns. The most significant findings are: (i) that language families can be quite neatly differentiated on the basis of their kin term patterns, and therefore these patterns may be considered as strong indicators of genetic affiliation, and (ii) that the kin term patterns for the features “nephews and nieces (= siblings' children)”, “siblings”, and “siblings-in-law” - i.e. all features including the idea of siblings - are the best predictors of genetic affiliation, as they are significantly more frequently used in the profiles than any other feature.  Modele terminologii powinowactwa i pokrewieństwa a rodzina językowaAntropolog G. P. Murdock odkrył silny związek między modelami powinowactwa i pokrewieństwa dla krewnych (rodzeństwa) a rodzinami językowymi. To ważne odkrycie w klasyfikacji języków nie było odpowiednio dalej wykorzystywane. W szczególności nie sprawdzono jeszcze, czy domena modeli powinowactwa i pokrewieństwa jako całości, w tym modele dla innych cech („dziadkowie”, „wujkowie”, „ciotki”, „siostrzeńcy i siostrzenice” itp.) są wystarczająco ukształtowane we wszystkich rodzinach językowych. W niniejszym artykule przedstawiono profilowanie komputerowe na dużą skalę wszystkich rodzin językowych pod kątem ich modeli powinowactwa i pokrewieństwa. Najważniejsze wnioski są następujące: (i) rodziny językowe mogą być zróżnicowane na podstawie modeli powinowactwa i pokrewieństwa, dlatego też te modele mogą być uważane za silne wskaźniki genetycznej przynależności, oraz (ii) modele dla cechy „siostrzeńcy i siostrzenice (= dzieci rodzeństwa)”, „rodzeństwo” i „rodzeństwo przyrodnie” - czyli wszystkie cechy, w tym rodzeństwa - są najlepszymi przesłankami genetycznej przynależności, ponieważ są znacznie częściej używane w profilach niż jakakolwiek inna funkcja.
Cognitive Studies; 2017, 17
Pojawia się w:
Cognitive Studies
Dostawca treści:
Biblioteka Nauki
W kierunku automatycznej klasyfikacji języków naturalnych
Handzel, Zbigniew
Gajer, Mirosław
Grabiński, Tadeusz
Luty, Zbigniew
Surowiec, Anna
Data publikacji:
Wyższa Szkoła Ekonomii i Informatyki w Krakowie
przetwarzanie języka naturalnego
lingwistyka komputerowa
klasyfikacja języków
computational linguistics
natural language processing
language classification
Streszczenie: Klasyfikacja języków naturalnych jest jednym z głównych zadań językoznawstwa. Spośród różnych typów klasyfikacji języków najbardziej wiarygodną i miarodajną wydaje się być klasyfikacja typologiczna, która łączy języki w jednostki większego rzędu na podstawie podobieństwa ich cech strukturalnych. Podobieństwo typologiczne języków może być wynikiem zarówno ich pochodzenia od wspólnego przodka, czyli prajęzyka, jak i występujących zapożyczeń międzyjęzykowych dotyczących zarówno leksyki, jak i struktur składniowych. W artykule zamieszczono propozycję budowy systemu przeznaczonego do realizacji automatycznej klasyfikacji języków naturalnych ze względu na ich stopień podobieństwa typologicznego. Opracowany przez autorów system uwzględnia obecnie 72 języki należące głównie do indoeuropejskiej rodziny językowej. W systemie uwzględniono ponadto kilka języków należących do innych rodzin językowych oraz wybrane języki sztuczne typu naturalistycznego. Autorzy zaprezentowali program komputerowy służący do wyznaczania liczbowej miary stopnia wzajemnego podobieństwa systemów zaimków osobowych występujących w różnych językach świata. W przyszłości planowana jest budowa analogicznych systemów przeznaczonych do wyznaczania miary podobieństwa języków na podstawie automatycznej analizy wzorców koniugacyjnych czasowników oraz wzorców deklinacyjnych rzeczowników i przymiotników wybranych języków
Classification of natural languages is one of the main tasks of linguistics. Of the various types of language classification, the most reliable and authoritative seems to be the typological classification, which combines languages into units of a higher order on the basis of similarity of their structural features. The typological similarity of languages may be a result of both their origin from a common ancestor, i.e. a proto-language, and interlingual borrowings concerning both lexis and syntactic structures. The paper presents a proposal for the construction of a system intended for the automatic classification of natural languages according to their degree of typological similarity. The system developed by the authors currently includes 72 languages belonging mainly to the Indo-European language family. The system also includes several languages belonging to other language families and selected artificial languages of a naturalistic type. The authors have presented a computer programme for determining a numerical measure of the degree of mutual similarity between the systems of personal pronouns occurring in different languages of the world. In the future it is planned to build analogous systems to determine the measure of similarity between languages on the basis of automatic analysis of verb conjugation patterns and declension patterns of nouns and adjectives of selected languages.
Zeszyty Naukowe Wyższej Szkoły Ekonomii i Informatyki w Krakowie; 2021, 17; 53-70
Pojawia się w:
Zeszyty Naukowe Wyższej Szkoły Ekonomii i Informatyki w Krakowie
Dostawca treści:
Biblioteka Nauki
The semantic classification of adjectives in the Bulgarian Wordnet: Towards a multiclass approach
Dimitrova, Tsvetana
Stefanova, Valentina
Data publikacji:
Polska Akademia Nauk. Instytut Slawistyki PAN
Bulgarian language
lexical semantics
semantic classification
The semantic classification of adjectives in the Bulgarian Wordnet: Towards a multiclass approachThe paper presents an attempt at semantic classification of adjectives in the Bulgarian wordnet. Although designed for the Bulgarian wordnet, the classification can be applied to other wordnets which are developed in parallel to the Princeton WordNet. The classification relies on information that is already available in WordNet from other synsets (noun, verb, and other adjective synsets) that are linked to the adjective synsets via lexico-semantic relations - including their semantic classes, as well as definitions and usage examples. The first stage of the work was already presented at the workshop "Challenges for WordNets" within the conference "Language, Data and Knowledge 2017". The continuation of the effort as described in this article, covers a proposal for introducing additional semantic classes to the adjective synsets (if applicable). Semantyczna klasyfikacja przymiotników w bułgarskim Wordnecie: w kierunku podejścia wielopłaszczyznowegoW pracy przedstawiono próbę semantycznej klasyfikacji przymiotników w bułgarskim wordnecie. Chociaż została ona zaprojektowana dla wordnetu bułgarskiego, klasyfikacja może być zastosowana w innych wordnetach, które są rozwijane równolegle do Princeton WordNet. Klasyfikacja opiera się na informacjach, które są już dostępne w bułgarskim wordnecie pozyskanych z innych synsetów (rzeczownikowych, czasownikowych i innych przymiotnikowych), powiązanych z synsetami przymiotnikowymi poprzez relacje leksykalno-semantyczne, w tym ich klasy semantyczne, a także definicje i przykłady użycia. Pierwszy etap pracy został już przedstawiony, a kolejny obejmuje propozycję wprowadzenia dodatkowych klas semantycznych w synsetach przymiotnikowych (w stosownych przypadkach).
Cognitive Studies; 2018, 18
Pojawia się w:
Cognitive Studies
Dostawca treści:
Biblioteka Nauki
Polish language of aphasia: a scoping review in the era of the International Classification of Functioning, Disability and Health
Dębski, Robert
Wójcik-Topór, Paulina
Knapek, Magdalena
Data publikacji:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Polish language
scoping review
International Classification of Functioning
The International Classification of Function, Health and Disability (ICF) underscores a functional approach to aphasia assessment and therapy. The widespread uptake of the ICF necessitates a reflection whether the existing knowledge base on the Polish language of aphasia will permit speech‑language pathologists in Poland to make a strong contribution to this international trend. Using the PRISMA‑ScR methodology, a scoping review was conducted to describe and summarise the current state of research on the impact of aphasia on the subsystems of the Polish language and its mental processing. The findings indicate that although empirical studies of the Polish language of aphasia have so far addressed all the language subsystems, the level of scientific evidence in this area is low and the resulting knowledge base is incomplete and fragmented. There are significant research gaps, particularly in regard to pragmatics and discourse in aphasia, which need to be filled, so that the new empirical evidence can be used to develop functionally oriented and consequence‑based clinical tools and methods.
Linguistica Silesiana; 2021, 42; 261-280
Pojawia się w:
Linguistica Silesiana
Dostawca treści:
Biblioteka Nauki
Data mining tasks and methods – implementations in R
Figielska, Ewa
Data publikacji:
Warszawska Wyższa Szkoła Informatyki
data mining
R programming language
The aim of the paper is to present how some of the data mining tasks can be solved using the R programming language. The full R scripts are provided for preparing data sets, solving the tasks and analyzing the results.
Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki; 2020, 14, 23; 27-49
Pojawia się w:
Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki
Dostawca treści:
Biblioteka Nauki
Impact of Image Preprocessing on Recognition of Letters of Sign Language
Wpływ przetwarzania wstępnego obrazów na rozpoznawanie znaków alfabetu migowego
Abramowicz, P.
Topczewska, M.
Data publikacji:
Politechnika Białostocka. Oficyna Wydawnicza Politechniki Białostockiej
przetwarzanie wstępne
alfabet migowy
image preprocessing
sign language
The article concerns the problem of the selected sign language letters in the form of images classification. The impact of the image preprocessing methods as adaptive thresholding or edge detection is tested. In addition, the influence of the found shapes filling is checked, as well as centering the hands on the images. The following classification methods were chosen: SVM classifier with linear kernel function, Naive Bayes and Random Forests. The accuracy, F-measure, the AUC, MAE and Kappa coefficient were reported as measures of classification quality.
Artykuł dotyczy klasyfikacji wybranych liter alfabetu migowego w postaci obrazów. Badany jest wpływ na wyniki kilku metod przetwarzania wstępnego obrazów, w tym progowania adaptacyjnego oraz detekcji krawędzi. Dodatkowo sprawdzane jest wypełnianie znalezionych kształtów, a także centrowanie dłoni na obrazach. Jako metody klasyfikacji wybrane zostały: klasyfikator SVM z liniową funkcją jądrową, klasyfikator Naive Bayes oraz Random Forest. Jako miary jakości klasyfikacji raportowane są jakość klasyfikacji, miara F, pole pod krzywą ROC oraz współczynnik Kappa.
Advances in Computer Science Research; 2018, 14; 5-16
Pojawia się w:
Advances in Computer Science Research
Dostawca treści:
Biblioteka Nauki
Übungen als Grundlage für fremdsprachliche Einkodierungsprozesse
Exercises as a Basis for Foreign-language Encoding-processes
Szczodrowski, Marian
Data publikacji:
Uniwersytet im. Adama Mickiewicza w Poznaniu
learning German as a foreign language
language acquisition
classification of foreignlanguage exercises
process of encoding foreign-language information-structures
Various forms of language-activity influence the acquisition of a foreign language. In this article, the author underlines the importance of foreign-language exercises, and their effectiveness in the developing the learner’s encoding of decoded foreign-language information structures in the form of constant structure-matrices. The theories of teaching and learning drawn on in the article point to the variety of methods and degrees of foreign-language acquisition, both through cognitive exercises and through the pattern approach. Such exercises develop receptive and productive language-communication skills.
Glottodidactica. An International Journal of Applied Linguistics; 2014, 41, 2; 7-21
Pojawia się w:
Glottodidactica. An International Journal of Applied Linguistics
Dostawca treści:
Biblioteka Nauki
Analiza błędów językowych w praktyce glottodydaktycznej (na przykładzie języka angielskiego w szkole ponadgimnazjalnej)
Error analysis in glottodidactics on the example of the English language in secondary education
Borecka, Violetta Elżbieta
Data publikacji:
Uniwersytet w Białymstoku. Wydawnictwo Uniwersytetu w Białymstoku
linguistic error
error identification
error classification
foreign language learning
error description
language transfer
The aim of the article is to draw attention to the problems of error analysis in terms of its suitability for glottodidactics. Error analysis from a conventional perspective consists of successive stages of error identification, description, explication and evaluation. Carrying out these activities in the procedural order enables implementation of the last phase of analysis – error therapy, which is also its goal. In a broader perspective, error prevention is also taken into account. However, it turns out that in pedagogical practice proper conduct of the processes of identifying, describing, and classifying errors may be complicated. The article briefly presents the technique of error analysis in foreign language teaching in theoretical terms and also shows problematic examples taken from research material in the form of written tasks in English of Polish secondary school students. A few reflections have been formulated to help teachers understand processes of linguistic difficulties and take appropriate decisions concerning the methodology of prevention and treatment of language errors.
Białostockie Archiwum Językowe; 2016, 16; 41-56
Pojawia się w:
Białostockie Archiwum Językowe
Dostawca treści:
Biblioteka Nauki
Formulaic Sequences and Meta-Discourse Markers in Applied Linguistics Research Papers. A cross-linguistic corpus-based analysis of native and non- native authors’ published articles
Assassi, Tarek
Merghmi, Kenza
Data publikacji:
Academicus. International Scientific Journal publishing house
metadiscourse markers
formulaic language
academic writing
Hyland’s classification
Metadiscourse markers and their importance to academic writing are essential research subjects nowadays. The current corpus-based study aims at identifying interactional and interactive metadiscourse markers in terms of frequency and function in the abstract section of published research articles in applied linguistics developed by Algerian, Saudi, and Native researchers. 20 research articles for each group, with a total of 60 articles have been randomly selected and compiled as the research corpus for this study, then analyzed qualitatively and quantitatively using AntConc.3.2.4 relying on Hyland’s classification of metadiscourse markers. As a comparative study, the research considered the abstracts written by natives as a benchmark and attempted to find an answer to the main inquiry related to the frequency of use of metadiscourse devices by Algerian and Saudi researchers in comparison to their Native counterparts. The main research results showed how close were Algerian abstracts to native ones in terms of using endophorics, frame markers, code glosses, hedges, attitude markers, and self-mentions. While Saudi abstracts were close to the benchmark only in two markers that are transitions and engagement markers. The rest of the devices were shown to be far from the native norm in both cases. The findings also revealed that the use of metadiscourse markers is not the only indicator of papers’ publication rate in indexed journals by comparing the corpus analysis results to the source of the articles (journals), to find that even if Algerian researchers publish less in high indexed journals in comparison to Saudis, they are still closer in using markers to the natives as a benchmark.
Academicus International Scientific Journal; 2023, 14, 27; 154-175
Pojawia się w:
Academicus International Scientific Journal
Dostawca treści:
Biblioteka Nauki
Towards textual data augmentation for neural networks: synonyms and maximum loss
Jungiewicz, Michał
Smywiński-Pohl, Aleksander
Data publikacji:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
deep learning
data augmentation
neural networks
natural language processing
sentence classification
Data augmentation is one of the ways to deal with labeled data scarcity and overfitting. Both of these problems are crucial for modern deep-learning algorithms, which require massive amounts of data. The problem is better explored in the context of image analysis than for text; this work is a step forward to help close this gap. We propose a method for augmenting textual data when training convolutional neural networks for sentence classification. The augmentation is based on the substitution of words using a thesaurus as well as Princeton University's WordNet. Our method improves upon the baseline in most of the cases. In terms of accuracy, the best of the variants is 1.2% (pp.) better than the baseline.
Computer Science; 2019, 20 (1); 57-83
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies