Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "electronic corpus" wg kryterium: Temat


Wyświetlanie 1-10 z 10
Tytuł:
Electronic Diachronic Corpus and Dictionaries of Old Bulgarian
Autorzy:
Ganeva, Gergana
Powiązania:
https://bibliotekanauki.pl/articles/682491.pdf
Data publikacji:
2018
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
histdict
historical dictionary
grammatical dictionary
electronic diachronic corpus
Opis:
The electronic system histdict is designed as a tool for research, adequate presentation and popularization of a part of Bulgaria’s cultural and historical heritage: the Bulgarian language and its medieval literature. The article describes the various steps in the development of histdict. Attention is paid to each component of the resource: specialized Unicode fonts, electronic diachronic corpus, dictionary of Old Bulgarian, historical dictionary equipped with tools for writing and editing dictionary entries, grammatical dictionary, prototypical search engine, and virtual keyboard. The article also lays out the principles followed in the development of the diachronic grammatical dictionary of the Bulgarian language.
Źródło:
Studia Ceranea; 2018, 8; 111-119
2084-140X
2449-8378
Pojawia się w:
Studia Ceranea
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Kościelne słownictwo prawno-administracyjne w polskiej łacinie średniowiecznej – analiza z wykorzystaniem metod korpusowych
The Vocabulary of the Church’s Law and Administration in Polish Medieval Latin: An Analysis Using the Methods of Corpus Linguistics
Autorzy:
Halida, Łukasz
Powiązania:
https://bibliotekanauki.pl/articles/2015048.pdf
Data publikacji:
2021
Wydawca:
Komisja Nauk Filologicznych Polskiej Akademii Nauk, Oddział we Wrocławiu
Tematy:
medieval Latin
electronic corpus
automatic term extraction
specialized vocabulary
ecclesiastical law and administration
Opis:
This paper concerns the vocabulary of the Church’s law and administration in Latin texts written during the Middle Ages in Poland and its automatic extraction using the methods of corpus linguistics. The first part of this article considers the basic theoretical assumptions of the automatic extraction of this specialized vocabulary and the main characteristics of the Electronic Corpus of Polish Medieval Latin. In the second part presents the methods and results of term extraction. For the purpose of this research, a specialized subcorpus, including synodal statues and documents of ecclesiastical chapters, was created and then compared with the reference corpus. As a result, a list of lexemes, which appeared relatively frequently in the subcorpus and rarely in the reference corpus, was obtained. This difference in relative frequency was the main criterion for the recognition of potential terminological units. Verification on the basis of lexicographic data demonstrated the effectiveness of the adopted methods. The aim of this paper was to present the usefulness of the Electronic Corpus of Polish Medieval Latin for the research and analysis of specialized vocabulary.
Źródło:
Academic Journal of Modern Philology; 2021, 13; 123-132
2299-7164
2353-3218
Pojawia się w:
Academic Journal of Modern Philology
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
O projekcie Korpusu Polszczyzny do 1500 roku
Autorzy:
Deptuchowa, Ewa
Jasińska, Katarzyna
Klapper, Magdalena
Kołodziej, Dorota
Powiązania:
https://bibliotekanauki.pl/articles/1630446.pdf
Data publikacji:
2020-10-30
Wydawca:
Towarzystwo Kultury Języka
Tematy:
electronic text corpus
Old Polish
Mediaeval Polish
inflectional description
Opis:
This paper presents the assumptions of the Corpus of Polish until 1500, which is being developed as part of the project titled Baza leksykalna średniowiecznej polszczyzny (do 1500 roku). Fleksja (Lexical Database of Medieval Polish (until 1500). Infl ection). It introduces the fundamental objectives of the project, namely preparing an infl ectional description of all (infl ected) words from the time until 1500 and building a morphosyntactically annotated collection of texts from the same period. Afterwards, the authors discuss the present digital collections of Old Polish texts. In the main part of the paper, they present the criteria for selecting sources for the Corpus under creation and their elaboration methods, which refer to the solutions developed in the Electronic Corpus of Polish Texts from the 17th and 18th centuries (until 1772). Their major modifi cations aimed to adapt the structural and morphosyntactic annotations for the purpose of describing Mediaeval Polish are discussed on selected examples.
Źródło:
Poradnik Językowy; 2020, 777, 8; 7-16
0551-5343
Pojawia się w:
Poradnik Językowy
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Elektroniczny Korpus Tekstów Polskich z XVII i XVIII w. – problemy teoretyczne i warsztatowe
Autorzy:
Gruszczyński, Włodzimierz
Adamiec, Dorota
Bronikowska, Renata
Wieczorek, Aleksandra
Powiązania:
https://bibliotekanauki.pl/articles/1630441.pdf
Data publikacji:
2020
Wydawca:
Towarzystwo Kultury Języka
Tematy:
electronic text corpus
historical corpus
17th-18th-century Polish
natural language processing
Opis:
This paper presents the Electronic Corpus of 17th- and 18th-century Polish Texts (KorBa) – a large (13.5-million), annotated historical corpus available online. Its creation was modelled on the assumptions of the National Corpus of Polish (NKJP), yet the specifi c nature of the historical material enforced certain modifi cations of the solutions applied in NKJP, e.g. two forms of text representation (transliteration and transcription) were introduced, the principle of designating foreign-language fragments was adopted, and the tagset was adapted to the description of the grammatical structure of the Middle Polish language. The texts collected in KorBa are diversified in chronological, geographical, stylistic, and thematic terms although, due to e.g. limited access to the material, the postulate of representativeness and sustainability of the corpus was not fully implemented. The work on the corpus was to a large extent automated as a result of using natural language processing tools.
Źródło:
Poradnik Językowy; 2020, 777, 8; 32-51
0551-5343
Pojawia się w:
Poradnik Językowy
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Analiza fleksyjna tekstów historycznych i zmienność fleksji polskiej z perspektywy danych korpusowych
Autorzy:
Woliński, Marcin
Kieraś, Witold
Powiązania:
https://bibliotekanauki.pl/articles/1630443.pdf
Data publikacji:
2020-10-30
Wydawca:
Towarzystwo Kultury Języka
Tematy:
electronic text corpus
natural language processing
inflection of Polish
history of language
Opis:
The subject matter of this paper is Chronofleks, a computer system (http://chronofleks.nlp.ipipan.waw.pl/) modelling Polish inflection based on a corpus material. The system visualises changes of inflectional paradigms of individual lexemes over time and enables examination of the variability of the frequency of inflected form groups distinguished based on various criteria. Feeding Chronofleks with corpus data required development of IT tools to ensure an inflectional processing sequence of texts analogous to the ones used for modern language; they comprise a transcriber, a morphological analyser, and a tagger. The work was performed on data from three historical periods (1601–1772, 1830–1918, and modern ones) elaborated in independent projects. Therefore, finding a common manner of describing data from the individual periods was a significant element of the work.
Źródło:
Poradnik Językowy; 2020, 777, 8; 66-80
0551-5343
Pojawia się w:
Poradnik Językowy
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
„Gazeta Polska Bukowiny” jako źródło do badań współczesnej polszczyzny pisanej na Ukrainie
The Magazine “Gazeta Polska Bukowiny” as a Source for the Study of Contemporary Written Polish in Ukraine
Autorzy:
Krawczuk, Ałła
Powiązania:
https://bibliotekanauki.pl/articles/38453581.pdf
Data publikacji:
2021
Wydawca:
Polska Akademia Nauk. Instytut Slawistyki PAN
Tematy:
polszczyzna pisana na Ukrainie
„Gazeta Polska Bukowiny”
źródło materiałowe
interferencja
norma językowa
deklinacja rzeczownika
korpus elektroniczny
written Polish in Ukraine
"Gazeta Polska Bukowiny"
source material
interference
language norm
declension of a noun
electronic corpus
Opis:
This article presents the magazine Gazeta Polska Bukowiny [The Polish Gazette of Bukovina], which has been published in Ukraine since 2007, as a source for the study of contemporary written Polish under the conditions of its contact with other languages in Ukraine. The analysis is set against the background of research on the press of the Polish national minority in the country. The article offers a discussion of the advantages and prospects of the linguistic study of texts published in Gazeta Polska Bukowiny, including the use of the electronic corpus of this periodical as a research tool. The study outlines the characteristics of the magazine (time of publication, structure, topics of texts, their authors, editing) and, in the most general terms, the scope of deviations from the general Polish norm, which can be analysed on the basis of texts written by people of Polish descent. The linguistic specificity of these texts is more precisely illustrated on the example of case forms of nouns which deviate from their normative Polish equivalents. The author considers the potential impact of interference resulting from contact between Polish and Ukrainian and – directly or indirectly – Russian, which functions in Ukraine alongside the official language of the country.
Celem publikacji jest przedstawienie „Gazety Polskiej Bukowiny”, ukazującej się od 2007 roku na Ukrainie, jako źródła do badań nad współczesną polszczyzną pisaną w tym kraju w warunkach jej kontaktu z innymi językami. Na tle pokazania stanu badań nad językiem prasy polskiej mniejszości narodowej na Ukrainie omawia się zalety i perspektywy studiów językoznawczych prowadzonych na materiale tekstów „Gazety Polskiej Bukowiny”, w tym także z uwzględnieniem – jako narzędzia badawczego – utworzonego na potrzeby naukowe elektronicznego korpusu tego periodyku. Podaje się charakterystykę gazety (czas wydawania, struktura, zakres tematyczny publikacji, ich autorzy, redakcja) i najogólniej określa się zasięg odstępstw od ogólnopolskiej normy językowej, które można analizować na podstawie tekstów publikacji pisanych przez osoby polskiego pochodzenia. Dokładniej zaś specyfikę językową ilustruje się na przykładzie deklinacyjnych form rzeczownika odbiegających od normatywnych odpowiedników ogólnopolskich. Przytacza się komentarze o możliwych wpływach zewnątrzinterferencyjnych w wyniku kontaktów polszczyzny z językiem ukraińskim i – bezpośrednio lub pośrednio – rosyjskim, który aktywnie funkcjonuje na Ukrainie obok języka państwowego.
Źródło:
Acta Baltico-Slavica; 2021, 45
2392-2389
0065-1044
Pojawia się w:
Acta Baltico-Slavica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Application of multilingual corpus in contrastive studies (on the example of the Bulgarian-Polish-Lithuanian parallel corpus)
Autorzy:
Dimitrova, Ludmila
Koseska-Toszewa, Violetta
Roszko, Danuta
Roszko, Roman
Powiązania:
https://bibliotekanauki.pl/articles/677184.pdf
Data publikacji:
2010
Wydawca:
Polska Akademia Nauk. Instytut Slawistyki PAN
Tematy:
multilingual electronic corpora
parallel and comparable corpora
corpus annotation
lexical databases
multilingual electronic dictionaries
Opis:
Application of multilingual corpus in contrastive studies (on the example of the Bulgarian-Polish-Lithuanian parallel corpus)In this paper we present applications of a trilingual corpus in language research. Comparative and contrastive studies of Polish and Bulgarian as well as Polish and Lithuanian have been already conducted, but up to the best of our knowledge no such studies exist for Bulgarian and Lithuanian. On the one hand, it is interesting to note that two Slavic languages are compared to a Baltic language (Lithuanian). On the other hand, the three languages are marginally present in the EU because of the later ascension of the three countries to the EU. The paper shortly describes the first electronic Bulgarian–Polish–Lithuanian experimental corpus, currently under development only for research. We also focus our attention on the morphosyntactic annotation of the parallel trilingual corpus according to the Corpus Encoding Standard: we present a review of the Part-of-Speech (POS) classification of the participle in the three languages – Bulgarian, Polish, and Lithuanian in comparison to another POS, the adjective. We briefly discuss tagsets for corpus annotation from the point of view of possible unification in the future with some examples.
Źródło:
Cognitive Studies; 2010, 10
2392-2397
Pojawia się w:
Cognitive Studies
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Presentation of the verbs in Bulgarian-Polish electronic dictionary
Autorzy:
Dimitrova, Ludmila
Koseska, Violetta
Powiązania:
https://bibliotekanauki.pl/articles/967222.pdf
Data publikacji:
2014
Wydawca:
Polska Akademia Nauk. Instytut Slawistyki PAN
Tematy:
aligned bilingual corpus
digital resources
digital entry classifiers
electronic dictionary
event
state
Opis:
Presentation of the verbs in Bulgarian-Polish electronic dictionaryThis paper briefly discusses the presentation of the verbs in the first electronic Bulgarian-Polish dictionary that is currently being developed under a bilateral collaboration between IMI-BAS and ISS-PAS. Special attention is given to the digital entry classifiers that describe Bulgarian and Polish verbs. Problems related to the correspondence between natural language phenomena and their presentations are discussed. Some examples illustrate the different types of dictionary entries for verbs.
Źródło:
Cognitive Studies; 2014, 14
2392-2397
Pojawia się w:
Cognitive Studies
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
On the Benefits of Foreign Language Learning Based on Parallel Language Corpus
Autorzy:
Satoła-Staśkowiak, Joanna
Powiązania:
https://bibliotekanauki.pl/articles/677090.pdf
Data publikacji:
2015
Wydawca:
Polska Akademia Nauk. Instytut Slawistyki PAN
Tematy:
language corpora
foreign language learning
translation
concordance tools
formation of electronic resources
The Parallel Polish-Bulgarian-Russian Corpus
Opis:
On the Benefits of Foreign Language Learning Based on Parallel Language CorpusA recently observed strong interest in language corpora, which can be defined as a collection of texts in an electronic format, as well as my work within the European Project Clarin on ‘The Parallel Polish-Bulgarian-Russian Corpus’ became the reason for writing the text concerning the use of the parallel language corpus for learning a foreign language. The article discusses the benefits resulting from the use of such a corpus in learning a foreign language, describes selected corpus language tools supporting the learning process as well as indicates some threats arising from the wrong use of the corpus.
Źródło:
Cognitive Studies; 2015, 15
2392-2397
Pojawia się w:
Cognitive Studies
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Корпус української мови - комп’ютерна експертна система лінгвістичного аналізу українськомовного тектсу
Ukrainian Language Corpus – Computer Expert System of Linguistic Analysis of Ukrainian Text
Korpus języka ukraińskiego – komputerowy ekspercki system analizy językowej tekstu ukraińskojęzycznego
Autorzy:
Zubań, Oksana
Powiązania:
https://bibliotekanauki.pl/articles/1048661.pdf
Data publikacji:
2019-12-05
Wydawca:
Katolicki Uniwersytet Lubelski Jana Pawła II
Tematy:
Корпус української мови
Електронний частотний словник
база даних
автоматичний лінгвістичний аналіз
Korpus języka ukraińskiego
Elektroniczny słownik frekwencyjny
baza danych
automatyczna analiza lingwistyczna
Ukrainian Language Corpus
Electronic Frequency Dictionary
Data Base
automatic linguistic analysis
Opis:
У статті представлено структуру та засади автоматичного укладання експертної системи лінгвістичного аналізу "Корпус української мови". Методика формалізованого опису мовних одиниць тексту, запропонована у створенні Корпусу, забезпечує проведення автоматичного морфологічного, морфемного, синтаксичного, семантичного аналізів українськомовного тексту, а також автоматичне укладання різноманітних електронних частотних словників за текстовими вибірками.
Celem niniejszego artykułu jest przedstawienie struktur i zasad automatycznego tworzenia eksperckiego systemu analizy lingwistycznej „Korpus Języka Ukraińskiego”. Zaproponowana podczas tworzenia Korpusu metodologia sformalizowanego opisu językowych jednostek tekstu zapewnia możliwość przeprowadzenia automatycznej morfologicznej, morfemowej, syntaktycznej i semantycznej analizy tekstu ukraińskojęzycznego, jak również automatyczne tworzenie różnorakich elektronicznych słowników frekwencyjnych z wyborem tekstów.
The article deals with the structure and the principles of automatic compiling of expert linguistic analysis system called Ukrainian Language Corpus. The methodology of formalised description of language text units, suggested in creating the Corpus, carries out automatic morphological, morphemic, syntactic, and semantic analyses of Ukrainian texts as well as automatically compiling different Frequency Dictionaries according to text samples.
Źródło:
TEKA Komisji Polsko-Ukraińskich Związków Kulturowych; 2018, 5, 13; 191-206
1733-2249
Pojawia się w:
TEKA Komisji Polsko-Ukraińskich Związków Kulturowych
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-10 z 10

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies