Temat: corpora (parallel - Katalog OPAC zbiorów

Skocz do pozycji: 1.

Tytuł:: Polsko-bułgarskie korpusy IS PAN i CLARIN-PL
Polish-Bulgarian corpora ISS PAS (IS PAN) and CLARIN-PL
Autorzy:: Roszko, Danuta
Roszko, Roman
Sosnowski, Wojciech
Powiązania:: https://bibliotekanauki.pl/articles/694545.pdf
Data publikacji:: 2018
Wydawca:: Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:: Polish-Bulgarian Corpora
Parallel Corpora
CLARIN-PL
Opis:: Multilingual corpora have found many applications in arts and humanities and social sciences, as well as in translation. A number of ways exist in which multilingual corpora can be used. Translators and CAT users would predominantly use translation memories (TM). Other users can choose from two ways of accessing the resources produced by The Institute of Slavic Studies. In the first method, the user needs to download the open-source TMX translation memories from CLARIN-PL DSpace repository (https://clarin-pl.eu/dspace) and load it into their preferred computer application. One can found free and proprietary applications that facilitate querying multilingual corpora; CLARIN-PL also offers free tools. The other method of accessing the multilingual data produced by The Institute of Slavic Studies does not require any advanced computer skills from the user. CLARIN-PL webpage includes the KonText search engine, which contains also Polish-Bulgarian resources (https://kontext. clarin-pl.eu/). The Polish-Bulgarian corpus contains the following types of resources: (1) fiction literature, (2) specialist literature (literature that is a reflection of the latest technological and cultural developments); and (3) film dialogues, which are the most similar to spoken language.
-
Źródło:: Slavica Lodziensia; 2018, 2; 59-70
2544-1795
Pojawia się w:: Slavica Lodziensia
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 2.

Tytuł:: Języki słowiańskie i litewski w korpusach równoległych Clarin-PL
Autorzy:: Koseska-Toszewa, Violetta
Roszko, Roman
Powiązania:: https://bibliotekanauki.pl/articles/678946.pdf
Data publikacji:: 2016
Wydawca:: Polska Akademia Nauk. Instytut Slawistyki PAN
Tematy:: multilingual parallel corpora
semantic annotation
scope quantification
Opis:: Slavic languages and the Lithuanian language in the Clarin-PL parallel corporaThe Clarin Eric and Clarin-PL strategic scientific purpose is to support humanistic research in a multicultural and multilingual Europe. Polish researchers put the emphasis on building a bridge between the Polish language and Polish linguistic technologies and other European languages and their linguistic technologies. So far, the Polish scientific community has mainly focused on Polish-English connections. Clarin-PL has been developing the first and only multilingual corpora of the Polish language in conjunction with other Slavic languages and the Lithuanian language: the Polish-Bulgarian-Russian Parallel Corpus and the Polish- Lithuanian Parallel Corpus. The parallel corpora created by the ISS PAS Corpus Linguistics and Semantics Team break through the existing “canons” and allow scientists access to interlinked multilingual language resources – in the first phase limited to the languages of the three Slavic groups and the Lithuanian language. In the article, the authors present very detailed information on their original system of the semantic annotation of scope quantification in multilingual parallel corpora, hitherto unused in the subject literature. Due to the system’s originality, the semantic annotation is carried out manually. Identification of particular values of scope quantification in a sentence and the hereby presented attempts of its recording are supported by long-term research conducted by an international team of linguists and computer scientists / mathematicians developing the issue of quantification of names, time and aspect in natural languages. Języki słowiańskie i litewski w korpusach równoległych Clarin-PLStrategicznym celem naukowym Clarin ERIC i Clarin-PL jest wspieranie badań humanistycznych w wielokulturowej i wielojęzycznej Europie. Dla polskich badaczy ważna jest budowa pomostu między językiem polskim, polskimi technologiami językowymi a innymi językami europejskimi i na ich rzecz opracowanymi technologiami językowymi. Dotychczas w nauce polskiej największy nacisk był kładziony na powiązania polsko-angielskie. Clarin-PL opracowuje zatem pierwsze jak dotąd wielojęzyczne korpusy języka polskiego w zestawieniu z innymi językami słowiańskimi oraz z językiem litewskim: Korpus równoległy polsko-bułgarsko-rosyjski i Korpus równoległy polsko-litewski. Tworzone przez Zespół Lingwistyki Korpusowej i Semantyki (IS PAN) korpusy równoległe przełamują dotychczasowe „kanony” i udostępniają nauce powiązane wielojęzyczne zasoby – w pierwszym etapie ograniczone do języków trzech grup słowiańskich oraz języka litewskiego. W artykule autorzy przedstawiają bardzo szczegółową informację o zastosowanej po raz pierwszy w literaturze przedmiotu anotacji semantycznej dotyczącej kwantyfikacji zakresowej w wielojęzycznych korpusach równoległych. Z powodu swojego rozległego zakresu i nowatorstwa ta anotacja semantyczna jest nanoszona ręcznie. Identyfikacja poszczególnych wartości kwantyfikacji zakresowej w zdaniu oraz przedstawiane tu próby jej zapisu są poparte wieloletnimi badaniami międzynarodowego zespołu lingwistów i matematyków-informatyków opracowujących zagadnienie kwantyfikacji imion, czasu i aspektu w językach naturalnych.
Źródło:: Studia z Filologii Polskiej i Słowiańskiej; 2016, 51
2392-2435
0081-7090
Pojawia się w:: Studia z Filologii Polskiej i Słowiańskiej
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 3.

Tytuł:: Rusycystyczne zasoby i narzędzia CLARIN-PL
Russian language resources and tools on the Clarin-Pl website
Русскоязычные ресурсы и инструменты на сайте CLARIN-PL
Autorzy:: Roszko, Roman
Powiązania:: https://bibliotekanauki.pl/articles/2085223.pdf
Data publikacji:: 2022-03-14
Wydawca:: Polskie Towarzystwo Rusycystyczne
Tematy:: CLARIN-PL
параллельные корпусы c русским языком
ресурсы и инструменты обработки естественного языка
CLARIN-
korpusy równoległe z językiem rosyjskim
narzędzia i usługi NLP
CLARIN-PL, parallel corpora with Russian, NLP tools and resources
NLP tools and resources
parallel corpora with Russian
Opis:: W artykule skupiono się na zasobach wielojęzycznych, obejmujących język rosyjski, które zostały już stworzone i są obecnie rozwijane przez konsorcjum CLARIN-PL. W artykule omówiono również narzędzia i usługi oferowane użytkownikom zainteresowanym analizą zasobów rosyjskojęzycznych.
Статья посвящена многоязычным ресурсам, включающим в себя и русский язык, которые уже ранее были созданы и которые в настоящее время находятся в процессе разработки консорциумом CLARIN-PL. В статье также рассматриваются предлагаемые пользователям, заинтересованным в анализе русскоязычных ресурсов, инструменты и услуги.
In this article I present multilingual resources with Russian language already created and currently being constructed by CLARIN-PL consortium. I also introduce the tools and services offered by this consortium for users interested in analysing Russian-language resources.
Źródło:: Przegląd Rusycystyczny; 2022, 1(177); 153-176
0137-298X
Pojawia się w:: Przegląd Rusycystyczny
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 4.

Tytuł:: Prolegomena do tagоwania frazemów w równoległym korpusie rosyjsko-polskim (literatura piękna) w aspekcie przekładoznawczym
Prolegomena for tagging of phrasemes in a parallel Russian-Polish corpus (literature) in translation studies
Autorzy:: Fedorushkov, Yury
Powiązania:: https://bibliotekanauki.pl/articles/481965.pdf
Data publikacji:: 2018-06-30
Wydawca:: Uniwersytet Warmińsko-Mazurski w Olsztynie
Tematy:: annotation tool brat v1.3
tags for phrasemes
Verb-Noun constructions; parallelization of Russian and Polish sentences; parallel corpora
Opis:: This article considers tagging methods for parallel Russian-Polish phrasemathic objects. In particular, an opinion about the annotation tool brat v1.3.is given. This online tool offers a palette of possibilities for classifying words and phrases in parallel texts. Working with this software is largely simplified by a user-friendly interface, and therefore working with the corpus does not cause difficulties for philologists and translators who do not have programming skills. As an example of such a classification, the layout of the metadata system for tagging Russian and Polish parallel phrasemes is described. These resources allow experience to be gathered and concurrent objects to be categorized in the workshop of a translator. As an example, the article presents the tagging of Verb-Noun of the text classified as collocation phrasemes, for example, погасить свет. The status of Verb-Noun constructions is also discussed, which, according to a number of factors, relate to autonomous phrases, although with the status of “free compatibility”, for example, поехать в клуб. A number of recommendations is proposed for the configuration of parallel texts at the level of single sentences.
Źródło:: Acta Polono-Ruthenica; 2018, 2, XXIII; 55-73
1427-549X
Pojawia się w:: Acta Polono-Ruthenica
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 5.

Tytuł:: Korpus równoległy a ekwiwalentyzacja
PARALLEL CORPUS AND EQUIVALENCING
ПАРАЛЛЕЛЬНЫЙ КОРПУС И ЭКВИВАЛЕНТНОСТЬ
Autorzy:: Charciarek, Andrzej Paweł
Powiązania:: https://bibliotekanauki.pl/articles/2085220.pdf
Data publikacji:: 2022-03-14
Wydawca:: Polskie Towarzystwo Rusycystyczne
Tematy:: параллельный корпус
перевод
эквивалентизация
эквивалентность
польский
русский
чешский
korpus równoległy
przekład
ekwiwalentyzacja
ekwiwalencja
polski
rosyjski
czeski
parallel corpora
translation
equivalencing
equivalence
Polish
Russian
Czech
Opis:: Niniejszy artykuł poświęcony jest możliwościom wykorzystania polsko-rosyjskiego korpusu równoległego InterCorp w procesie ustanawiania ekwiwalencji przekładowej. Przybliżono zasoby i funkcje InterCorp, ze szczególnym uwzględnieniem jego użytkownika rusycysty. Wskazano jego wzrastającą przydatność w badaniach lingwistycznych i translatorskich. Szczególną uwagę zwrócono na proces dochodzenia do ekwiwalentów –ekwiwalentyzację. W procesie tym istotną rolę przypisano korpusowi równoległemu, umożliwiającemu znajdowanie rozwiązań tłumaczeniowych nierzadko przekraczających możliwości jednego tłumacza czy leksykografa przekładowego. Tekst posłużył również do głębszej refleksji nad znaczeniem i perspektywami badań empirycznych we współczesnym językoznawstwie.
Настоящая статья посвящена возможностям использования польско-русского параллельного корпуса InterCorp в процессе установления переводных эквивалентов. В статье проанализированы тексты и функции InterCorp с учётом его пользователя – русиста. Подчеркнута полезность InterCorp в лингвистических исследованиях и в процессе перевода. Особое внимание уделяется установлению эквивалентов – эквивалентизации. В этом процессе существенную роль играет параллельный корпус, делающий возможным нахождение переводческих решений, которые нередко превосходят возможности единичного переводчика или переводного лексикографа. Текст послужил также основой для рассуждений о значении и перспективах эмпирических исследований в современном языкознании.
The article is devoted to possibilities of using the InterCorp Polish-Russian paralel corpus in the process of searching for translations equivalents. It also presents resources and functionalities of the InterCorp, and concentrates on how it can be used by by Russian philologists. It is increasingly useful in linguistic and translatological research. A particular focus is put on the process of equivalencing i.e. searching for and establishing equivalents and a significant role of the parallel corpus which allows for finding appropriate translation solutions that sometimes can pose a problem for a single translator or lexicographer. The article also presents a deeper reflection on the significance and prospects of empirical research in the contemporary linguistics.
Źródło:: Przegląd Rusycystyczny; 2022, 1(177); 55-73
0137-298X
Pojawia się w:: Przegląd Rusycystyczny
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 6.

Tytuł:: O nowych ręcznie zrównoleglonych i znakowanych dwujęzycznych korpusach równoległych oraz ich zastosowaniach
On New Manually Aligned and Tagged Bilingual Parallel Corpora and Their Applications
Autorzy:: Roszko, Roman
Powiązania:: https://bibliotekanauki.pl/articles/38439906.pdf
Data publikacji:: 2021
Wydawca:: Polska Akademia Nauk. Instytut Slawistyki PAN
Tematy:: ręcznie zrównoleglone i znakowane dwujęzyczne korpusy równoległe
język litewski
języki słowiańskie
narzędzia językowe
CLARIN-PL
manually aligned and tagged bilingual parallel corpora
Lithuanian language
Slavic languages
language tools
Opis:: This article is devoted to the manually aligned and tagged bilingual parallel CLARIN-PL-BIZ corpora of the Baltic and Slavic languages which are currently being developed. The study discusses the essential features of these corpora that make their applications go far beyond typical corpus analysis. Applications of these corpora include the design of cross-language models for the development of machine translation and artificial intelligence. The article also draws attention to the high potential of these resources as a model training base for testing natural language processing tools.
W artykule autor opisuje obecnie powstające ręcznie zrównoleglone i znakowane dwujęzyczne korpusy równoległe CLARIN-PL-BIZ języków bałtyckich i słowiańskich. Omawia wyróżniające cechy tych korpusów, które sprawią, że zastosowania tych korpusów znacznie wykroczą poza typowe analizy korpusowe. Wśród zastosowań tych korpusów autor wymienia definiowanie modeli międzyjęzykowych na rzecz rozwoju przekładu maszynowego i rozwoju sztucznej inteligencji. Zwraca również uwagę na wysoki potencjał tych zasobów jako wzorcowej bazy treningowej do testowania narzędzi przetwarzania języka naturalnego.
Źródło:: Acta Baltico-Slavica; 2021, 45
2392-2389
0065-1044
Pojawia się w:: Acta Baltico-Slavica
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Informacja

Wyszukujesz frazę "corpora (parallel" wg kryterium: Temat

Źródło danych

Dostawca treści

Kolekcja

Rok wydania

Wydawca

Temat

Autor

Typ dokumentu

Język