Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "corpus data" wg kryterium: Temat


Wyświetlanie 1-13 z 13
Tytuł:
Badanie pola tematycznego z zakresu stroju ludowego na podstawie danych z Korpusu Spiskiego
Research into the lexis in the field of folk costumes based on the Spiš Dialect Corpus data.
Autorzy:
Grochola-Szczepanek, Helena
Powiązania:
https://bibliotekanauki.pl/articles/1854200.pdf
Data publikacji:
2021-12-10
Wydawca:
Poznańskie Towarzystwo Przyjaciół Nauk
Tematy:
thematic vocabulary
folk costume
corpus data
pole tematyczne
strój ludowy
badania korpusowe
Opis:
Celem artykułu jest omówienie leksyki z zakresu stroju ludowego, utrzymującej się współcześnie w mowie mieszkańców Spisza. Powszechnie wiadomo, że archaiczne nazwy zanikają wraz z wymieraniem tradycyjnych form życia wiejskiego, a ich miejsce zastępują nowe, ogólne określenia. Dane do badania pola tematycznego pochodzą z Korpusu Spiskiego. Otrzymane wyniki stanowią zbiór ok. 150 nazw elementów stroju ludowego. W opisie stosuje się podział na makro- i mikropola w obrębie stroju męskiego oraz kobiecego. Leksyka zróżnicowana jest pod względem formalnym, semantycznym, geograficznym oraz frekwencyjnym.
The purpose of the article is to discuss the names of folk costumes from contemporary speech of the inhabitants of Spiš in Poland. It is common knowledge that as the traditional forms of rural life disappear, so do archaic names replaced by new, more general terms.The data come from the Spiš Dialect Corpus. The obtained results consist of a collection of about 150 names of elements of folk costumes. The description is divided into thematic fields concerning men’s and women’s outfits. The names vary in terms of formality, semantics, geography and frequency.
Źródło:
Gwary Dziś; 2021, 14; 81-94
1898-9276
Pojawia się w:
Gwary Dziś
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Etnolingwistyka daleka i bliska
Autorzy:
Głaz, Adam
Powiązania:
https://bibliotekanauki.pl/articles/611827.pdf
Data publikacji:
2015
Wydawca:
Uniwersytet Marii Curie-Skłodowskiej. Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej
Tematy:
ethnolinguistics, ethnography, abduction, salience, corpus, textual data
etnolingwistyka
etnografia
abdukcja
wyrazistość
korpus
dane tekstowe
Opis:
Lublin ethnolinguistics, its value and possibilities of promotion in a broader international context, must be seen against the backdrop of comparable approaches (not necessarily functioning under the same name) proposed in Western linguistics or drawing inspiration from Western scholarship. The latter is represented in the present volume by articles authored by Gary B. Palmer, Bert Peeters, Irena Vanková, and Przemysław Łozowski and Anna Włodarczyk-Stachurska, all being discussed in this introductory survey.Next, ideas are proposed for future action aimed at popularizing Lublin ethnolinguistics in the West, as well as establishing networks of collaborators from Western countries.
Autor stwierdza, że sytuację lubelskiej etnolingwistyki, jej wartość i możliwość zaistnienia w szerszym kontekście międzynarodowym, należy postrzegać na tle zbliżonych koncepcji językoznawczych (niekoniecznie funkcjonujących pod tą samą nazwą) wypracowanych w świecie zachodnim lub czerpiących z zachodnich tradycji lingwistycznych. Reprezentują je publikowane w niniejszym tomie „Etnolingwistyki” (27) artykuły autorstwa Gary’ego Palmera, Berta Peetersa, Ireny Vankovej oraz Przemysława Łozowskiego i AnnyWłodarczyk-Stachurskiej, które autor omawia. Postuluje podjęcie działań mających na celu promocję myśli lubelskiej na Zachodzie oraz pozyskanie do współpracy badaczy stamtąd.
Źródło:
Etnolingwistyka. Problemy Języka i Kultury; 2015, 27
0860-8032
Pojawia się w:
Etnolingwistyka. Problemy Języka i Kultury
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Partial Perception and Approximate Understanding
Autorzy:
Lewandowska-Tomaszczyk, Barbara
Powiązania:
https://bibliotekanauki.pl/articles/620916.pdf
Data publikacji:
2017
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
almost resemblance
approximating strategies
Cluster Equivalence
collocations
corpus data
displacement of senses
meaning approximation
more-or-less resemblance
re-conceptualization (reconceptualization)
Resemblance Matrix
tolerance threshold
Opis:
What is discussed in the present paper is the assumption concerning a human narrowed sense of perception of external world and, resulting from this, a basically approximate nature of concepts that are to portray it. Apart from the perceptual vagueness, other types of vagueness are also discussed, involving both the nature of things, indeterminacy of linguistic expressions and psycho-sociological conditioning of discourse actions in one language and in translational contexts. The second part of the paper discusses the concept of conceptual and linguistic resemblance (similarity, equivalence) and discourse approximating strategies and proposes a Resemblance Matrix, presenting ways used to narrow the approximation gap between the interacting parties in monolingual and translational discourses.
Źródło:
Research in Language; 2017, 15, 2; 129-152
1731-7533
Pojawia się w:
Research in Language
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A CORPUS-BASED ANALYSIS OF THE MOST FREQUENT ADJECTIVES IN ACADEMIC TEXTS
Autorzy:
Kartal, Galip
Powiązania:
https://bibliotekanauki.pl/articles/955644.pdf
Data publikacji:
2017
Wydawca:
Uniwersytet Marii Curie-Skłodowskiej w Lublinie. IATEFL Poland Computer Special Interest Group
Tematy:
Data-Driven Learning
corpus linguistics
COCA
Opis:
Based on a mega corpus, The Corpus of Contemporary American English (COCA), this study aims to determine the most frequent adjectives used in academic texts and to investigate whether these adjectives differ in frequency and function in social sciences, technology, and medical sciences. It also identifies evaluative adjectives from a list of a hundred most frequently used adjectives. A total of 839 adjectives, which comprises the list of frequently used adjectives in COCA, were searched using a search engine. 334 of the adjectives were found to appear more frequently in the academic sub-corpus than in other sub-corpora (spoken, fiction, magazine, and newspaper). There was only one adjective that was used more frequently in technology and medical sciences than in social sciences. Some adjectives were very dominant in a specific discipline of academic texts. The frequency of evaluative adjectives in most frequently used 100 adjectives was also listed. It is found that almost 40% percent of the adjectives are evaluative. The results of the study were discussed in terms of frequency effects in language learning and writing in the foreign language as providing learners with corpus data may improve language knowledge and the correct use of adjectives.
Źródło:
Teaching English with Technology; 2017, 17, 3; 3-18
1642-1027
Pojawia się w:
Teaching English with Technology
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Construction of a medical corpus based on information extraction results
Autorzy:
Marciniak, M.
Mykowiecka, A.
Powiązania:
https://bibliotekanauki.pl/articles/206379.pdf
Data publikacji:
2011
Wydawca:
Polska Akademia Nauk. Instytut Badań Systemowych PAN
Tematy:
corpus
semantic annotation
clinical data
information extraction
Opis:
The paper presents a method of automatic construction of a semantically annotated corpus using the results of a rulebased information extraction (IE) application. Construction of the corpus is based on using existing programs for text tokenization and morphological analysis and combining their results with domain related correction rules. We reuse the specialized IE system to obtain a corpus annotated on the semantic level. The texts included within the corpus are Polish free text clinical data. We present the documents - diabetic patients' discharge records, the structure of the corpus annotation and the methods for obtaining the annotations. Initial evaluations based on the results of manual verification of selected data subset are also presented. The corpus, once manually corrected, is designed to be used for developing supervised machine learning models for IE applications.
Źródło:
Control and Cybernetics; 2011, 40, 2; 337-360
0324-8569
Pojawia się w:
Control and Cybernetics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
English Language Error Analysis of the Written Texts Produced by Ukrainian Learners: Data Collection
Autorzy:
Kotsyuk, Lessia Mykolayivna
Powiązania:
https://bibliotekanauki.pl/articles/677027.pdf
Data publikacji:
2015
Wydawca:
Polska Akademia Nauk. Instytut Slawistyki PAN
Tematy:
corpus
data
English language
error
error analysis
Ukrainian learner
Opis:
English Language Error Analysis of the Written Texts Produced by Ukrainian Learners: Data CollectionRecently, the studies of second language acquisition have tended to focus on learners errors as they help to predict the difficulties involved in acquiring a second language. Thus, teachers can be made aware of the difficult areas to be encountered by the students and pay special attention and devote emphasis to them. The research goals of the article are to define what error analysis is and how it is important in L2 teaching process, to state the significance of corpus studies in identifying of different types of errors and mistakes, to provide the results of error analysis of the corpus of written texts produced by Ukrainian learners. In this article, major types of errors in English as a second language for Ukrainian students are mentioned.
Źródło:
Cognitive Studies; 2015, 15
2392-2397
Pojawia się w:
Cognitive Studies
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Sourcing Data from Wikipedia for the Study of Language Contact: the csbwiki
Autorzy:
Borges, Robert
Powiązania:
https://bibliotekanauki.pl/articles/2233989.pdf
Data publikacji:
2022-12-29
Wydawca:
Komisja Nauk Filologicznych Polskiej Akademii Nauk, Oddział we Wrocławiu
Tematy:
contact-induced language change
wiki data
Kashubian
corpus linguistics
vowel alternation
Opis:
Contact-induced language change is pervasive in contexts involving historically minoritized languages, where social contexts are not particularly conducive to equitable intergroup relations. Empirically driven studies involving these language contexts allow us to more thoroughly understand the social and cognitive processes that lead to language change. Paradoxically, empirical data on minoritized languages is relatively scarce and expensive to generate. But in the digital age we have the ability to look beyond the traditional data types used in language studies, like spoken data gathered under fieldwork conditions, literature, etc. In this paper, I will explore the potential utility of user-created wiki data in investigating Polish influence on the Kashubian language.
Źródło:
Academic Journal of Modern Philology; 2022, Special Issue, 18; 7-22
2299-7164
2353-3218
Pojawia się w:
Academic Journal of Modern Philology
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Bulgarian-Polish Language Resources (Current State and Future Development)
Autorzy:
Dimitrova, Ludmila
Koseska-Toszewa, Violetta
Powiązania:
https://bibliotekanauki.pl/articles/677220.pdf
Data publikacji:
2013
Wydawca:
Polska Akademia Nauk. Instytut Slawistyki PAN
Tematy:
digital bilingual resources
parallel corpus
aligned corpus
lexical data base
paper and digital dictionary
online dictionary
digital entry classifiers
Opis:
Bulgarian-Polish Language Resources (Current State and Future Development)The paper briefly reviews the first Bulgarian-Polish digital bilingual resources: corpora and dictionaries, which are currently developed under bilateral collaboration between IMI-BAS and ISS-PAS: joint research project “Semantics and contrastive linguistics with a focus on a bilingual electronic dictionary”, coordinated by L. Dimitrova (IMI-BAS) and V. Koseska (ISS-PAS).
Źródło:
Cognitive Studies; 2013, 13
2392-2397
Pojawia się w:
Cognitive Studies
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Recomendaciones para la confección de un corpus oral válido para el análisis fonético
Suggestions for building an accurate oral corpus to phonetics analysis
Autorzy:
Polo Cano, Nuria
Powiązania:
https://bibliotekanauki.pl/articles/676249.pdf
Data publikacji:
2018
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
corpus orales
análisis fonético
habla real
grabaciones
explotación de los datos.
oral corpus
analysis of phonetics
natural speech
recordings
data-mining
Opis:
Mistakes are often made when an oral corpus is collected and sometimes these mistakes could make impossible a future phonetic analysis of the data. To avoid this happen some advices are proposed in this paper regarded to participants, to recordings, and to available tools in order to build an oral corpus. The purpose of this paper is to advice future researchers in building this kind of corpus. These advices will help them to build an accurate corpus to phonetics analysis following current scientific quality standards.
A menudo se cometen errores en la recogida y tratamiento de datos para la confección de un corpus oral, que en ocasiones pueden llegar hasta imposibilitar un posible análisis fonético posterior. Para evitar esto se proponen en estas páginas una serie de consejos previos relativos a los participantes, a las grabaciones y a las herramientas de construcción del corpus; todo ello con la idea de aconsejar al investigador a la hora de construir un corpus oral. Estos consejos le ayudarán a construir un corpus que permita el análisis fonético adecuado con los estándares de calidad científica actuales.
Źródło:
e-Scripta Romanica; 2018, 5; 71-79
2392-0718
Pojawia się w:
e-Scripta Romanica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Web-based Digital Lexicographic Bilingual Resources
Autorzy:
Dutsova, Ralitsa
Powiązania:
https://bibliotekanauki.pl/articles/676996.pdf
Data publikacji:
2015
Wydawca:
Polska Akademia Nauk. Instytut Slawistyki PAN
Tematy:
web-application
bilingual resources
lexicographic resources
digital resources
dictionary
aligned corpus
data mining
Opis:
Web-based Digital Lexicographic Bilingual ResourcesThe paper presents briefly a web-based system for creation and management of bilingual resources with Bulgarian as one of the paired language. This is useful and easy to use tool for collection and management of a large amount of different linguistic knowledge. The system uses two sets of natural language data: bilingual dictionary and aligned text corpora
Źródło:
Cognitive Studies; 2015, 15
2392-2397
Pojawia się w:
Cognitive Studies
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Web-based software system for processing bilingual digital resources
Autorzy:
Dutsova, Ralitsa
Powiązania:
https://bibliotekanauki.pl/articles/677188.pdf
Data publikacji:
2014
Wydawca:
Polska Akademia Nauk. Instytut Slawistyki PAN
Tematy:
aligned corpus
concordance
data mining
dictionary entry
digital dictionary
search tool
web-interface
web-application
Opis:
Web-based software system for processing bilingual digital resourcesThe article describes a software management system developed at the Institute of Mathematics and Informatics, BAS, for the creation, storing and processing of digital language resources in Bulgarian. Independent components of the system are intended for the creation and management of bilingual dictionaries, for information retrieval and data mining from a bilingual dictionary, and for the presentation of aligned corpora. A module which connects these components is also being developed. The system, implemented as a web-application, contains tools for compilation, editing and search within all components.
Źródło:
Cognitive Studies; 2014, 14
2392-2397
Pojawia się w:
Cognitive Studies
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The OpenCitations Corpus : an open citations database for scientific publications (as of 2018)
OpenCitations Corpus: otwarta baza danych cytowań publikacji naukowych (stan na 2018 r.)
Autorzy:
Kamińska, Anna Małgorzata
Powiązania:
https://bibliotekanauki.pl/articles/541444.pdf
Data publikacji:
2018
Wydawca:
Akademia Wychowania Fizycznego im. Jerzego Kukuczki w Katowicach
Tematy:
bibliografia załącznikowa
bibliometria
indeks cytowań
linked open data
OpenCitations Corpus
otwarty dostęp
RDF
źródła danych
citation index
bibliometrics
data sources
open access
bibliographic references
Opis:
Despite the increasingly popular sharing of scientific knowledge by open access and other “Science 2.0” concepts, scientific papers published in this way are still only “complementary” activities of researchers. This is especially true in cases where the evaluation of scientific activity is based on “strict” bibliometric indicators calculated on the basis of “recognized” data sources, which usually gather information only about works published by “prestigious” publishers. Calculation of similar metrics for publishers / platforms supporting publishing under the “Science 2.0” concepts is currently hampered by the difficulty in calculating the cumulative value of the metrics presented on various platforms. This article presents the OpenCitations Corpus, which uses recognized standards, employs the leading bibliographic ontologies, and collects and provides citation data in the form of linked open data graph structures. Open standards and free access to its collected data make the OpenCitations initiative an interesting direction for the integration of different citation data sources, allowing for cumulative / global metrics to be calculated, and the ability to download the entire corpus of data from this database will open the prospects for conducting more sophisticated bibliometric studies by interested researchers.
Pomimo coraz bardziej popularnego dokumentowania badań naukowych i dzielenia się wiedzą na zasadach otwartego dostępu oraz upowszechniania innych koncepcji związanych z „Nauką 2.0”, publikowane w ten sposób prace naukowe stanowią jedynie „uzupełniające” działania naukowców. Dzieje się tak zwłaszcza w przypadkach, gdy ocena działalności badawczej opiera się na „twardych” wskaźnikach bibliometrycznych obliczanych na podstawie „uznanych” źródeł danych, które gromadzą informacje jedynie o pracach publikowanych przez „prestiżowe” wydawnictwa. Wyliczanie podobnych wskaźników dla wydawców/platform wspierających publikowanie zgodne z koncepcjami „Nauki 2.0” jest obecnie utrudnione ze względu na problemy w obliczaniu łącznej wartości będącej wypadkową wartości wskaźników prezentowanych na różnych platformach. W artykule przedstawiono inicjatywę OpenCitations Corpus, która korzysta z uznanych standardów i stosuje wiodące ontologie bibliograficzne oraz gromadzi i udostępnia dane w postaci struktur grafów cytowań. Otwarte standardy i swobodny dostęp do gromadzonych danych sprawiają, że inicjatywa OpenCitations jest interesującym kierunkiem integracji różnych źródeł danych o cytowaniach, umożliwiającym obliczanie skumulowanych/globalnych wskaźników, a możliwość pozyskania całego korpusu zgromadzonych danych otwiera perspektywy dla prowadzenia bardziej zaawansowanych badań bibliometrycznych przez zainteresowanych badaczy.
Źródło:
Bibliotheca Nostra. Śląski Kwartalnik Naukowy; 2018, 1(51); 127-137
2084-5464
Pojawia się w:
Bibliotheca Nostra. Śląski Kwartalnik Naukowy
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Корпус української мови - комп’ютерна експертна система лінгвістичного аналізу українськомовного тектсу
Ukrainian Language Corpus – Computer Expert System of Linguistic Analysis of Ukrainian Text
Korpus języka ukraińskiego – komputerowy ekspercki system analizy językowej tekstu ukraińskojęzycznego
Autorzy:
Zubań, Oksana
Powiązania:
https://bibliotekanauki.pl/articles/1048661.pdf
Data publikacji:
2019-12-05
Wydawca:
Katolicki Uniwersytet Lubelski Jana Pawła II
Tematy:
Корпус української мови
Електронний частотний словник
база даних
автоматичний лінгвістичний аналіз
Korpus języka ukraińskiego
Elektroniczny słownik frekwencyjny
baza danych
automatyczna analiza lingwistyczna
Ukrainian Language Corpus
Electronic Frequency Dictionary
Data Base
automatic linguistic analysis
Opis:
У статті представлено структуру та засади автоматичного укладання експертної системи лінгвістичного аналізу "Корпус української мови". Методика формалізованого опису мовних одиниць тексту, запропонована у створенні Корпусу, забезпечує проведення автоматичного морфологічного, морфемного, синтаксичного, семантичного аналізів українськомовного тексту, а також автоматичне укладання різноманітних електронних частотних словників за текстовими вибірками.
Celem niniejszego artykułu jest przedstawienie struktur i zasad automatycznego tworzenia eksperckiego systemu analizy lingwistycznej „Korpus Języka Ukraińskiego”. Zaproponowana podczas tworzenia Korpusu metodologia sformalizowanego opisu językowych jednostek tekstu zapewnia możliwość przeprowadzenia automatycznej morfologicznej, morfemowej, syntaktycznej i semantycznej analizy tekstu ukraińskojęzycznego, jak również automatyczne tworzenie różnorakich elektronicznych słowników frekwencyjnych z wyborem tekstów.
The article deals with the structure and the principles of automatic compiling of expert linguistic analysis system called Ukrainian Language Corpus. The methodology of formalised description of language text units, suggested in creating the Corpus, carries out automatic morphological, morphemic, syntactic, and semantic analyses of Ukrainian texts as well as automatically compiling different Frequency Dictionaries according to text samples.
Źródło:
TEKA Komisji Polsko-Ukraińskich Związków Kulturowych; 2018, 5, 13; 191-206
1733-2249
Pojawia się w:
TEKA Komisji Polsko-Ukraińskich Związków Kulturowych
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-13 z 13

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies