- Tytuł:
-
Błędy programu do obróbki korpusu, podczas badań korpusowych słownictwa biznesowego i prawnego w języku wietnamskim, na przykładzie programu AntConc
Errors of corpus research software while researching business and legal corpus of Vietnamese language, the example of AntConc software - Autorzy:
- Królczyk, Jakub
- Powiązania:
- https://bibliotekanauki.pl/articles/916637.pdf
- Data publikacji:
- 2014-01-01
- Wydawca:
- Uniwersytet im. Adama Mickiewicza w Poznaniu
- Tematy:
-
cults of ancestors
AntConc
corpus linguistics
translatology
kult przodków
językoznawstwo korpusowe
translatologia - Opis:
-
Badania korpusowe, jak i językoznawstwo korpusowe są dość młodymi dziedzinami nauki, są też według niektórych najszybciej rozwijającymi się metodą badawczą językoznawstwa. W badaniach korpusowych wykorzystuje się korpusy tekstów i specjalne oprogramowania komputerowe. Oprogramowanie to może być darmowe albo płatne, niestety, nie ważne, na jakie oprogramowanie się zdecydujemy, mogą pojawić się błędy lub program może mieć małą skuteczność. Niska skuteczność programu AntConc jest widoczna podczas badania korpusów języków izolujących. Po wprowadzeniu do programu AntConc korpusu, składającego się z 18 pozycji w języku wietnamskim (tj. 290 stron maszynopisu), poświęconych zagadnieniom zarządzania i prawa, program przedstawiał błędne wyniki. Począwszy od policzenia ilości słów i wytypowaniu jakie pojawiają się najczęściej do tworzenia list konkordancji. Istnieje kilka sposobów na zaradzeniu takiej sytuacji, pierwszą metodą jest „nauczenie” programu AntConc czytania języka wietnamskiego innymi słowy wprowadzenie listy słów które występują w języku wietnamskim. Inną metodą, znacznie trudniejszą i wymagającą dużego nakładu pracy, jest zamiana spacji między sylabami na inny znak który nie był by czytany jako odstęp między słowami przez program AntConc. Jeżeli by zastosować jedną z wyżej wymienionych metod, program ten miał by bardzo wysoką sprawność gdyż język wietnamski nie posiada końcówek fleksyjnych i jest typowym językiem SVO.
On the one hand corpus research and corpus linguistics are relatively new fields of science but on the other hand, according to some people, there are one of fastest developing methods of linguistic research. To perform a corpus research, it is necessary to have a text corpus and a proper kind of software. The range of software kinds is wide and its easy to find free of charge on or license based software. Nevertheless, what the choice is, it is possible to encounter problems or the software will have low efficiency. Low efficiency of AntConc can be seen while researching a corpus compiled from an isolating language. After processing the corpus, consisting of 18 text items in the Vietnamese language (that is 290 pages of typescript) dedicated to the field of management and law, the software outputted incorrect results. Starting with counting the number of words in a corpus and ending with concordance plotting. There are two ways to deal with this problem. The method involves “teaching” AntConc how to read the Vietnamese language, in other words it is necessary to input a list of all words in the Vietnamese language. The second method is more time consuming because it involves replacing the spaces between syllables to a sign that will not be recognized by the software as a space. Using one of these methods could potentialy end in raising AntConc efficiency. - Źródło:
-
Investigationes Linguisticae; 2014, 31; 5-17
1426-188X
1733-1757 - Pojawia się w:
- Investigationes Linguisticae
- Dostawca treści:
- Biblioteka Nauki