Přejít k hlavnímu obsahu

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

Corpus of Czech Students’ Spoken English
Rok: 2015
Druh publikace: ostatní do riv
Strana od-do: nestránkováno
Tituly:
Jazyk Název Abstrakt Klíčová slova
cze Korpus mluveného jazyka českých studentů Korpus mluveného jazyka českých studentů – Corpus of Czech Students’ Spoken English (CCSSE) – obsahuje 153.295 slov přepsaných monologů a dialogů 228 studentů prvního ročníku tří českých univerzit. Je k dispozici ve formě CD-ROM, který doprovází stručná brožura popisující jeho tvorbu a strukturu. CCSSE zahrnuje 570 samostatných textů, t.j. 228 monologů, 228 dialogů založených na úkolu zjišťování informací a 114 diskusí na stanovené téma. Texty jsou uloženy ve formátu .txt souborů, aby bylo možné s nimi pracovat za pomoci běžně dostupných konkordančních programů. Všechny jsou na CD uloženy na dvou místech: (a) ve složce nazvané „text files“ v jednotlivých podsložkách pojmenovaných podle čísla nahrávky, což umožňuje vybírat texty ručně podle různých kritérií (obdobný systém jako v Britském národním korpusu), (b) ve složce s názvem „data“ odkud mohou být filtrovány prostřednictvím Access databáze nazvané CCSSE. Databáze umožňuje vybírat texty podle různých proměnných a tím poskytuje materiál pro různé srovnávací studie. Nahrávky byly přepsány způsobem záznamu psaného textu a jsou minimálně anotovány, základní systém značek byl převzat z mezinárodního korpusu mluvené angličtiny LINDSEI. Vytvoření tohoto korpusu bylo motivováno snahou provést podrobnou analýzu vybraných rysů z oblasti gramatiky, diskurzu a výslovnosti s cílem osvětlit procesy osvojování si druhého jazyka a případně odhalit vliv mateřského jazyka na mluvený projev vysokoškolských studentů. žákovský korpus; osvojování si druhého jazyka; mluvený jazyk; monolog; dialog
eng Corpus of Czech Students’ Spoken English Corpus of Czech Students’ Spoken English (CCSSE) contains 153,295 words from transcribed monologues and dialogues by 228 first-year students at three Czech universities. It is made available in the format of a CD-ROM release, accompanied by a concise book describing the corpus. The CCSSE corpus comprises 570 individual texts, i.e. 228 monologues, 228 dialogues based on the information gap tasks and 114 discussions on given topics. The texts are saved in the form of .txt files in order to be processed with the common concordance tools available. On the CD they are stored in two places: (a) in a folder named “text files”, where they are stored in sub-folders, which enables a manual choice according to the number of a recording or some other additional criteria (a similar form as in the British National Corpus), and (b) in a folder named “data”, from which they can be searched through the Access database called CCSSE. The database enables researchers to sort texts according to individual variables and thus carry out various comparative studies. The recordings were transcribed orthographically with minimal tagging, some of the conventions were adapted from LINDSEI. The primary objective of creating this corpus is motivated by the attempt to make an analysis of selected grammatical, discourse and pronunciation features with conclusions for second language acquisition processes including the connection with the students’ mother tongue and possible negative transfer of Czech language. learner corpus; second language acquisition; spoken language; monologue; dialogue