漢語(yǔ)中介語(yǔ)語(yǔ)料庫(kù)
漢語(yǔ)中介語(yǔ)語(yǔ)料庫(kù)由北京語(yǔ)言大學(xué)于1992年開(kāi)始建設(shè)。該語(yǔ)料庫(kù)立足于漢語(yǔ)教學(xué)已收錄1635位外國(guó)學(xué)生共5774篇成篇成段的漢語(yǔ)作文或練習(xí)材料,總字?jǐn)?shù)約353萬(wàn),其中1731 篇約104萬(wàn)字的語(yǔ)料經(jīng)過(guò)斷句、分詞和詞性標(biāo)注等加工處理。目前該漢語(yǔ)中介語(yǔ)料庫(kù)仍處于努力建設(shè)過(guò)程中,北京語(yǔ)言大學(xué)仍然努力于建設(shè)全球漢語(yǔ)中介語(yǔ)語(yǔ)料庫(kù),其規(guī)模預(yù)計(jì)達(dá)5000萬(wàn)字,包括筆語(yǔ)語(yǔ)料、口語(yǔ)語(yǔ)料和多模態(tài)子庫(kù)。筆語(yǔ)語(yǔ)料規(guī)模預(yù)計(jì)達(dá)4500萬(wàn)字,其中2000萬(wàn)字將加工成為熟語(yǔ)料;口語(yǔ)語(yǔ)料450小時(shí),約合400萬(wàn)字;多模態(tài)語(yǔ)料110小時(shí),約合100萬(wàn)字。