|
類型 |
語料庫名稱及大小 |
建設(shè)單位 |
|
英語學(xué)習(xí)者語料庫(書面語及口語) |
中國學(xué)習(xí)者語料庫 CLEC(100萬) |
廣外、上海交大 |
|
大學(xué)英語學(xué)習(xí)者口語語料庫 COLSEC (5萬) |
上海交大 |
|
香港科技大學(xué)學(xué)習(xí)者語料庫 HKUST Learner Corpus |
香港科技大學(xué) |
|
中國英語專業(yè)語料庫 CEME (148萬) |
南京大學(xué) |
|
中國英語學(xué)習(xí)者口語語料庫 SECCL (100萬) |
南京大學(xué) |
|
國際外語學(xué)習(xí)者英語口語語料庫中國部分 LINSEI-China (10萬) |
華南師大 |
|
碩士寫作語料庫 MWC (12萬) |
華中科技大學(xué) |
|
平行語料庫 |
漢英平行語料庫 PCCE |
北外 |
|
南大-國關(guān)平行語料庫 |
南京大學(xué) |
|
英漢文學(xué)作品語料庫; |
外研社 |
|
馮友蘭《中國哲學(xué)史》漢英對照語料庫 |
|
李約瑟(Joself Needham)《中國科學(xué)技術(shù)史》英漢對照語料庫 |
|
計算機專業(yè)的雙語語料庫; |
國家語言文字工作委員會語言文字應(yīng)用研究所 |
|
柏拉圖(Plato)哲學(xué)名著《理想國》的雙語語料庫 |
|
英漢雙語語料庫(15萬對) |
中科院軟件所 |
|
英漢雙語語料庫:LDC香港新聞英漢雙語對齊語料36294段以及香港法律英漢雙語對齊語料31萬句子對 |
中國科學(xué)院自動化研究所 |
|
英漢雙語語料庫(100萬),網(wǎng)上英漢語段電子詞典及網(wǎng)上電子英漢搭配詞典(1000萬) |
東北大學(xué) |
|
英漢雙語語料庫(40-50萬句子對) |
哈爾濱工業(yè)大學(xué) |
|
雙語語料庫(5萬多對) |
北京大學(xué)計算語言學(xué)研究所 |
|
對比語料庫 LIVAC(Linguistic variety in Chinese communities) |
香港城市理工大學(xué) |
|
平衡語料庫(Sinica Corpus);樹圖語料庫(Sinica Treebank) |
臺灣 |
|
特殊英語語料庫 |
中國英語(China English)語料庫 |
河南師范大學(xué) |
|
軍事英語語料庫(Corpus of Military Texts) |
解放軍外語學(xué)院 |
|
新視野大學(xué)英語教材語料庫 |
上海交通大學(xué) |
|
漢語語料庫 |
漢語現(xiàn)代文學(xué)作品語料庫(1979年,527萬字) |
武漢大學(xué) |
|
現(xiàn)代漢語語料庫(1983年,2000萬字) |
北京航空航天大學(xué) |
|
中學(xué)語文教材語料庫(1983年,106萬8000字) |
北京師范大學(xué) |
|
現(xiàn)代漢語詞頻統(tǒng)計語料庫(1983年,182萬字) |
北京語言學(xué)院 |
|
國家級大型漢語均衡語料庫(2000萬字) |
國家語言文字工作委員會 |
|
《人民日報》語料庫(2700萬字) |
北京大學(xué)計算機語言學(xué)研究所 |
|
大型中文語料庫(5億字,10分庫) |
北京語言文化大學(xué) |
|
現(xiàn)代漢語語料庫(1億字) |
清華大學(xué) |
|
漢語新聞?wù)Z料庫;(1988年,250萬字) |
山西大學(xué) |
|
標(biāo)準(zhǔn)語料庫(2000年,70萬字) |
|
生語料庫(3000萬字);《作家文摘》的標(biāo)注語料庫(100萬字) |
上海師范大學(xué) |
|
現(xiàn)代自然口語語料庫 |
中國社會科學(xué)院語言所 |
|
旅游咨詢口語對話語料庫和旅館預(yù)定口語對話語料庫 |
中國科學(xué)院自動化所 |