書名選択

三省堂コーパスとは?

本格的にコーパスを活用した国内初の学習英和辞典として2002年に『ウィズダム英和辞典』が発刊されて以来, 様々な分野のユーザーの方々から予想以上の反響をいただいた. この度, ユーザーの方々から寄せられた貴重なご意見やご要望を取り入れるとともに, 発刊以来の英語の変化をいっそう的確に内容に反映すべく, 改訂版を上梓することとなった.  編集にあたっては, 初版同様以下のような点に留意した.

1. コーパスとは

2. 三省堂コーパスとは

3. コーパスの利用

4. コーパス解析の結果

 

 1 コーパスとは

コーパスとは「(特定の種類・作家の文書[資料]の)集大成, 集積」をさす. 現在では, 大量に収集したテキストデータをコンピュータで解析可能なかたちにした, いわゆるコンピュータコーパスをさすことが多い. 辞書の編纂においては伝統的に, 用例カードなど何らかのかたちで「コーパス」的な資料が用いられてきたが, 1980年代後半から英国ではコンピュータコーパスを利用して大量のデータを扱うようになった. 現在, 英国では学習英英辞典のほとんどがコンピュータコーパスを用いて編纂されたものになっている. 日本国内でのコーパス利用は遅れたが, 独自にコーパスを構築した上で編集最初期の段階から全面的にそれに依拠して編纂された学習英和辞典としては, 『ウィズダム英和辞典』(初版)が初めてのものである.

 

 2 三省堂コーパスとは

本辞典の編纂に用いた三省堂コーパスは, 三省堂が独自に開発・構築した, 日本人の英語学習に特化したコンピュータコーパスである.既存のBritish National Corpus (BNC)などの大規模コーパスのみをそのまま利用するのではなく独自のコーパスを構築したのは, 日本人が英語学習に用いる辞書を編纂するという明確な目的が背景にあったからである. 日本人学習者が英語学習の伴侶として用いる辞書は, 2つの領域を射程に入れる必要がある. 1つは, 教科書や入試問題など英語学習の場面でよく出てくる語や表現であり, もう1つは, 英語母語話者との対話を始めとする日常生活や, 英語の新聞・雑誌・書籍・映画にふれる際など, 実際に英語を意思疎通の手段として使用する場面で接する語や表現である. 既存の英国産の大規模コーパスを使う場合, 英国と米国での使用頻度の差や話し言葉と書き言葉の比率を補正する作業が必要になる. また, コーパスの原典となっている資料も書き言葉の割合が高く, 高度な英語運用能力を持つ人には見合うが, 英語を母語としない学習者にとっては敷居の高い表現が多く含まれるきらいがある. そこで, 本当の意味で日本人英語学習者が必要とする英語を配慮したバランスの取れたコーパスの構築を目指した. 三省堂コーパスは, 上述の2つの領域を同時にカバーするために, 新聞・雑誌・カタログ・インタビューなどから, 日常生活で用いられる平易な文体の英語を中心に, 幅広くデータを収集した. その結果, 米6英4, 話し言葉4書き言葉6の比率で構成する数千万語規模のコーパスとなった.

 

 3 コーパスの利用

コーパスを使用して辞典を編集するにあたっては, 検索ツールや統計処理を行うツールなどを駆使して分析を行うが, それによって, 語句の使用頻度, ある語義の構文パターン, 特徴的な連語関係といった言語事実をつかむことができる. たとえば, コンコーダンサーという検索用のソフトウェアを用いて, 視覚的に語連結(コロケーション)の特徴をつかむことが可能になる. 検索対象語(keyword)を中心に, 左右にその文脈が確認できるKWIC(= keyword in context)という表示形式で画面が示されるので, 検索対象語の直前・直後などの位置にどういった単語がくるかが, 一目瞭然である. これにより, 用法, コロケーション, 主語や目的語にどういった語がくるのかといった情報を, 容易に把握することができる. engageという動詞を例にとろう.


Keyword: "engaged"

ficers, if anyone is proved to have been  engaged directly in corruption or under-
ifferent places. We have a lot of people  engaged full time in education, helping 
od at appropriate moments whenever Turks  engaged him in conversation. He had disc
r but his was, at least, respectable. He  engaged his readers in chat about their 
 ICE: STAY WHERE YOU ARE. HE'S MINE. I'M  engaged. I'M IN. Maverick maneuvers clos
olanco replied that Del Junco was "fully  engaged in the political arena" and that
it that there's a long way to go. "We're  engaged in both a 100-yard dash and a ma
uring the next four years, Booz, now 18,  engaged in a frequent ritual: On her way
here were said. to be a total of 200,000  engaged in cottage industries in Sicily.
rom the lineup. The Red Sox are actively  engaged in an expeditious review of this
ting from this incident. We are actively  engaged in counseling through the Red So
political lever. They have been actively  engaged in campaigning against abortion 
 as well as in Japan. Companies actively  engaged in fuel cell development include
cation, but now independent, is actively  engaged in the exchange of students in t
 happening right now, and we're actively  engaged in discussions with a number of 
 may have misled people. We are actually  engaged in the Inter Party Talks that ar
t soldiers who stood and fought actually  engaged in combat against an enemy. At l
umber of disparate intelligence agencies  engaged in activities behind enemy lines
in one place at one time and they're all  engaged in watching various elements aro
bjectivity. "I like to think we were all  engaged in a rigorous scientific enterpr

コンコーダンサーには一般的に, 検索語の前後に生起する数語を基準にして行を並べ替える機能があるため, 容易に特徴的なコロケーションを見つけることができる. この例では, engagedという過去分詞を検索語とし, engagedの右側(すなわち後ろ)1--3番目にinが共起するパターンを抽出し, まず右側1番目に来る語, 次に左側1番目に来る語, さらに左側2番目に来る語を優先基準として並べ替えたものである. こうした作業を行い, 個々の用例だけでは見出せないようなパターンを発見することができる. さらに, 頻度や各種の統計値を処理する機能も備わっているので, 科学的で客観的なデータが得られる. 従来は, 語義の細かい情報を記述するには米英の辞書・語法書に頼ってきたが, コーパスを使えば, 日本人学習者のニーズを知った執筆者が, 実際に用いられている生の英語を解析するので, 上例のように日本人学習者にとって本当に重要な情報を効率的に取り込むことが可能になるのである.

 4 コーパス解析の結果

本辞典では, コーパスを活用する際2つの立場をとった. 1つはコーパスに基づいて従来語法上問題とされてきた事項や日本人が英語を使う上で疑問に思う事項を検証する立場である(corpus-based). もう1つは, コーパス検索によって得られたデータから新たな言語事実や法則性を発見するコーパス駆動的な立場である(corpus-driven). このような立場と学習辞典としての規範的立場とを融合させて, 随所でその成果を提示することとした. コーパスを分析することによって新たに得られた情報には, コーパス ロゴをつけて記述した. これは語義・用例の中の ! 注記や類義 語法 などのコラムに現れる.

さらに, コロケーション分析の結果を効果的に示すため, いくつかの重要語については, コーパス頻度ランク というコラムを設け, 頻度をランキング形式でコロケーション情報を示し, 特徴をつかみやすくした.

コーパス頻度ランク

findの文型

① find A/find A B/find B for A(↓ 他 1a, 1b)

② find A C(↓ 他 2a, 4, 5, 7)

③ find (that)節(↓ 他 3, 4, 7)

④ find oneself C [doing](↓ 他 2b)

⑤ be found(↓ 他 6)

! findは「見つける」が基本的意味で, 対象をどのような状態で見つけるか, どう思うかを示す [ find A C の文型(SVOC)でもよく使われる. 他 5では find it hard [difficult, easy, impossible] to doが典型.


また, コーパスから得られた情報のうち, 頻度情報, 表現のバリエーションとその適否, 頻出コロケーションといった事柄に関する 特に有益で新鮮な情報は, コーパスの窓 というコラムのかたちでまとめた.


コーパスの窓

対立を際だたせる工夫

既出の内容との対立を際だたせるため, butの後にはさまざまな副詞的表現が特徴的に用いられる

用例 用例

(1) 条件・時・場所: if, when, (for) now, after, before, as soon as, at the moment, recentlyなど.

(2) 真偽性・可能性: I think, I'm sure, in fact, certainly, actually, really, surely, mostly, obviously, probably, apparentlyなど.

(3) 焦点化: also, even, at least, simplyなど.

(4) 対照・譲歩: of course, instead (of A), at the same time, anywayなど.

(5) 引用・視点: according to A, in terms of Aなど.

(6) 列挙: in the end, eventually, again, ultimately, finally, above allなど.

(7) 頻度: sometimes, usually, always, rarelyなど.

(8) 評価: (un)fortunately, hopefully, basicallyなど.

(9) 追加: equally, by the same tokenなど.

(10) 話者の態度: generally, franklyなど.

 

コーパス頻度ランク 目次
accept+名 ・・・12
ask (A〈人〉)+名 ・・・108
become+形 ・・・159
begin to+動 ・・・164
believeに続く要素・文型 ・・・167
break+名 ・・・223
bring A+副など ・・・229
bring (A)+前/副 ・・・230
call+名 ・・・260
call+副/前 ・・・261
Can I [we] do? ・・・265
carry+名 ・・・278
come+前/副 ・・・351
do+名 ・・・524
feel+形 ・・・663
findの文型 ・・・676
get+名 ・・・752
get A+to do ・・・753
get+形 ・・・754
give+名 ・・・764
give (A)+副/前 ・・・767
go to+名 ・・・773
go +形/副 ・・・775
A + happen ・・・833
have +名 ・・・842
have +過分 ・・・847

hear +名 ・・・855
help A〈人〉(to) +動 ・・・863
hold +名 ・・・880
ifを含む会話表現 ・・・916
keep(+名)+形 ・・・999
keep (on) doing ・・・1000
know+名 ・・・1014
leave+名 ・・・1040
leave+名形 ・・・1041
likeの前に来る動 ・・・1062
listen to +名 ・・・1071
look at +名 ・・・1085
make+名 ・・・1109
make A do ・・・1109
meanを含む会話での定型表現 ・・・1138
mindを含む会話での定型表現 ・・・1163
mind (A[A's]) doing ・・・1163
move+前/副 ・・・1193
need +名 ・・・1220
pay +名 ・・・1339
play +名 ・・・1381
provide +名 ・・・1443
put+名 ・・・1455
put+前/副 ・・・1456

remember (A/A's) doing ・・・1513
run+名 ・・・1570
sayを含む会話表現 ・・・1590
see +名 ・・・1617
see A +動 ・・・1617
seem (to be)+形 ・・・1621
set +名 ・・・1635
show (A〈人〉) +名 ・・・1764
speak +名 ・・・1738
start +名 ・・・1766
stop +名 ・・・1783
take a A ・・・1838
take+前/副 ・・・1840
tell+名 ・・・1857
同格のthat節をとる名 ・・・1870
try to+動 ・・・1949
turn+副/前 ・・・1953
turn+名 ・・・1954
want to do ・・・2026
watch + 名 ・・・2031
wear +名(+ 形) ・・・2039
wishを含む会話での定型表現 ・・・2080
work +前 ・・・2091
write +名 ・・・2103

 

コーパスの窓 目次
前aboutの主な構文 ・・・6
距離表現+above+基準 ・・・8
advanceとprogress ・・・30
allの単独用法 ・・・52
alreadyの用法 ・・・59
alsoの位置 ・・・60
文頭のand ・・・70
aroundとround ・・・98
話し手のコメントを挿入する定形表現 ・・・104
数量を表すas ... as A ・・・105
as to Aの用法 ・・・107
ask A Bとask B of Aの用法 ・・・109
「悪い」の意の形名 ・・・134
挿入節について ・・・168
be (the) best ・・・174
beyond+領域を表す名 ・・・180
braveとcourageous, bold, fearless ・・・222
対立を際だたせる工夫 ・・・250
買い物・購入の表現 ・・・254
by the time ・・・255
take care ofとlook after, care for ・・・275
characterとpersonality ・・・302
choose, selectとpick ・・・316
clothesを使った表現 ・・・336
come to [into] Aの主な表現 ・・・352
aboutとconcerning ・・・376
costとprice, fare, chargeなど ・・・410
曜日・日付の尋ね方 ・・・454
deeplyが修飾する語 ・・・467
be ... different from [than, to] A ・・・496
動作の方向を示すdown ・・・538
each otherとone another ・・・560
earlierとbefore ・・・563
elementとcomponentなど ・・・580
speak Englishの否定文・疑問文 ・・・593
envelopeを使った表現 ・・・601
過去の経験を問う疑問文 ・・・614
everyoneとeverybody ・・・616
exceptの用法 ・・・621
expectとanticipate, hope forなど ・・・628
the fact (that)を伴う表現 ・・・643
fastとrapid, quickなど ・・・656
footとfeet ・・・706
-freeが付く名 ・・・722
fromの目的語 ・・・729
fullyが修飾する語 ・・・734
受け身を表すget done ・・・754
了解を示すget it ・・・758
別れを切り出す表現 ・・・774
go doingに現れる主な動 ・・・774
go doingに現れる主な動 ・・・774
go C ・・・776
be a good+名動+(...) well ・・・787
grow C, grow to do ・・・811
halfの単数・複数呼応 ・・・872
hardlyとscarcely, barely ・・・836
経験についての応答 ・・・847
heavyとhard ・・・859
go [take] here ・・・867
hopeを使った会話表現 ・・・867
howとwhat ・・・900
be a good idea ・・・913
名の前のillの用法 ・・・920
intention of doing [to do] ・・・960
interestの用法 ・・・961

be interested to do ・・・962
kind(s) [sort(s), type(s)] of A ・・・1007
knowledgeの用法 ・・・1017
latelyの用法 ・・・1030
光の表現 ・・・1059
like to do と like doing ・・・1062
程度を強めるlotの用法 ・・・1092
((かたく))におけるmany ・・・1120
主格Iに代わる目的格meの用法 ・・・1137
meetを使った初対面のあいさつ ・・・1144
mightとI think ・・・1156
moneyを使った表現 ・・・1179
肯定文におけるmuch ・・・1197
(very) muchの位置 ・・・1198
nearとup to ・・・1216
no+名とnot any [a] +名 ・・・1238
I think not. 型とI don't think so. 型 ・・・1248
a number of A ・・・1256
How often ...?への答え方 ・・・1274
複数形再帰代名詞と-self ・・・1284
otherを強調する修飾語 ・・・1299
oughtの用法 ・・・1300
take part in A, join in Aなど ・・・1330
申し出・提案の会話表現 ・・・1351
a piece of Aとa ... of A ・・・1366
placeと前 ・・・1375
play+(the)+楽器 ・・・1381
pleaseを使った会話表現 ・・・1384
preferの用法 ・・・1415
... price ・・・1423
to put it ...の形の不定詞句 ・・・1456
quiteの修飾語 ・・・1468
A rather than B/rather A than B ・・・1482
reasonに続く節・to不定詞・doing ・・・1490
recentlyの用法 ・・・1493
return homeとreturn to one's home ・・・1535
rightを強調する副 ・・・1543
ruleを使った表現 ・・・1567
What do you say to ...? ・・・1594
いろいろなseat ・・・1612
a/one's/the sense of ... ・・・1628
shockとsurprise ・・・1655
sinceと時制・時の表現 ・・・1682
…に座る ・・・1686
((話))におけるsomething ・・・1725
sorry about that [this] ・・・1730
副+ speaking ・・・1739
stand to do ・・・1763
stressの表現 ・・・1791
suitとfit ・・・1809
take a+名とhave a+名 ・・・1838
than節中の動 ・・・1867
A be thought to do ・・・1886
2者を比較するthose ・・・1892
It's time ... ・・・1905
歯にまつわる表現 ・・・1920
trainを使った表現 ・・・1932
until節中の省略 ・・・1983
いろいろな水, ウォーター ・・・2032
前+whichによる言い換え ・・・2054
of+関係代名詞 ・・・2059
疑問代名詞のwhoとwhom ・・・2064
whoeverの格・機能 ・・・2066
wrongとwrongly ・・・2106