本格的にコーパスを活用した国内初の学習英和辞典として2002年に『ウィズダム英和辞典』が発刊されて以来, 様々な分野のユーザーの方々から予想以上の反響をいただいた. この度, ユーザーの方々から寄せられた貴重なご意見やご要望を取り入れるとともに, 発刊以来の英語の変化をいっそう的確に内容に反映すべく, 改訂版を上梓することとなった. 編集にあたっては, 初版同様以下のような点に留意した.
コーパスとは「(特定の種類・作家の文書[資料]の)集大成, 集積」をさす. 現在では, 大量に収集したテキストデータをコンピュータで解析可能なかたちにした, いわゆるコンピュータコーパスをさすことが多い. 辞書の編纂においては伝統的に, 用例カードなど何らかのかたちで「コーパス」的な資料が用いられてきたが, 1980年代後半から英国ではコンピュータコーパスを利用して大量のデータを扱うようになった. 現在, 英国では学習英英辞典のほとんどがコンピュータコーパスを用いて編纂されたものになっている. 日本国内でのコーパス利用は遅れたが, 独自にコーパスを構築した上で編集最初期の段階から全面的にそれに依拠して編纂された学習英和辞典としては, 『ウィズダム英和辞典』(初版)が初めてのものである.
本辞典の編纂に用いた三省堂コーパスは, 三省堂が独自に開発・構築した, 日本人の英語学習に特化したコンピュータコーパスである.既存のBritish National Corpus (BNC)などの大規模コーパスのみをそのまま利用するのではなく独自のコーパスを構築したのは, 日本人が英語学習に用いる辞書を編纂するという明確な目的が背景にあったからである. 日本人学習者が英語学習の伴侶として用いる辞書は, 2つの領域を射程に入れる必要がある. 1つは, 教科書や入試問題など英語学習の場面でよく出てくる語や表現であり, もう1つは, 英語母語話者との対話を始めとする日常生活や, 英語の新聞・雑誌・書籍・映画にふれる際など, 実際に英語を意思疎通の手段として使用する場面で接する語や表現である. 既存の英国産の大規模コーパスを使う場合, 英国と米国での使用頻度の差や話し言葉と書き言葉の比率を補正する作業が必要になる. また, コーパスの原典となっている資料も書き言葉の割合が高く, 高度な英語運用能力を持つ人には見合うが, 英語を母語としない学習者にとっては敷居の高い表現が多く含まれるきらいがある. そこで, 本当の意味で日本人英語学習者が必要とする英語を配慮したバランスの取れたコーパスの構築を目指した. 三省堂コーパスは, 上述の2つの領域を同時にカバーするために, 新聞・雑誌・カタログ・インタビューなどから, 日常生活で用いられる平易な文体の英語を中心に, 幅広くデータを収集した. その結果, 米6英4, 話し言葉4書き言葉6の比率で構成する数千万語規模のコーパスとなった.
コーパスを使用して辞典を編集するにあたっては, 検索ツールや統計処理を行うツールなどを駆使して分析を行うが, それによって, 語句の使用頻度, ある語義の構文パターン, 特徴的な連語関係といった言語事実をつかむことができる. たとえば, コンコーダンサーという検索用のソフトウェアを用いて, 視覚的に語連結(コロケーション)の特徴をつかむことが可能になる. 検索対象語(keyword)を中心に, 左右にその文脈が確認できるKWIC(= keyword in context)という表示形式で画面が示されるので, 検索対象語の直前・直後などの位置にどういった単語がくるかが, 一目瞭然である. これにより, 用法, コロケーション, 主語や目的語にどういった語がくるのかといった情報を, 容易に把握することができる. engageという動詞を例にとろう.
Keyword: "engaged" ficers, if anyone is proved to have been engaged directly in corruption or under- ifferent places. We have a lot of people engaged full time in education, helping od at appropriate moments whenever Turks engaged him in conversation. He had disc r but his was, at least, respectable. He engaged his readers in chat about their ICE: STAY WHERE YOU ARE. HE'S MINE. I'M engaged. I'M IN. Maverick maneuvers clos olanco replied that Del Junco was "fully engaged in the political arena" and that it that there's a long way to go. "We're engaged in both a 100-yard dash and a ma uring the next four years, Booz, now 18, engaged in a frequent ritual: On her way here were said. to be a total of 200,000 engaged in cottage industries in Sicily. rom the lineup. The Red Sox are actively engaged in an expeditious review of this ting from this incident. We are actively engaged in counseling through the Red So political lever. They have been actively engaged in campaigning against abortion as well as in Japan. Companies actively engaged in fuel cell development include cation, but now independent, is actively engaged in the exchange of students in t happening right now, and we're actively engaged in discussions with a number of may have misled people. We are actually engaged in the Inter Party Talks that ar t soldiers who stood and fought actually engaged in combat against an enemy. At l umber of disparate intelligence agencies engaged in activities behind enemy lines in one place at one time and they're all engaged in watching various elements aro bjectivity. "I like to think we were all engaged in a rigorous scientific enterpr
コンコーダンサーには一般的に, 検索語の前後に生起する数語を基準にして行を並べ替える機能があるため, 容易に特徴的なコロケーションを見つけることができる. この例では, engagedという過去分詞を検索語とし, engagedの右側(すなわち後ろ)1--3番目にinが共起するパターンを抽出し, まず右側1番目に来る語, 次に左側1番目に来る語, さらに左側2番目に来る語を優先基準として並べ替えたものである. こうした作業を行い, 個々の用例だけでは見出せないようなパターンを発見することができる. さらに, 頻度や各種の統計値を処理する機能も備わっているので, 科学的で客観的なデータが得られる. 従来は, 語義の細かい情報を記述するには米英の辞書・語法書に頼ってきたが, コーパスを使えば, 日本人学習者のニーズを知った執筆者が, 実際に用いられている生の英語を解析するので, 上例のように日本人学習者にとって本当に重要な情報を効率的に取り込むことが可能になるのである.
本辞典では, コーパスを活用する際2つの立場をとった. 1つはコーパスに基づいて従来語法上問題とされてきた事項や日本人が英語を使う上で疑問に思う事項を検証する立場である(corpus-based). もう1つは, コーパス検索によって得られたデータから新たな言語事実や法則性を発見するコーパス駆動的な立場である(corpus-driven). このような立場と学習辞典としての規範的立場とを融合させて, 随所でその成果を提示することとした. コーパスを分析することによって新たに得られた情報には, ロゴをつけて記述した. これは語義・用例の中の 注記や などのコラムに現れる.
さらに, コロケーション分析の結果を効果的に示すため, いくつかの重要語については, というコラムを設け, 頻度をランキング形式でコロケーション情報を示し, 特徴をつかみやすくした.
findの文型 | |
① find A/find A B/find B for A(↓ 1a, 1b) | |
② find A C(↓ 2a, 4, 5, 7) | |
③ find (that)節(↓ 3, 4, 7) | |
④ find oneself C [doing](↓ 2b) | |
⑤ be found(↓ 6) | |
findは「見つける」が基本的意味で, 対象をどのような状態で見つけるか, どう思うかを示す find A C の文型(SVOC)でもよく使われる. 5では find it hard [difficult, easy, impossible] to doが典型. |
また, コーパスから得られた情報のうち, 頻度情報, 表現のバリエーションとその適否, 頻出コロケーションといった事柄に関する 特に有益で新鮮な情報は, というコラムのかたちでまとめた.
対立を際だたせる工夫 | |
既出の内容との対立を際だたせるため, butの後にはさまざまな副詞的表現が特徴的に用いられる | |
用例 | |
(1) 条件・時・場所: if, when, (for) now, after, before, as soon as, at the moment, recentlyなど. | |
(2) 真偽性・可能性: I think, I'm sure, in fact, certainly, actually, really, surely, mostly, obviously, probably, apparentlyなど. | |
(3) 焦点化: also, even, at least, simplyなど. | |
(4) 対照・譲歩: of course, instead (of A), at the same time, anywayなど. | |
(5) 引用・視点: according to A, in terms of Aなど. | |
(6) 列挙: in the end, eventually, again, ultimately, finally, above allなど. | |
(7) 頻度: sometimes, usually, always, rarelyなど. | |
(8) 評価: (un)fortunately, hopefully, basicallyなど. | |
(9) 追加: equally, by the same tokenなど. | |
(10) 話者の態度: generally, franklyなど. |