文章の文法をもとめて

 Twitterに投稿したつぶやきをもとに記事を作ろうと思う。テーマは言葉の単位とそのルールについて。

 ある公式を使って問題を解けるかどうかは、根気よく学び続けられるかどうかという意味で「練習」の問題だが、まだ証明されていないことがらを証明して新たな公式を作るのには別の何かが要る。一般にそれは「創造性」などと呼ばれる。

 ある文について、それが正しく構成されているかどうかということは文法に照らして判定することができる。けれども文よりももう一つ上の単位である「文章」については、それが正しく構成されているかを判定する論理的な手続きが見当たらない。ここで「存在しない」ではなく「見当たらない」という表現を用いたのは、それが実際には存在しているかもしれず、単に私がそれを知らないだけである可能性があるためである。また一般に、何かが「存在しない」ということを示すのは難しい。

 文に関しては、句構造規則に沿っていろいろな操作を施すことができる。別の語を加えたり、語順を入れ替えたりするといった操作を有限回行うことで、あらゆる文が生成できる。試しに次の文を考えてみよう。なお、日本語の文法について私はあまり知らないので、馴染みのある英語の文法に沿って考えてみることにする。日本語の文法の方が理解しやすいという読者には申し訳ない。

文A:私は山田太郎である。

文Aの主語「私」を「吾輩」と入れ替え、補語「山田太郎」を「猫」と入れ替えるだけで、

文B:吾輩は猫である

という別の文を生成することができる。こうして私は、自分の生成した文から、別の誰か、この場合は漱石が過去に生成した文を生成することができた。これと同様にして、私は文Aから有限回の操作によって任意の文を生成することができ、シェイクスピアだろうとドストエフスキーだろうと村上春樹だろうとそれは生成可能だ。文を変形して別の文を生成することはあまりないから、村上春樹の生成する文を私が作るのには「練習」が必要だろうが、論理的には可能であると思われる。それはつまるところ、有限回のステップのうちに収まる文の変形操作のアルゴリズム(手順)を見つけられるかの問題に過ぎない。

 また文Bは単に「文」であるだけでなく、本のタイトル(夏目漱石の小説の題名)でもあるから、一つの名詞として使うことができる。つまり

文C:あなたは [n](名詞)を読んだ?

という疑問文の[n]の部分に「吾輩は猫である」という文(文B)を代入することができる。また、自動詞「である」を他動詞「を許す」と入れ替えると、

文D:私は山田太郎を許す

という文が作れるし、動詞「許す」をその否定形である「許さない」と入れ替えると

文E:私は山田太郎を許さない

という、文Dとは反対の意味を表す文を生成することができる。

 このように、文の単位では、その内側で語や句や節といった部品がどのように並ぶかということに関して、一定の統語的な規則が存在する。日本語の場合は英語やフランス語などや中国語などの外国語に比べて統語的な規制がゆるいため、自然言語処理においては、チョムスキーの手による句構造文法よりも、フィルモアによる格文法を用いて考える方が扱いやすいそうだ。

 文章の生成については、「文章作成法」とでも呼ぶべき分野が古くから存在していて、ビジネス文書や小説の書き方から、最近ではブログの書き方に至るまで、いろいろなものがあるが、どれも科学的ではなく、著者の個人芸の域を出ないものが少なくない。三島由紀夫*1谷崎潤一郎*2野口悠紀雄*3本田勝一*4、或いは古くは空海の『文鏡秘府論』など、多くの著名な人物がそれぞれに文章の書き方、構成法について説いているが、それらは現実の文章がどのようなルールによって構成されているかということを説明するものではなく、この意味では文法ほどの形式化は進んでいない。或いはもう少し別のもので言えば『理科系の作文技術』*5や『日本語のレトリック』*6といったものもあるが、やはり文法ほどの形式化はなされていない。レトリック(修辞学)というのは、文を操る技術という意味では文章を外から規定する形式といえなくもないが、文にとっての文法の関係と、文章にとってのレトリックの関係は同じではない。

 Twitterのツイートやブログでの情報がデマ(誤情報)であるかどうかを判定する方法に関する、自然言語処理の分野での研究*7がある。これはある一定量の文ないし文章について、その属性を判定するものであるが、これは手がかりになりそうだという気がしている。

 またこの研究とは別に、『文体の科学』*8という本を読み始めた。いかにも自分が考えたいことにぴったり当てはまる内容ではないかと思いながら読み進めているが、どうも少し違うような気がしてきた。ここで読み続けるかどうかという判断を迫られている。一応読みきろうと思う。

 

【追記】

『文体の科学』は途中で読む気が完全に失せてしまった。ちっとも科学になっていないからだ。もとになっているのが雑誌の連載という事情があるにせよ、タイトルと中身の齟齬が大きい。速読とは読むべき本とそうでない本とを素早く区別するための方法であるとするならば、速読が役に立ったと言えるかもしれない。少なくとも今の自分の問題関心では読むべきでないと感じた本に、それ以上の時間をかける気にはなれない。

 

*1:

文章読本 (中公文庫)

文章読本 (中公文庫)

 

 

*2:

文章読本 (中公文庫)

文章読本 (中公文庫)

 

 

*3:

「超」文章法 (中公新書)

「超」文章法 (中公新書)

 

 

*4:

日本語の作文技術 (朝日文庫)

日本語の作文技術 (朝日文庫)

 

 

*5:

 

*6:

日本語のレトリック―文章表現の技法 (岩波ジュニア新書)

日本語のレトリック―文章表現の技法 (岩波ジュニア新書)

 

 

*7:鳥海不二夫、篠田孝祐、兼山元太「ソーシャルメディアを用いたデマ判定システムの判定精度評価」[2012]

*8:

文体の科学

文体の科学