『源氏物語大成』と本居宣長『手枕』の計量分析による比較

                           
                                                                          上田 英代
                                                           もとぶ野毛病院 上田 裕一
                                                           統計数理研究所 村上 征勝
                                                           神戸学院大学  樺島 忠夫

  1. 研究目的
     昨年末に『源氏物語大成』の品詞情報つきデ−タベ−スが完成し、統計的手法を使った計量分析を開始した。「源氏物語」研究の中で、未だ結論のでないまま残されている様々な課題に対し従来とは全く異なった方法で解答を試みる。同時に、「源氏物語」に似せて書いたと言われる本居宣長の『手枕』と比較することによって、「源氏物語」の文体の特徴をより明確にする。他人の文体に似せて書くとき、どの程度まで似せられるのか、又どの点が似せようとして違いが出てしまうのか、この文体の相違点の質を明らかにする。

  2. 研究方法
    1. 『手枕』の自筆本2本の品詞情報付きデ−タベ−スを『大成』と同じ方法で作る。
      自動単語分割に用いた分割用辞書は、『大成』の自動分割の結果、最後にできあがった『大成』の総異なり単語が入ったものである。この辞書を使って『手枕』を自動単語分割した結果、正確さは75%であった。
      同様に、自動品詞付けに用いた辞書も『大成』の自動品詞付けの結果、最後にできあがった辞書である。

         
    2. できあがった解析用デ−タの主なものは、次の項目についてである。   1、文の長さと文の数        6、ある品詞が文頭、文末にある割合   2、単語の長さのヒストグラム    7、各品詞別、度数付き単語集   3、単語の出現度数         8、各品詞の度数と出現率   4、単語別の割合とヒストグラム   9、品詞の相対出現率   5、各品詞ごとの接続関係
    3. 使用単語の違いや違った単語の数などを求め、特徴を明らかにする。

    4. 主成分分析等の統計的手法で解析する。
       

  3. 考察
    解析の結果、『大成』と本居宣長の文体の相違点が、ある程度明かになった。