Webツールが文章の「硬さ」を見極める方法

はじめに

 

硬い文章は読みにくい。

 

とっつきにくく、眠くなる文章だ。
条文や、役所の文章にそういうのが多い気がする。

 

ただし、硬い文章でも、分かりやすく知性を感じるものもある。

 

とっつきにくいだけなのだ。

 

人に例えると、一見絡みにくいが、話すと面白いやつみたいな。
多分、気難しそうな雰囲気とかが原因だろう。

 

文章はどうか。

 

我々ライターは、経験で判断していると思う。
正直、個人のさじ加減に過ぎないと感じる。

 

Webツールは、そうもいかない。
統一的なアルゴリズムが無ければ、まともに機能しないからだ。


ここに『文章の難易度測定方法に関する研究―「やさにちチェッカーの「硬さ」について」―』という論文がある。

 

筆者は岩田一成氏。

 

公用文の文章難易度診断ツール「やさにちチェッカー」に関わりを持つ研究者だ。

「硬さ」の正体を見ていきたい。

 

※あくまで公用文の「硬さ」ついて論じた内容なので、そこは留意してもらいたい。

 


①公用文が読みにくい本当の理由

 

公用文はなぜとっつきにくいのか。

 

理由の1つに、語彙の難しさがあると思う。
ピンとこない語彙のオンパレードだ。

 

それだけなのか。

 

岩田氏は、「お役所言葉をなくしても外来語を減らしても、文章構造自体が難解であればよみやすくはならない」と指摘。

 

続けて、「(公用文は)法律文をそのまま借用した文体で書かれており、さらに談話全体が整理されていない」と文書構造の傾向を説明した。

 

難解さの正体を探るため、白書・法律と知恵袋・ブログの文章を比較した結果、
前者は名詞や動詞などの実質語が多く詰まった、情報が圧縮された文章だったという。

 

なお、後者は一文が短く分かりやすいが、前後の文脈から文章を理解する必要が出てくるそうだ。

 

比較結果から、文章の「硬さ」は、実質語の詰め込み具合によると岩田氏は仮定しました。

 

②「硬さ」を測定する2つの方法

 

岩田氏によると、「硬さ」の判定には、語彙密度と文名詞密度の2つがあると言います。

 

2つの方法の概要は次の通り。

 

1,語彙密度

動詞・名詞などの実質語の数を計測するもの。

例文と測定事例は次の通り

 

※実質語の総数(下線部)を、文節数(「/」)で割って算出する

A語彙密度2.25(実質語9、節4)
クヌギになると、/落ちて積もります。/そこでカブトムシ産みます。/

B語彙密度9(実質語9、節1)
クヌギ落ち葉堆積することカブトムシ産卵場を提供します。/

 

2,文名詞密度

文中の名詞数を計算するもの。

例文と測定事例は次の通り。

 

※名詞は下線部

A文名詞密度3(名詞6、文2)
クヌギになると、が落ちて積もります。/そこでカブトムシを産みます。

B文名詞密度9(名詞9、文1)
クヌギ落ち葉堆積することカブトムシ産卵場提供します。

 

文名詞密度は、岩田氏が考案した手法で、「やさにちチェッカー」にも採用されている。


③文名詞密度が公用文の「硬さ」を判定するのに最適な理由

公用文の測定に文名詞密度を用いる理由は何か。

 

実質語の多くが名詞であることの他、もう1つ理由がある。

 

「名詞化」という現象が、文章の種類や、話し言葉と書き言葉の区別に関わりを持つからだ。

 

これは動詞や形容詞を名詞化することを指す。

 

本文中の例文は次の通りだ。

 

秋に枯葉がたくさん落ちて積もる。落ち葉の堆積はカブトムシに住処を提供する。

 

下線部「落ち葉の堆積」が名詞化である。

 

名詞化の多い文章はアカデミックな文章に多いという研究結果から、
文名詞密度を「硬さ」の測定方法として採用したという。

 

④「硬さ」の判定基準

実際に、語彙密度と文名詞密度で多くのジャンルの文章の硬さを比較した結果、
後者は白書・法律が、より「硬い」と判定されたそうだ。

 

岩田氏は、この点を高く評価し、法律文と似通った公用文の測定に向いているとした。

最後に、「やさにちチェッカー」の「硬さ」の判定基準を紹介する。

 

※密度は1文中の名詞数

1:文名詞密度が15超なら法律文レベル
2:文名詞密度が12超なら専門書と法律文の中間レベル
3:文名詞密度が9超なら専門書レベル
4:文名詞密度が6超なら児童文学と専門書の中間レベル
5:文名詞密度が6以内なら児童文学レベル

 

おわりに

要するに「硬い」文章とは、「窮屈」な文章なんだと思う。

柔らかい言葉を使っても、ギチギチ具合は変わらない。

 

類語辞典を使って優しい言葉を選ぶのも大事だが、文章を分けることを意識したい。

 

「合ってるけど読みにくい」という時に、名詞数や「名詞化」の有無を確認して、調整したらいいんじゃないか。

 

知らんけど。