新聞で使われている漢字を調べる(前置き)
久々に漢字を調べました。
今回は新聞を使用します。
新聞を選んだ理由としては、書き言葉として一番一般的な媒体といえるからです。
前回は、ツイッターで使用されている漢字を調べました。
結果、
日、人、大、本、中、今、生、年、見
という順位となりました。
ツイッターで調べていた時の反省点として、
・漢字10万字では足りない。
・トレンドによって使用されている漢字に大きな偏りがある。
というところです。
ツイッターの傾向として、一つのトレンドが上位に来ると、その関連ワードもトレンドに入ることが多いです。
一例として
2022/11/04 17:34 トレンド4位 エセ関西弁使い
2022/11/04 17:34 トレンド5位 激むず関西弁クイズ
以前のツイッターの漢字を調べるときのルールだと、両方のトレンドのツイートを調べていました。
その場合、同じ人のツイートを2回取得する、という現象も起きていました。
(特に公式ツイッター)
どのトレンドでとったツイートかなんて、正直覚えていないです。
ただ、集計するときに、同じツイートを取得するのは問題があります。
それから、ツイッターでは同じ曜日の大体同じ時間に全く同じトレンドワードが入ることが多いです。
ドラマやテレビ番組など。
それがいつのツイートなのかを考えながら取得しなければならなかったので、とてもややこしかったです。
前回の反省点をいかして、今回、新聞で使用されている漢字を調べます。
ルール
使用する新聞は、日本経済新聞電子版を使用します。
取得する記事は「トップ」に出ている記事です。
「トップ」の記事がなくなった場合、私が読みたい記事からピックアップして漢字を取得します。
同じ記事は取得しません。
過去の記事にさかのぼって漢字を取得するのも可能です。
同じカテゴリーの記事は取得します。
カテゴリー、トピック別に漢字を集計します。
今回は、ひらがな、カタカナもついでに調べます
「」。、!? などの記号も調べられる範囲で調べます
=は調べられませんでした。
無理は絶対しない
こんな感じで行こうと思います。
めざせ100万字!
トピック、カテゴリー別に分けているのは、それぞれでよく使用される漢字が見えてきたら面白いと感じたからです。
これから頑張っていきます!