漢字を調べる人

様々な媒体で使用されている漢字を調べています。

新聞で使われている漢字を調べる①

新聞で使用されている漢字を調べています。

 

調べ方のルールなどは前回の記事に記載されているのでそちらからどうぞ。

 

https://blog.hatena.ne.jp/zofiel10sein/twitterkanji.hatenablog.com/edit?entry=4207112889933655747

 

今回は、調べた感じが5万字を超えたので、経過報告です。

 

ツイッターの時より、報告するペースをさげます。

 

 

 

調べた記事の数 96

調べた文字数  122172

調べた漢字の数 50007

漢字使用率 41%

調べたひらがなの数 46114

ひらがな使用率 34%

調べたカタカナの数 10760

カタカナ使用率 8%

 

 

 

ランキング

 

第10位 

337回    「金」

 

第9位 

340回    「業」

 

第8位 

348回    「高」

 

第7位 

396回    「月」

 

第6位 

420回    「大」

 

第5位 

421回    「会」

 

第4位 

575回    「上」

 

 

第3位 

578回    「国」

 

第2位 

609回    「日」

 

第1位 

691回    「年」

 

 

ひらがな

1位から

「の」「る」「に」「を」「は」「が」「た」「い」「し」「と」

 

カタカナ

1位から

「ン」「イ」「ル」「ス」「ト」「ド」「ッ」「ク」「ロ」「ラ」

 

 

感想

 

まず、ツイッターと全然違うことに驚いています。

 

新聞では、「いつ」「どこで」「だれが」「なにを」「どうした」を明確にする必要があります。

 

なので、「いつ」を表す「年」が多数使用されたと考えられます。

 

ただ、朝日新聞での漢字使用ランキングは「日」が一番多いらしいので、結果はまた変わってくるだろうと思っています。

 

 

ひらがなについてはおおむね予想通り、接続詞がよくしようされている印象でした。

 

 

カタカナは固有名詞で使われているので、正直なにがどうしてこのカタカナが多いのかが分かりにくい。

 

円安ドル高、ウクライナ問題の記事をよく取得していたので、その関連が多いのかと思いきや、そうでもなさそう。

 

企業名でも、「ソニー」「アマゾン」「アップル」など多数とりました。

 

あとは、「バイデン大統領」「プーチン大統領」などの人名ですかね。

 

 

 

結果はまだまだ変わると思っています。

 

まだ5万字、100の記事もとっていないです。

 

ぼちぼち集計していきたいと思っています。

 

 

 

集計時の相棒

 

 

ツイッターの文字を取得するより、集計する時間は早くなりました。

 

1記事6分ぐらいで終わるのはありがたい。

 

集計時間約半分になりました。

 

それで記事によっては量がとても多い。

 

電子版なので、めちゃめちゃに短い記事もあります

(そういうのは避けることが多い)

 

でも、1つの記事は大体1000字を超え、漢字においても500字を超えることが多いのでとても助かっています。