文字数カウント
テキストの文字数、単語数、行数をカウントします
文字数(文前後の空白なし)
文字数
0
文字数(全ての空白なし)
0
行数(空白行抜き)
0
行数
0
段落数
0
原稿用紙枚数(1枚=20字×20字)
0
UTF-8バイト数
0
Shift_JISバイト数
0
JISバイト数
0
EUC_JPバイト数
0
💡 文字数カウントの雑学・Tips
📝 原稿用紙400字の由来
原稿用紙が20字×20行=400字になったのは明治時代に定着した慣習です。当時の活版印刷の組版効率や、読みやすい1行の文字数として定着しました。現在でも出版・新聞業界では原稿量の単位として「400字詰め換算で何枚」という表現が使われており、小説の公募などでも原稿用紙換算での字数制限が設けられることがあります。
🐦 Twitterの「140文字」はSMSが起源
Twitterが140文字制限を設けたのはSMS(ショートメッセージ)の規格に由来します。SMSの上限は160文字で、そこからユーザー名用に20文字を引いた140文字が採用されました。2017年に280文字に拡張されましたが、日本語・中国語・韓国語は情報密度が高いとして140文字のまま据え置かれた経緯があります。
💾 UTF-8では日本語1文字が3バイトになる
UTF-8は文字によってバイト数が異なる可変長エンコードです。英数字は1バイトですが、日本語のひらがな・漢字などは1文字あたり3バイトを消費します。そのため「文字数」と「バイト数」は必ずしも一致しません。データベースのカラム長をバイト数で設定している場合、日本語テキストは想定の3倍の容量を必要とすることがあり注意が必要です。
🔤 絵文字は「1文字」ではない場合がある
絵文字はUnicodeで複数のコードポイントを組み合わせて表現されるものがあります。例えば家族の絵文字「👨👩👧👦」は複数の絵文字をZWJ(ゼロ幅接合子)でつないだ合成文字で、JavaScriptの .length では11文字と数えられます。SNSや入力フォームで絵文字を使ったとき文字数制限に引っかかりやすいのはこのためです。
📖 SEOに適切な文字数の目安
Webコンテンツの文字数はSEOにも影響します。Googleのタイトルタグは全角32文字前後、メタディスクリプションは全角120文字前後が表示上の目安です。ブログ記事は一般的に2,000〜4,000文字(原稿用紙5〜10枚相当)が検索上位に表示されやすいとされています。ただし文字数より内容の質が優先されることは言うまでもありません。