パスワードを忘れた? アカウント作成
13451276 story
SNS

Twitterの文字数、正式に280文字となる 37

ストーリー by hylom
特にユーザーの満足度が向上するとは思えないが 部門より
Sune曰く、

Twitterの文字制限が従来の140文字から280文字に拡張された(Twitter公式ブログITmedia)。長文の場合、単純に今までの半分のツイート数で投稿できるようになる。ただし日本語は対象外。

一方で、非公式リツイート(っていうんだっけ?)による中途半端な引用がどんどん長くなっていくことも想定でき、議論系のTogetterまとめなどが今までより見づらくなるのではないかとタレコミ主は心配している。

興味深いのは英語・日本語のツイートあたりの文字数の比較だ。英語のツイートは34文字くらいに山があり、140文字寸前のツイートが多くなる。それに対し、日本語のツイートは15文字のところに山があり、140文字寸前のツイートはそれほど多くない。英語圏と日本語圏のTwitterの使い方の違いとみるか、日本語の特性とみるか、気になるところである。

文字数制限の緩和は9月に実験的に導入すると発表されていた。実験のときと同様、日本語・中国語・韓国語は対象外。ITmediaの別記事によると、英数字などは2文字で1文字とカウントされる仕様になっているという。さらに、文字数ではなく円形のインジケータで入力可能な文字数が表示されるようになったことも話題となっている。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by akiraani (24305) on 2017年11月09日 15時30分 (#3309582) 日記

    Twitterの字数制限変更 日本語と英語の「140文字」はどれだけ情報量が違うのか? [itmedia.co.jp]

     翻訳会社ジェスコに話を伺ったところ、翻訳業界では一般的に「日本語400字の情報量 = 英語1000字(スペースを含む/約200単語に相当)の情報量」と考えられているそうです。つまり、日本語1文字あたりの情報量は英語の2.5倍。従来のTwitterの字数制限に当てはめてみると

    • 140字の日本語 = 英語350字分
    • 140字の英語 = 日本語56字分

     ということになります。

    というわけで、倍にしてもまだ日本語のほうが情報詰め込めるっぽいです。

    そもそも中国語とかの漢字交じりの言語と比較したら、使える文字のバリエーションがぜんぜん違うわけで、「文字数」でカウントすること自体がおかしいのではないのかと。
    せめて、バイト数で換算すべきだったのでは……。

    --
    しもべは投稿を求める →スッポン放送局がくいつく →バンブラの新作が発売される
    • ここにぶら下げます。
      製品マニュアルとかで、複数の言語で同じ説明が書いてある時「どの言語がコンパクトに表現できるのかな?」っていつも見ちゃうんですが、大差なく見えるんです。

      一文字当たりの情報量は多いのかもしれないけど、占有スペースは同じなんだろうなと。PCの上では固定フォントの場合、通常日本語はアルファベットの2文字分占有しますしね。(半角カタカナとか、㌧㌦ とか例外やで)

      親コメント
      • by Anonymous Coward on 2017年11月09日 16時03分 (#3309608)

        日本語の場合、丁寧語使うと無駄に長くなりますねぇ。英語と比べて短くなってる印象は無い。
        逆に、命令語調で書くとえらく短い。

        まぁ中国語にはかないませんけど。たぶん一番短い。

        あと、占有スペースって点だと、アルファベットは小さく書いても読めるって点は重要。
        漢字かなだと16ドットは欲しいけど、アルファベットなら半分以下でokてな具合で。印刷だと重要じゃないかな。

        親コメント
      • by Anonymous Coward

        なんとかしてうまく返したいんだけど俺の頭じゃデキッコナイス

    • > せめて、バイト数で換算すべきだったのでは……。

      バイト数はエンコードによってぜんぜん違うから、まずそれを指定しないと。

      UTF-8 なら、基本ラテン文字は1オクテット、フランス語やドイツ語で使われるラテン補助は2オクテット、カナや漢字は3オクテット。

      ところがUTF-16ならこれが全部2オクテット。

      親コメント
    • by Anonymous Coward on 2017年11月09日 22時34分 (#3309864)

      せめて、バイト数で換算すべきだったのでは……。

      開発者は楽かもしれないが、
      ユーザーは知ったこっちゃないし、そもそも理解不能だろ。

      親コメント
    • by Anonymous Coward

      極端な例 「菊」⇔「chrysanthemum」
      文字数ではなくバイト数にしたとしても本質的には問題解決にはなっていないですね(表意文字対表音文字)。
      英語換算で何文字かで判断して、ツイッターの公式リアルタイム翻訳エンジンを用意し、その翻訳された英文の文字数でもって判断するとかすれば、より公正な比較になるかもしれない。訳の仕方には文句言わせない。

    • by Anonymous Coward

      ちゃんと読めるかどうかを無視して詰め込めば、て話な気がしなくもないが。

  • by manmos (29892) on 2017年11月09日 15時59分 (#3309603) 日記

    「音節(モーラ)」にすべし。

    #日本語、ムッチャ不利。

  • >ITmediaの別記事によると、英数字などは2文字で1文字とカウントされる仕様になっているという。

    いっそ単純に、入力データをバイト数で表示したら楽そう。

  • by Anonymous Coward on 2017年11月09日 16時11分 (#3309616)

    とか書きやすくなるのも意外と嬉しいかも.

  • もういい…! もう…喋るな…!

  • by Anonymous Coward on 2017年11月10日 15時49分 (#3310234)

    早速BMGがネタにしてる
    https://twitter.com/borussia_en/status/928204251674894336 [twitter.com]

typodupeerror

人生の大半の問題はスルー力で解決する -- スルー力研究専門家

読み込み中...