パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

Twitterの文字数、正式に280文字となる」記事へのコメント

  • by akiraani (24305) on 2017年11月09日 15時30分 (#3309582) 日記

    Twitterの字数制限変更 日本語と英語の「140文字」はどれだけ情報量が違うのか? [itmedia.co.jp]

     翻訳会社ジェスコに話を伺ったところ、翻訳業界では一般的に「日本語400字の情報量 = 英語1000字(スペースを含む/約200単語に相当)の情報量」と考えられているそうです。つまり、日本語1文字あたりの情報量は英語の2.5倍。従来のTwitterの字数制限に当てはめてみると

    • 140字の日本語 = 英語350字分
    • 140字の英語 = 日本語56字分

     ということになります。

    というわけで、倍にしてもまだ日本語のほうが情報詰め込めるっぽいです。

    そもそも中国語とかの漢字交じりの言語と比較したら、使える文字のバリエーションがぜんぜん違うわけで、「文字数」でカウントすること自体がおかしいのではないのかと。
    せめて、バイト数で換算すべきだったのでは……。

    --
    しもべは投稿を求める →スッポン放送局がくいつく →バンブラの新作が発売される
    • ここにぶら下げます。
      製品マニュアルとかで、複数の言語で同じ説明が書いてある時「どの言語がコンパクトに表現できるのかな?」っていつも見ちゃうんですが、大差なく見えるんです。

      一文字当たりの情報量は多いのかもしれないけど、占有スペースは同じなんだろうなと。PCの上では固定フォントの場合、通常日本語はアルファベットの2文字分占有しますしね。(半角カタカナとか、㌧㌦ とか例外やで)

      親コメント
      • by Anonymous Coward on 2017年11月09日 16時03分 (#3309608)

        日本語の場合、丁寧語使うと無駄に長くなりますねぇ。英語と比べて短くなってる印象は無い。
        逆に、命令語調で書くとえらく短い。

        まぁ中国語にはかないませんけど。たぶん一番短い。

        あと、占有スペースって点だと、アルファベットは小さく書いても読めるって点は重要。
        漢字かなだと16ドットは欲しいけど、アルファベットなら半分以下でokてな具合で。印刷だと重要じゃないかな。

        親コメント
      • by Anonymous Coward

        なんとかしてうまく返したいんだけど俺の頭じゃデキッコナイス

    • > せめて、バイト数で換算すべきだったのでは……。

      バイト数はエンコードによってぜんぜん違うから、まずそれを指定しないと。

      UTF-8 なら、基本ラテン文字は1オクテット、フランス語やドイツ語で使われるラテン補助は2オクテット、カナや漢字は3オクテット。

      ところがUTF-16ならこれが全部2オクテット。

      親コメント
    • by Anonymous Coward on 2017年11月09日 22時34分 (#3309864)

      せめて、バイト数で換算すべきだったのでは……。

      開発者は楽かもしれないが、
      ユーザーは知ったこっちゃないし、そもそも理解不能だろ。

      親コメント
    • by Anonymous Coward

      極端な例 「菊」⇔「chrysanthemum」
      文字数ではなくバイト数にしたとしても本質的には問題解決にはなっていないですね(表意文字対表音文字)。
      英語換算で何文字かで判断して、ツイッターの公式リアルタイム翻訳エンジンを用意し、その翻訳された英文の文字数でもって判断するとかすれば、より公正な比較になるかもしれない。訳の仕方には文句言わせない。

    • by Anonymous Coward

      ちゃんと読めるかどうかを無視して詰め込めば、て話な気がしなくもないが。

最初のバージョンは常に打ち捨てられる。

処理中...