アカウント名:
パスワード:
私の環境ではその"1byteカナ"のコードが見つからないので,"半角カタカナ”って事で書きます. #jis, euc, sjis の半角カタカナはすべて2byteコードです. #od コマンドあたりで確認できます. #1byteカナって違うものかしら?
作成されたプログラムの都合や管理人の好みで,半角カタカナは禁止になっていたりしますが,RFCは「事実上標準」となる指標となっているだけで,技術の上では準拠する義務はないですよね.掲示板のプログラムとブラウザが対応しているのであれば,利用できる文字が増えて良いでしょう.但し,半角カタカナが表示されず,内容を確認できないユーザが居るとなると,やや気が利かないページってことです.
私は,半角カタカナの使用は人の好き好きで良いと思います. もし自分の掲示板で半角カタカナを表示したくない人がいるなら,自分でCGIを直すか,書き込みする人にお願いすれば良いだけの事です. #私は,半角カタカナ禁止の理由に"RFC"(特にネチケット)を引き合いに出す事の方が, #気になります.自分の言葉で断りを書けば良いのに・・・
メールのネットニュースだと,昔はコードに関係なくヘッダに“日本語”を入れただけで怒られましたが,それはプログラムがまだ対応してなくて,端末画面(やktermとか)全体が化けてしまい,操作不能になったからです. 他にjisなどの漢字コードに制限したり,いろいろありましたよね. CGIだと処理の関係上不具合を起こす事もありましたが,今はそうでもないですよね.
ついでに・・もしiモードメールで半角カタカナを使う人は,ちょっとのお金でもケチるなら濁音や鼻濁音は全角入力をお奨めします.半角カタカナでは“カ゛”となってそれぞれ2byte(計4byte)です.“ガ”なら2byteで済みます.
技術的には、JIS X0201カナ、と呼ぶのが一番いいでしょう。一般の人には通じそうにないのが残念ですが。あと、EUC-JPだと2バイトですね。
で、元たれ込みで問題にされているのは、はっきりはしないけど、Unicode FF60 かなの半角かなと、シフト(符号化表現)JIS 中の A0 からのかな、のように思う。前者は規格上お薦めできない、後者は止める理由はない、それだけだと思うな。
もし自分の掲示板で半角カタカナを表示したくない人がいるなら,自分でCGIを直すか,
半角カナが存在しているがために、それを正しく扱えるようにする、あるいはエラー処理をする、というように何らかの対処をしなければなりません。半角カナなるものが存在するだけで、日本語を扱うアプリケーションの開発者にとって負担が増えてしまいます。
開発者でない一般ユーザでも、半角カナというものが存在していなかったら、うっかりメールで半角カナを使ってしまって叱られる、ということもなかったことでしょう。
JIS X0208ができて、それをコンピュータで扱えるようになった段階でJIS X0201をobsoletedにして、絶滅していてくれた方が、みんなハッピーでいられたと思います。
どっちかっていうと未だにShift_JIS/EUC-JP/ISO-2022-JPが乱立していることの遥かに害悪です。 とっととUnicodeに移行すべし。(Unicodeは最良ではないが既存のどれよりもマシではある)
日本語が存在しているがために、それを正しく扱えるようにする、あるいはエラー処理をする、というように何らかの対処をしなければなりません。
それは例えとしては不適切です。日本語には代替えがないが、JIS X0201カナがなくてもJIS X0208があれば日本語を表現するのに大した不都合はないでしょう。JIS X0201カナは(JIS X0208がある今となっては)日本語にとっては特にいらないものなのです。
「半角カナがあることによって表現力が広がっている」という主張もありますが、もしJIS X0208だけあってJIS X0201カナがもともとなかったとしたらどうでしょうか。「カタカナだけは幅が半分なものが欲しいなあ。そうなれば表現力が高まるのに」という発想が出るでしょうか。私はそうは思いません。現に半角ひらがなはありませんが、それが不都合だという声は聞きません。
日本語を処理すること自体Shift_JIS/EUC-JP/ISO-2022-JPの全てにおいてかなり面倒ですが、それに対して半角カナ特有のコストってそんなに大きいですか?
初期のUNIXでの日本語環境では、半角カナが扱えないものが多かったと聞いています。また、日本語化EmacsではNEmacsは半角カナを扱えませんでした。半角カナを扱えるようになったのはMuleからです。なので半角カナを扱えるようにするのはそれなりに大変だったのではないでしょうか。ちなみに、処理の面倒さという点では3つのコードのうちではEUC-JPが一番ましでしょうね。
そもそもISO-2022-JPでは半角カナを扱えないということにしても、扱えないISO-2022-JPのほうが悪いという言い方もできるわけです。現に全角英数は扱えるわけで。
ISO-2022-JPに半角カナがないのには、カタカナ自体JIS X0208にあるから半角カナはいらないだろうという理由があったのでしょう。半角カナはJIS X0201の右半分という独立した文字集合なので、規格に入れないことによってISO-2022-JPに入れる文字集合を1つ減らすことができます。もっとも、半角カナをうまく扱えない環境が多かったという理由もあったのかも知れませんね。全角英数はJIS X0208の一部なので、全角英数に関しては、「扱えないようにする」方がかえって面倒になるでしょう。
英語版UNIXで日本語を使うたためのアプリケーション(「初期のUNIXでの日本語環境」というのはそういう意味ですよね)では、半
半角カタカナがなくなっても全角カタカナがあるのだからそれほど困ることはないだろうが、日本語がなくなって他の言語、例えば英語を使え、ということになったら英語がうまく話せない人は多いに困るでしょう。
つまり、困る度合いに雲泥の差があるから、同じこと、とはとても言えない。
EUC-JP/Shift_JIS が並存しているがために、それを正しく扱えるようにする、あるいはエラー処理をする、というように何らかの対処をしなければなりません。EUC-JP/Shift_JIS なるものが並存するだけで、日本語を扱うアプリケーションの開発者にとって負担が増えてしまいます。
開発者でない一般ユーザでも、EUC-JP/Shift_JIS というものが並存していなかったら、うっかりメールで EUC-JP/Shift_JIS を使ってしまって叱られる、ということもなかったことでしょう。
Unicode ができて、それをコンピュータで
半角カタカナでは“カ゛”となってそれぞれ2byte(計4byte)です.“ガ”なら2byteで済みます.
MOVE X-KA-DAKUTEN TO N-KA-DAKUTEN.
# 当然、社内では「余計なお世話」という罵声が...
# ^[(I が用いられるものが半角カタカナかな?
(ISO-2022-JP でなく) ISO-2022 の事を仰っているのであればその通りです。
但し、世間には ESC ( J を使って
後は、昔の MSIM みたいに G1 に JIS X 0201 カナがあると仮定 (?) してロックシフト (^N/^O) を使って切り替えるパターンもありました。
EUC-JP の JIS X 0201 カナは、シングルシフト (\x8e) を前置しますので 2 byte になります (なので、EUC-JP も ISO-2022 のお仲間)。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
物事のやり方は一つではない -- Perlな人
半角カタカナのこと? (スコア:1)
私の環境ではその"1byteカナ"のコードが見つからないので,"半角カタカナ”って事で書きます.
#jis, euc, sjis の半角カタカナはすべて2byteコードです.
#od コマンドあたりで確認できます.
#1byteカナって違うものかしら?
作成されたプログラムの都合や管理人の好みで,半角カタカナは禁止になっていたりしますが,RFCは「事実上標準」となる指標となっているだけで,技術の上では準拠する義務はないですよね.掲示板のプログラムとブラウザが対応しているのであれば,利用できる文字が増えて良いでしょう.但し,半角カタカナが表示されず,内容を確認できないユーザが居るとなると,やや気が利かないページってことです.
私は,半角カタカナの使用は人の好き好きで良いと思います.
もし自分の掲示板で半角カタカナを表示したくない人がいるなら,自分でCGIを直すか,書き込みする人にお願いすれば良いだけの事です.
#私は,半角カタカナ禁止の理由に"RFC"(特にネチケット)を引き合いに出す事の方が,
#気になります.自分の言葉で断りを書けば良いのに・・・
メールのネットニュースだと,昔はコードに関係なくヘッダに“日本語”を入れただけで怒られましたが,それはプログラムがまだ対応してなくて,端末画面(やktermとか)全体が化けてしまい,操作不能になったからです.
他にjisなどの漢字コードに制限したり,いろいろありましたよね.
CGIだと処理の関係上不具合を起こす事もありましたが,今はそうでもないですよね.
ついでに・・もしiモードメールで半角カタカナを使う人は,ちょっとのお金でもケチるなら濁音や鼻濁音は全角入力をお奨めします.半角カタカナでは“カ゛”となってそれぞれ2byte(計4byte)です.“ガ”なら2byteで済みます.
kero
Re:半角カタカナのこと? (スコア:1)
1byteカナとか半角カナとか言われますが、どのように呼ぶのも「これならバッチリ!」という感じがしないんですよね。
私は、半角カナと呼んでます。1byteカナだと、コード系により異なるからです。
私の記憶だと、
- JIS(7bit)で1バイト+エスケープシーケンス、
- SJISで1バイト、
- EUCで3バイト
なんですが(親コメントとは違いますが)。
なら、プロポーショナルな世界で半角カナってどういう意味だ、ということにもなりますが、どちらの呼び方も欠点があるなら、歴史もあり広く使われている方を選びます。
半角カナという用語に依存のある人の意見は多数あり、まあ説得力のあるのもありますが、一番笑えたのは「写植業界にそんな言葉はない」というものですね。ここはそんな業界じゃない:-P。
Re:半角カタカナのこと? (スコア:1)
技術的には、JIS X0201カナ、と呼ぶのが一番いいでしょう。一般の人には通じそうにないのが残念ですが。あと、EUC-JPだと2バイトですね。
Re:半角カタカナのこと? (スコア:1)
で、元たれ込みで問題にされているのは、はっきりはしないけど、Unicode FF60 かなの半角かなと、シフト(符号化表現)JIS 中の A0 からのかな、のように思う。前者は規格上お薦めできない、後者は止める理由はない、それだけだと思うな。
半角カタカナは負担である (スコア:1)
半角カナが存在しているがために、それを正しく扱えるようにする、あるいはエラー処理をする、というように何らかの対処をしなければなりません。半角カナなるものが存在するだけで、日本語を扱うアプリケーションの開発者にとって負担が増えてしまいます。
開発者でない一般ユーザでも、半角カナというものが存在していなかったら、うっかりメールで半角カナを使ってしまって叱られる、ということもなかったことでしょう。
JIS X0208ができて、それをコンピュータで扱えるようになった段階でJIS X0201をobsoletedにして、絶滅していてくれた方が、みんなハッピーでいられたと思います。
Re:半角カタカナは負担である (スコア:1)
ということで、今日から全部ANSI文字セットの範囲内だけで記述してください。
どっちかっていうと未だにShift_JIS/EUC-JP/ISO-2022-JPが乱立していることの遥かに害悪です。
とっととUnicodeに移行すべし。(Unicodeは最良ではないが既存のどれよりもマシではある)
Re:半角カタカナは負担である (スコア:1)
それは例えとしては不適切です。日本語には代替えがないが、JIS X0201カナがなくてもJIS X0208があれば日本語を表現するのに大した不都合はないでしょう。JIS X0201カナは(JIS X0208がある今となっては)日本語にとっては特にいらないものなのです。
「半角カナがあることによって表現力が広がっている」という主張もありますが、もしJIS X0208だけあってJIS X0201カナがもともとなかったとしたらどうでしょうか。「カタカナだけは幅が半分なものが欲しいなあ。そうなれば表現力が高まるのに」という発想が出るでしょうか。私はそうは思いません。現に半角ひらがなはありませんが、それが不都合だという声は聞きません。
Re:半角カタカナは負担である (スコア:1)
少なくとも日本語を使う必要のない開発者にとっては半角カナがどうとかいう以前の問題です。
そもそもISO-2022-JPでは半角カナを扱えないということにしても、扱えないISO-2022-JPのほうが悪いという言い方もできるわけです。現に全角英数は扱えるわけで。
Re:半角カタカナは負担である (スコア:1)
初期のUNIXでの日本語環境では、半角カナが扱えないものが多かったと聞いています。また、日本語化EmacsではNEmacsは半角カナを扱えませんでした。半角カナを扱えるようになったのはMuleからです。なので半角カナを扱えるようにするのはそれなりに大変だったのではないでしょうか。ちなみに、処理の面倒さという点では3つのコードのうちではEUC-JPが一番ましでしょうね。
ISO-2022-JPに半角カナがないのには、カタカナ自体JIS X0208にあるから半角カナはいらないだろうという理由があったのでしょう。半角カナはJIS X0201の右半分という独立した文字集合なので、規格に入れないことによってISO-2022-JPに入れる文字集合を1つ減らすことができます。もっとも、半角カナをうまく扱えない環境が多かったという理由もあったのかも知れませんね。全角英数はJIS X0208の一部なので、全角英数に関しては、「扱えないようにする」方がかえって面倒になるでしょう。
Re:半角カタカナは負担である (スコア:0)
英語版UNIXで日本語を使うたためのアプリケーション(「初期のUNIXでの日本語環境」というのはそういう意味ですよね)では、半
半角ひらがな (スコア:1)
PC-8801の漢字ROMに半角ひらがなが載っていました。
半角のカナコードの頭に1バイト付け足すだけで、ひらがなになったので変換は簡単なので、使い勝手はよかったです。
注意点は、2バイト文字であるにもかかわらず、文字の幅が半分だったので、表示位置の計算だけは苦労しました。
半角カタカナでは読みづらいので、文字列の表示ルーチンを作るだけの余裕がある時は、こっちを使ってましたよ。
今でも、残ってないかな?って新しい環境に変わる毎に探す事があります。
その後、X68Kの乗り換えたあとは、もっと便利になりましたね。
SX-Win上のシャーペンだと、文字の縦横の大きさを自由に決めれたので、半角サイズの文字が欲しければ、サイズを8×16(6×12や12×24)ってしてやるだけでした。
今では、大きさと固定かプロポーショナルかしか選べないので、あの頃の自由度がなくなったのが残念です。
Re:半角ひらがな (スコア:1)
日立 Basic Master LIII は、1バイト仮名文字をカタカナで表示
するか、ひらがなで表示するか選択可能だったように覚えています。
この方式が普及していれば、文字コードは字義を示すものであって
字形を示すものではない、という考え方がもっと啓蒙されてたのに。
Re:半角カタカナは負担である (スコア:0)
ナンセンスです。あったらつかっちゃうんですよ。
実例をひとつ。2chでは、実体参照による Unicode 文字利用も
もはや一般的になりつつあります。対応してない環境に大して
コピー&ペーストできない、という意味では半角カナと
変わりません。
同じ事 (スコア:0)
他の言語は幾らでもあると思うんですが。
「日本語があることによって表現力が広がっている」という主張も
あるかもしれない( 'ё')
同じこと、ではない (スコア:1)
半角カタカナがなくなっても全角カタカナがあるのだからそれほど困ることはないだろうが、日本語がなくなって他の言語、例えば英語を使え、ということになったら英語がうまく話せない人は多いに困るでしょう。
つまり、困る度合いに雲泥の差があるから、同じこと、とはとても言えない。
Re:半角カタカナは負担である (スコア:0)
意図的に使っている以上、半角カタカナによって表現の幅を増やしているわけで、なんらかの半角カナ文化ができているのだと思います。
Re:半角カタカナは負担である (スコア:0)
EUC-JP/Shift_JIS が並存しているがために、それを正しく扱えるようにする、あるいはエラー処理をする、というように何らかの対処をしなければなりません。EUC-JP/Shift_JIS なるものが並存するだけで、日本語を扱うアプリケーションの開発者にとって負担が増えてしまいます。
開発者でない一般ユーザでも、EUC-JP/Shift_JIS というものが並存していなかったら、うっかりメールで EUC-JP/Shift_JIS を使ってしまって叱られる、ということもなかったことでしょう。
Unicode ができて、それをコンピュータで
Re:半角カタカナのこと? (スコア:1)
# 当然、社内では「余計なお世話」という罵声が...
Re:半角カタカナのこと? (スコア:1)
パピプペポな文字を示したかったならば,「濁音や半濁音」が正解では?
masashi
Re:半角カタカナのこと? (スコア:1)
(いえ、鼻濁音がカ行以外にあるのかどうかも知らない無学者ですが。)
これは、半角カナでないと表記できませんね。
Re: カに○ (スコア:1)
(機種依存文字とか別の字の流用とかでないはず.)
Re:半角カタカナのこと? (スコア:0)
だから、そういう事態を招かないための RFC なんじゃないの?
>RFCは「事実上標準」となる指標となっているだけで,技術の上では準拠する義務はないですよね
義務ではないでしょうけど、標準に沿うということの意義ってわかりません?
Re:半角カタカナのこと? (スコア:1)
RFCを知っている多くの人々が支持しているだけです.
様々な人が利用するからこのネットワーク間接続は,ある程度選択す
る自由があるから良いと思うのですが・・・
#規制されたいですか?
kero
Re:半角カタカナのこと? (スコア:0)
#RFCを楯に半角カナ反対の人がでてくるといつもそう思う。
#ヘミ猫教…なんちって(笑)
Re:半角カタカナのこと? (スコア:0)
> 私の環境ではその"1byteカナ"のコードが見つからないので,"半角カタカナ”って事で書きます.
> #jis, euc, sjis の半角カタカナはすべて2byteコードです.
> #od コマンドあたりで確認できます.
> #1byteカナって違うものかしら?
EUCが2バイトだというのは正しいけど、
SJISが2バイト???
odの使い方分かってますか?
$ od -t x1 aaa.txt
0000000 ca de b6
0000003
JISって何のことですか?
ISO-2022-JPのことなら、半角かなは使えないので、
Re:半角カタカナのこと? (スコア:1)
>odの使い方分かってますか?
sjisのテキストの作成方法を間違えました.
>ISO-2022-JPのことなら、半角かなは使えないので、
いいえ,ISO-2022-JP ではないです.
エスケープシーケンスとして ^[$B が使われるものを指していました.
どっちにしても,これは半角カタカナじゃなかったですね.
# ^[(I が用いられるものが半角カタカナかな?
kero
Re:半角カタカナのこと? (スコア:1)
(ISO-2022-JP でなく) ISO-2022 の事を仰っているのであればその通りです。
但し、世間には ESC ( J を使って
後は、昔の MSIM みたいに G1 に JIS X 0201 カナがあると仮定 (?) してロックシフト (^N/^O) を使って切り替えるパターンもありました。
EUC-JP の JIS X 0201 カナは、シングルシフト (\x8e) を前置しますので 2 byte になります (なので、EUC-JP も ISO-2022 のお仲間)。
Re:半角カタカナのコード表 (スコア:0)
以下のURLを参照してください。
http://www.rtpro.yamaha.co.jp/RT/docs/misc/code-table.html