・コンピュータを使ってデータを表現する方法。文字コードやデータ容量も解説
・ウェブカツネットワーク・サーバー部(1)サーバーとは
・コンピュータサイエンスとは?関連領域や学ぶ意義など
エンコーディングとは
・エンコーディング:データを一定の規則に基づいて符号化すること。
・OSがフォントから文字単体を引き出すには、Sift-JisやUnicodeなどの文字コードを使用する。
文字コードの種類
・JISコード
JISコードは、インターネットや電子メールで日本語を表記する際に、最も標準的に使用されている文字コード
日本工業規格(JIS)により定められた7ビット単位の符号化方式
・Shift-JISコード
Microsoft社により定められたコードです。
WindowsやMS-DOS、Macで使用されています。
エスケープシーケンスは使用されていません。
半角文字も全角文字も一律2バイト(16ビット)で扱うので、表示された文字数とバイト数が一致する
・ASCIIコード
ASCIIはAmerican Standard Code for Information Interchangeの略です。
アメリカ規格協会(ANSI)が制定した文字コードで、1文字を7ビットで表現しており、誤り検出用に1ビットを付加した8ビットで構成されています。
ラテンアルファベット、数字、記号、空白文字、制御文字などの128文字を表現することができます。
ASCIIコードで扱っている文字はいわゆる半角文字となりますが、古くから使用しているメールソフトやブラウザでは半角カナに対応していない場合があるので避けるべきとされています。
→このASCIIコードで定義した文字を、Unicodeで使う事を目的として制定されたのがUTF-8。
・Unicode
コンピュータに適していない文字コードを使用すると、いわゆる文字化けを起こしてしまいます。
例えばWindowsで作成したファイルをメールでUnix/Linux系のコンピュータへ送信したら、意味の分からない文字列になってしまい
そういった問題を解消するために、Unicodeはユニコード・コンソーシアムにより制定されました。文字を4バイトで表現し、アルファベット、漢字、カナ、アラビア文字など世界中の文字を表現しようとしています。
現在はISOで規格化されており、JavaやXMLは基本コードとしてUnicodeを採用しています。
UTF-8とは
UTF-8とは、世界的にも最もポピュラーな文字コードで、Unicode用の符号化方式の1つです。
ASCIIで定義している文字を、Unicodeでそのまま使用することを目的として制定
UTF-8は、ASCIIコードとの互換性が高いことから、世界中の多くのソフトウェアが用いています。
この記事へのコメントはありません。