CJKV日中韓越情報処理

[cover photo]
  • Ken Lunde 著、小松 章, 逆井 克己 訳
  • 2002年12月 発行
  • 1172ページ
  • ISBN4-87311-108-0
  • フォーマット Print
  • 原書: CJKV Information Processing

この商品は好評につき現在入荷待ちです


本書は日本語情報処理史上の“事件”と称された『日本語情報処理(Understanding Japanese Information Processing)』の続編にあたります。日本語に関する内容を中心に、中国語、韓国語、ベトナム語に関する内容も追加されました。 本書で扱う内容は、各言語の表記体系の概略にはじまり、文字集合の歴史的背景と現状、符号化方式の詳細、コード変換技術、インプットメソッド、フォントフォーマット、タイポグラフィ、出力方式、電子メールやWebにおける処理方法など幅広く、質、量ともに比類のない一冊です。 CやJava、Perlなどで書かれたコード変換やテキスト処理のためのサンプルプログラムも多数掲載し、ソフトウェアの日本語化や国際化に携わる開発者にとっては“バイブル”と言えるでしょう。

日本の読者へ
序文
まえがき

1章 CJKV情報処理の概要
        1.1 複数の表記体系
        1.2 文字集合規格
        1.3 符号化方式
        1.4 インプットメソッド
        1.5 タイポグラフィ
        1.6 基本概念と用語
                1.6.1 いろいろな略称や略語があるが……
                1.6.2 国際化および地域化とは……
                1.6.3 多言語モデルおよびロケールモデルとは……
                1.6.4 区点とは……
                1.6.5 文字と字形―違いは何か……
                1.6.6 書体とフォントの違いは……
                1.6.7 半角文字、全角文字とは……
                1.6.8 ラテン文字とローマ字
                1.6.9 記法とは……
                1.6.10 オクテットとは……
                1.6.11 リトルエンディアン、ビッグエンディアンとは……
                1.6.12 マルチバイトおよびワイド文字とは……
           
2章 CJKVの表記体系
        2.1 ラテン文字と転写
                2.1.1 中国語の転写方式
                2.1.2 日本語の転写方式
                2.1.3 韓国語の転写方式
                2.1.4 ベトナム語のラテン文字転写方法
        2.2 注音符号(Zhuyin)
        2.3 仮名
                2.3.1 平仮名
                2.3.2 片仮名
                2.3.3 仮名の成り立ち
        2.4 ハングル
        2.5 漢字
                2.5.1 漢字の読み
                2.5.2 漢字の構造
                2.5.3 漢字の歴史
                2.5.4 漢字の簡略化
        2.6 中国以外で生まれた漢字
                2.6.1 日本製の漢字―国字
                2.6.2 韓国製の漢字−Gugia
                2.6.3 ベトナム製の漢字−quo-l

3章 CJKVの文字集合規格
        3.1 非符号化文字集合規格
                3.1.1 中国の非符号化文字集合
                3.1.2 台湾の非符号化文字集合
                3.1.3 日本の非符号化文字集合
                3.1.4 韓国の非符号化文字集合
        3.2 符号化文字集合規格
                3.2.1 CJKV 文字集合規格の概観
                3.2.2 ASCII
                3.2.3 さまざまなASCII 文字集合
                3.2.4 CJKV ローマ字
                3.2.5 中国語の文字集合規格―中国
                3.2.6 中国語の文字集合規格―台湾
                3.2.7 中国語の文字集合規格―香港
                3.2.8 中国語の文字集合規格―シンガポール
                3.2.9 日本語の文字集合規格
                3.2.10 韓国語の文字集合規格
                3.2.11 ベトナム語の文字集合規格
        3.3 国際文字集合規格
                3.3.1 UnicodeとISO 10646-1:1993
                3.3.2 GB 13000.1-93
                3.3.3 JIS X 0221-1995
                3.3.4 KS X 1005-1:1995
        3.4 文字集合規格にまつわる怪奇話
                3.4.1 幽霊漢字
                3.4.2 揃わない2 字熟語
                3.4.3 架空の文字集合拡張
        3.5 非符号化文字集合規格と符号化文字集合規格
                3.5.1 中国
                3.5.2 台湾
                3.5.3 日本
                3.5.4 韓国
        3.6 情報交換用文字集合と出版用文字集合
                3.6.1 情報交換用の文字集合
                3.6.2 出版用の文字集合
        3.7 開発者への助言

4章 CJKVの符号化方式
        4.1 ロケールに依存しない符号化方式
                4.1.1 ASCII/CJKV ローマ字符号化
                4.1.2 EBCDIC/EBCDIK コード
                4.1.3 半角片仮名コード
                4.1.4 区点記法
                4.1.5 ISO-2022 符号化
                4.1.6 EUC 符号化
        4.2 ロケール固有の符号化方式
                4.2.1 GBK 符号化―169
                4.2.2 Big5 符号化
                4.2.3 Big5 の符号化―香港拡張
                4.2.4 Big5 Plus 符号化―174
                4.2.5 シフトJIS 符号化―175
                4.2.6 Johab 符号化―178
        4.3 CJKV の符号化方式を比較する
        4.4 国際符号化方式
                4.4.1 UCS-2 およびUCS-4
                4.4.2 UTF 符号化
                4.4.3 UCS、UTF と他の符号化の比較
        4.5 Charset 名称
                4.5.1 文字集合と符号化
                4.5.2 Charset の登録
        4.6 コードページ
                4.6.1 IBM のコードページ
                4.6.2 Microsoft のコードページ
        4.7 コード変換
                4.7.1 中国語コードの変換
                4.7.2 日本語コードの変換
                4.7.3 韓国語コードの変換
                4.7.4 CJKV ロケール間のコード変換
                4.7.5 コード変換のヒントと技
        4.8 破損したCJKVファイルの修復
                4.8.1 Quoted-Printable 変換
                4.8.2 Base64 変換
                4.8.3 その他の種類の符号修復
        4.9 バイトの並び順に関する問題
        4.10 開発者への助言

5章 入力方式(インプットメソッド)
        5.1 転写技術
                5.1.1 注音入力と併音入力
                5.1.2 仮名入力とローマ字入力
                5.1.3 ハングル入力と転写入力
        5.2 入力技術
                5.2.1 インプットメソッド
                5.2.2 変換辞書
                5.2.3 読みによる入力
                5.2.4 構造による入力
                5.2.5 複数の条件による入力
                5.2.6 コードによる入力
                5.2.7 その他のコードによる入力
                5.2.8 郵便番号による入力
                5.2.9 連想入力
        5.3 ユーザインタフェース関連
                5.3.1 インライン変換
        5.4 キーボード配列
                5.4.1 欧米のキーボード配列
                5.4.2 漢字キーボード配列
                5.4.3 中国語入力キーボード配列
                5.4.4 仮名キーボード配列
                5.4.5 ハングルキーボード配列
                5.4.6 CJKV 入力用のローマ字キーボード配列
        5.5 その他の入力ハードウェア
                5.5.1 ペン入力
                5.5.2 光学式文字認識(OCR)
                5.5.3 音声入力
        5.6 入力ソフトウェア
                5.6.1 CJKV 入力ソフトウェア
                5.6.2 中国語入力ソフトウェア
                5.6.3 日本語入力ソフトウェア
                5.6.4 韓国語入力ソフトウェア

6章 フォントフォーマット
        6.1 書体設計について
                6.2 ビットマップフォント
                6.2.1 BDF フォント
                6.2.2 HBF フォント
                6.3 アウトラインフォント
                6.3.1 PostScript フォント
                6.3.2 TrueType フォント
                6.3.3 OpenType ― PostScript とTrueType の併合
        6.4 ルビフォント
                6.4.1 ルビフォントにもファミリーがある
        6.5 ホストベースフォントとプリンタフォント
                6.5.1 PostScript ファイルシステム
                6.5.2 MacOS
                6.5.3 Microsoft Windows(バージョン3.1、95、98)
                6.5.4 X Window System
                6.5.5 プラットフォーム間の問題
        6.6 自作フォントの作成
                6.6.1 ビットマップフォントエディタ
                6.6.2 標準のアウトラインフォントエディタ
                6.6.3 CJKV アウトラインフォントエディタ
                6.6.4 フォントフォーマットの変換
                6.6.5 フォントのインストールとダウンロード
                6.6.6 フォントはどこまで大きくなれるのか
        6.7 外字の扱い
                6.7.1 外字問題
                6.7.2 外字を扱う技術、そして秘訣
                6.7.3 XKP─外字制御の第一歩
                6.7.4 Adobe Type Composer:外字のフロントエンド
                6.7.5 合成フォントの自作
                6.7.6 外字の入手
        6.8 開発者への助言

7章 タイポグラフィ
        7.1 規則、規則、規則……
                7.1.1 JIS X 4051-1995 への適合
                7.1.2 GB/T 15834-1995 とGB/T 15835-1995
        7.2 組版の単位と計量法
                7.2.1 2 つの重要な“ポイント”
                7.2.2 その他の単位
        7.3 縦組みと横組み
                7.3.1 非正方形のデザインスペース
                7.3.2 文字グリッド
                7.3.3 縦書き用の字形
                7.3.4 縦書き中の欧字
        7.4 禁則処理
        7.5 均等割付
        7.6 代替メトリックス
                7.6.1 半角の記号類および句読点
                7.6.2 プロポーショナル幅の記号類および句読点
                7.6.3 プロポーショナル仮名
                7.6.4 プロポーショナル漢字
        7.7 カーニング
        7.8 行長の問題
                7.8.1 記号類および句読点の調整
                7.8.2 文字間の空きの調節
        7.9 多言語テキスト
                7.9.1 ベースラインの調節
                7.9.2 欧字とCJKV 文字間の空き(和欧文語間)
                7.9.3 ラテン書体とCJKV 書体の混在
        7.10 字形置換
                7.10.1 異体字
                7.10.2 合字
        7.11 ルビおよび圏点、傍点
                7.11.1 ルビ
                7.11.2 割注
                7.11.3 圏点、傍点
        7.12 組版ソフトウェア
                7.12.1 ページレイアウトソフトウェア
                7.12.2 グラフィックスソフトウェア

8章 出力環境
        8.1 フォントはどこに
        8.2 プリンタ出力
        8.3 PostScript CJKVプリンタ
                8.3.1 純正PostScript
                8.3.2 PostScript クローン
                8.3.3 文字をPostScript に渡す
        8.4 画面表示
                8.4.1 Adobe Type Manager ― ATM
                8.4.2 Super ATM
                8.4.3 Adobe Acrobat
                8.4.4 TrueType
        8.5 その他の印刷方式
        8.6 プリンタドライバの役割
                8.6.1 Microsoft Windows のプリンタドライバ
                8.6.2 MacOS のプリンタドライバ
        8.7 出力のヒントとこつ
                8.7.1 CJKV に対応していないシステム用のCJKV 文書の作成
        8.8 開発者への助言
                8.8.1 CJKV 対応DTP システムの入手
                8.8.2 実践的な助言

9章 情報処理技術
        9.1 言語、国、スクリプトコード
        9.2 プログラミング言語
                9.2.1 C/C++
                9.2.2 Java
                9.2.3 Perl
                9.2.4 Python
                9.2.5 Tcl
                9.2.6 その他のプログラミング環境
        9.3 コード変換のアルゴリズム
                9.3.1 ISO-2022 とEUC 間の変換
                9.3.2 ISO-2022 と区点間のコード変換
                9.3.3 ISO-2022-JP とシフトJIS 間のコード変換
                9.3.4 EUC-JP とシフトJIS 間のコード変換
                9.3.5 その他の種類のコード変換
        9.4 Java プログラミングの例
                9.4.1 Java によるコード変換
                9.4.2 Java のテキストストリーム処理
                9.4.3 Java の“Charset”指定子
        9.5 その他のアルゴリズム
                9.5.1 日本語符号化方式の検出
                9.5.2 Java による半角片仮名から全角片仮名への変換
                9.5.3 コードの修復
        9.6 バイト処理と文字処理
                9.6.1 文字の削除
                9.6.2 文字の挿入
                9.6.3 文字の検索
                9.6.4 行の分割
                9.6.5 C のマクロによる文字属性の判定
        9.7 文字の排列
        9.8 自然言語処理
                9.8.1 単語への分解
                9.8.2 スペルと文法のチェック
        9.9 正規表現
        9.10 検索エンジン
        9.11 コード処理ツール
                9.11.1 JConv ―コード変換ツール
                9.11.2 JChar ―文字一覧生成ツール
                9.11.3 CJKV 文字集合サーバ
                9.11.4 JCode ―テキストファイル検査ツール
                9.11.5 その他の便利なツール

10章 オペレーティングシステム、テキストエディタ、ワープロ
        10.1 CJKV 非対応システム上でのCJKV テキスト表示
        10.2 オペレーティングシステム(OS)
                10.2.1 MS-DOS
                10.2.2 Microsoft Windows 95 および98
                10.2.3 Microsoft Windows NT
                10.2.4 MacOS
                10.2.5 Unix
                10.2.6 BeOS
                10.2.7 FreeBSD
                10.2.8 Linux
                10.2.9 MkLinux
                10.2.10 OS/2
                10.2.11 TRON
        10.3 ハイブリッド環境
                10.3.1 MacOS 言語キット
                10.3.2 MASS ― Microsoft Windows とUnix
                10.3.3 PanALE ― MacOS
                10.3.4 RichWin ― Microsoft Windows
                10.3.5 TwinBridge ― Microsoft Windows
                10.3.6 UnionWay ― Microsoft Windows
                10.3.7 X Window System ― UNIX
        10.4 テキストエディタ
                10.4.1 MacOS 上のテキストエディタ
                10.4.2 Windows 上のテキストエディタ
                10.4.3 各種のEmacs およびGNU Emacs
                10.4.4 各種のvi
        10.5 ワープロ
                10.5.1 AppleWorks ― MacOS
                10.5.2 HWP ― Microsoft Windows
                10.5.3 一太郎― MacOS、Microsoft Windows
                10.5.4 JWP ― Microsoft Windows
                10.5.5 KanjiWORD ― Microsoft Windows
                10.5.6 Microsoft Office ― Microsoft Windows
                10.5.7 Nisus Writer ― MacOS
                10.5.8 NJStar ― Microsoft Windows
                10.5.9 UniText ― MacOS
        10.6 ワープロ専用機

11章 辞書と辞書ソフトウェア
        11.1 漢字字典の索引
                11.1.1 読み方索引
                11.1.2 部首索引
                11.1.3 総画索引
                11.1.4 その他の索引
        11.2 字典
                11.2.1 字典としての文字集合規格
                11.2.2 地域固有の字典
                11.2.3 ベンダによる字典や文字表
                11.2.4 CJKV 字典
        11.3 役に立つその他の字典
                11.3.1 普通の字典
                11.3.2 異体字字典
        11.4 辞書ハードウェア
        11.5 辞書ソフトウェア
                11.5.1 辞書CD-ROM
                11.5.2 辞書CD-ROM 用のフロントエンドソフトウェア
                11.5.3 辞書ファイル
                11.5.4 辞書ファイルのフロントエンドソフトウェア
                11.5.5 Web 上の辞典
        11.6 機械翻訳ソフトウェア
                11.6.1 機械翻訳サービス
        11.7 学習支援

12章 インターネット
        12.1 電子メール
                12.1.1 電子メールの送信
                12.1.2 電子メールの受信
                12.1.3 電子メールアドレスのテンプレート
                12.1.4 電子メールのトラブルとその回避策
        12.2 ニュース
                12.2.1 ニュースの投稿
                12.2.2 ニュースの表示
        12.3 FTP とtelnet
                12.3.1 FTP 関連
                12.3.2 telnet 関連
        12.4 ネットワークドメイン
                12.4.1 CN ドメイン
                12.4.2 JP ドメイン
                12.4.3 KR ドメイン
                12.4.4 TW ドメイン
        12.5 実際に接続するには
        12.6 インターネットソフトウェア
                12.6.1 電子メールクライアント
                12.6.2 Web ブラウザ
                12.6.3 telnet クライアント
                12.6.4 端末ソフトウェア
                12.6.5 ニュース閲覧ソフトウェア

13章 WWW
        13.1 内容と表現
                13.1.1 HTML ― HyperText Markup Language
                13.1.2 XML ― Extensible Markup Language
                13.1.3 PDF ― Portable Document Format
        13.2 Web 文書の表示
        13.3 HTML文書の作成
                13.3.1 HTML の特殊な属性とタグ
                13.3.2 HTML 文書の作成ツール
                13.3.3 画像化したCJKV テキストの埋め込み
        13.4 XML文書の作成
        13.5 PDF 文書の作成
                13.5.1 PDF はDTP を楽にする
        13.6 文字参照
        13.7 CGI プログラミング例
        13.8 サーフィンしようか


付録A コード変換表

付録B 異なる記法間の値の変換表

付録C ベンダ独自の文字集合規格
        C.1 ベンダ独自の中国語文字集合規格─中国
                C.1.1 DEC漢字
                C.1.2 IBMの簡体字
                C.1.3 MacOS-Sの文字集合
        C.2 ベンダ独自の中国語文字集合規格─台湾
                C.2.1 DEC漢語
                C.2.2 ETen文字集合
                C.2.3 IBMの繁体字
                C.2.4 MacOS-T文字集合
                C.2.5 Microsoft繁体字
        C.3 ベンダ独自の中国語文字集合規格─香港
                C.3.1 ダイナラブの香港拡張
                C.3.2 モノタイプの香港拡張
        C.4 ベンダ独自の日本語文字集合規格
                C.4.1 Biblos外字文字集合
                C.4.2 DEC漢字
                C.4.3 エヌフォー外字文字集合
                C.4.4 Fontworksの日本語文字集合
                C.4.5 富士通の文字集合
                C.4.6 日立の文字集合
                C.4.7 HP 漢字
                C.4.8 IBM 日本語
                C.4.9 IKIS
                C.4.10 K-JIS
                C.4.11 MacOS 日本語版の文字集合
                C.4.12 Microsoft 日本語
                C.4.13 NEC 漢字
                C.4.14 NTT 漢字
                C.4.15 TRON 文字集合
        C.5 ベンダ独自の韓国語文字集合規格
                C.5.1 DEC 韓国語
                C.5.2 HangulTalk 文字集合
                C.5.3 IBM 韓国語
                C.5.4 Unified Hangul Code(UHC、統合ハングルコード)

付録D ベンダ独自の符号化方式
        D.1 IBMの符号化の概略
                D.1.1 IBM のDBCS-PC 符号化
                D.1.2 IBM のDBCS-EUC とTBCS-EUC 符号化
        D.1.3 IBM のDBCS-Host 符号化
        D.2 ベンダ独自の中国語符号化─中国
                D.2.1 DEC 漢字の符号化
                D.2.2 IBM 簡体字の符号化
                D.2.3 MacOS-S の符号化
        D.3 ベンダ独自の中国語符号化─台湾
                D.3.1 DEC 漢語の符号化
                D.3.2 ETen 符号化
                D.3.3 IBM の繁体字符号化
                D.3.4 MacOS-T の符号化
                D.3.5 Microsoft の繁体字符号化
        D.4 ベンダ独自の中国語符号化─香港
                D.4.1 ダイナラブの香港符号化
                D.4.2 モノタイプの香港符号化
        D.5 ベンダ独自の日本語符号化
                D.5.1 DEC 漢字の符号化
                D.5.2 富士通の日本語符号化
                D.5.3 HP 漢字符号化
                D.5.4 IBM の日本語符号化
                D.5.5 IKIS の符号化
                D.5.6 KEIS の符号化
                D.5.7 MacOS 日本語版符号化
                D.5.8 Microsoft の日本語符号化
                D.5.9 NEC 漢字の符号化
                D.5.10 NTT 漢字の符号化
                D.5.11 TRON の符号化
        D.6 ベンダ独自の韓国語符号化
                D.6.1 DEC の韓国語符号化
                D.6.2 Hangul Talk の符号化
                D.6.3 IBM の韓国語符号化
                D.6.4 UHC(統合ハングルコード)の符号化

付録E GB 2312-80のコード表

付録F GB/T 12345-90のコード表

付録G CNS 11643-1992のコード表
        G.1 CNS 11643-1992 1 面
        G.2 CNS 11643-1992 2 面
        G.3 CNS 11643-1992 3 面
        G.4 CNS 11643-1992 4 面
        G.5 CNS 11643-1992 5 面
        G.6 CNS 11643-1992 6 面
        G.7 CNS 11643-1992 7 面
        G.8 CNS 11643-1992 15 面

付録H Big5 のコード表
        H.1 Big5 第1 水準
        H.2 Big5 第2 水準

付録I 香港GCCSのコード表

付録J JIS X 0208:1997のコード表

付録K JIS X 0212-1990のコード表

付録L KS X 1001:1992のコード表

付録M KS X 1002:1991の漢字表

付録N ハングルの読みの表

付録O TCVN 6056:1995のコード表

付録P コード表の索引
        P.1 GB 2312-80 第1級(第1水準)の読みによる索引
        P.2 GB 2312-80 第2級(第2水準)の部首による索引
        P.3 Big5 とCNS 11643-1992 の画数による索引
        P.4 JIS X 0208:1997 第1 水準の読みによる索引
        P.5 JIS の部首による索引
        P.6 KS漢字の読みによる索引

付録Q 文字表と対応表
        Q.1 GB 2312-80 とGB/T 12345-90
        Q.2 CNS 11643-1986 とCNS 11643-1992
        Q.3 JIS C 6226-1978 とJIS X 0208-1983
                Q.3.1 違い─その1
                Q.3.2 違い─その2
                Q.3.3 違い─その3
                Q.3.4 違い─その4
        Q.4 JIS X 0208-1983 とJIS X 0208-1990
        Q.5 JIS X 0212-1990 とJIS C 6226-1978
        Q.6 常用漢字
        Q.7 IBM 専用の漢字と非漢字
        Q.8 KS X 1001:1992 の重複漢字

付録R 漢字の一覧表
        R.1 中国の漢字表
                R.1.1 中国の常用漢字
                R.1.2 中国の次常用漢字
        R.2 台湾の漢字表
                R.2.1 台湾の常用漢字
                R.2.2 台湾の次常用漢字
        R.3 日本の漢字表
                R.3.1 常用漢字
                R.3.2 学習漢字
                R.3.3 人名用漢字
        R.4 韓国の漢字表
                R.4.1 常用漢字
                R.4.2 常用漢字の中学校用サブセット

付録S 1バイトコード表
        S.1 非CJKV文字集合のコード表
                S.1.1 ASCII のコード表
                S.1.2 EBCDIC のコード表
                S.1.3 ISO 8859-1:1998 のコード表
        S.2 中国語のコード表
                S.2.1 GB ローマ字のコード表
                S.2.2 CNS ローマ字のコード表
        S.3 日本語のコード表
                S.3.1 JIS ローマ字と半角片仮名のコード表
                S.3.2 半角片仮名のコード表
                S.3.3 EBCDIK のコード表
        S.4 韓国語のコード表
                S.4.1 KS ローマ字のコード表
                S.4.2 字母(Jamo)のコード表
        S.5 ベトナム語のコード表

付録T ソフトウェアとドキュメントの問い合わせ先
        T.1 Anounymous FTP(匿名FTP)
        T.2 ファイルの検索
        T.3 便利なURL
        T.4 商用製品の開発元

付録U メーリングリスト
        U.1 一般のメーリングリスト
                U.1.1 AsianDOC Electronic Newsletter
                U.1.2 BeOS メーリングリスト
                U.1.3 Framers メーリングリスト
                U.1.4 FreeHand-L メーリングリスト
                U.1.5 IETF Characters メーリングリスト
                U.1.6 ISO 10646 メーリングリスト
                U.1.7 Language Tech News メーリングリスト
                U.1.8 Mozilla Language Enabling プロジェク   ト
                U.1.9 Mule メーリングリスト
                U.1.10 Nisus メーリングリスト
                U.1.11 PAGEMAKER メーリングリスト
                U.1.12 QUARKXPR メーリングリスト
                U.1.13 Unicode メーリングリスト
                U.1.14 WWW International メーリングリスト
        U.2 中国語のメーリングリスト
                U.2.1 CCNET-L メーリングリスト
        U.3 日本語のメーリングリスト
                U.3.1 Canna メーリングリスト
                U.3.2 EDICOLOR メーリングリスト
                U.3.3 フォントメーリングリスト
                U.3.4 Honyaku メーリングリスト
                U.3.5 NIHONGO メーリングリスト
                U.3.6 Nihongo-Computing メーリングリスト
                U.3.7 RES-JAPAN-GROUP メーリングリスト
                U.3.8 SKK メーリングリスト
                U.3.9 T-Code メーリングリスト
        U.4 韓国語のメーリングリスト
                U.4.1 Hangul メーリングリスト

付録V 専門の団体
        V.1 Chinese and Oriental Languages Information Processing Society
        V.2 International Macintosh User Group
        V.3 The Localisation Industry Standards Association
        V.4 Oriental Languages Computer Society
        V.5 The Unicode Consortium

付録W Perlのプログラム例
        W.1 日本語コード変換
                W.1.1 ISO-2022-JP からEUC-JP への変換
                W.1.2 EUC-JP からISO-2022-JP への変換
                W.1.3 ISO-2022-JP またはEUC-JP からシフトJIS への変換
                W.1.4 シフトJIS からISO-2022-JP への変換
                W.1.5 シフトJIS からEUC-JP への変換
                W.1.6 半角片仮名から全角片仮名への変換
        W.2 韓国語コード変換
                W.2.1 ISO-2022-KR またはEUC-KR からJohab への変換
        W.2.2 Johab からISO-2022-KR またはEUC-KR への変換
        W.3 TRONコードの変換
                W.3.1 TRON とGB 2312-80 間のコード変換
                W.3.2 TRON とKS X 1001:1992 間のコード変換
        W.4 Unicode のコード変換
                W.4.1 UCS-2 からUTF-8 への変換
                W.4.2 UTF-8 からUCS-2 への変換
        W.5 符号化の識別
        W.6 ISO-2022-JP 符号化の修復
        W.7 その他の便利な変形処理
        W.7.1 URL 変形
        W.7.2 Quated-Printable変形
        W.8 CJKV符号化のテンプレート
                W.8.1 EUC-CN とEUC-KR 符号化
                W.8.2 Big5 符号化
                W.8.3 GBK とBig5 Plus 符号化
                W.8.4 EUC-TW 符号化
                W.8.5 シフトJIS 符号化
                W.8.6 EUC-JP 符号化
                W.8.7 Johab 符号化
                W.8.8 UHC 符号化
                W.8.9 UCS-2 とUTF-16 符号化
                W.8.10 UTF-8 符号化
                W.9 マルチバイトアンカーリング
        W.10 マルチバイト処理

付録X 用語集

参考文献

索引

訳者あとがき

Feedback

皆さんのご意見をお聞かせください。ご購入いただいた書籍やオライリー・ジャパンへのご感想やご意見、ご提案などをお聞かせください。より良い書籍づくりやサービス改良のための参考にさせていただきます。
[feedbackページへ]