拡張ラテン文字とは何か。

8月 27, 2010 under 何か

ども。
ここ数日、某学会のWEBサイト上で稼働させるデータベースをいぢくっている。
テキストベースのデータをperl言語のCGIでhtmlファイルに出力するものであるが、拡張ラテン文字の表記について勉強していた。
いわゆるウムラウト付文字やアクセント記号付きの文字、それにギリシア文字などである。
これらはWindows上のアプリケーションや、テキストでもunicodeの場合には問題はあまりないのだが、日本語のようにJIS-codeを使用するテキストデータの場合には通常は表記できない。
二つのコードを混在させることができないからだ。
そこでアクセント分解して表記する、ということも代替案として提案されている。
アクセント付き文字の変換表 0.11
つまり、当該文字を亀甲カッコでくくり、
Üを[U:]
のように表示させるのである。
この種類のカッコを使い、表意に規則性を持たせることによって、環境を変えて表記可能になった場合には一括して本来の表記に戻せるように配慮されている。
が、これではなんとも見栄えが悪い。
解決法はないかと色々と検索していたところ、拡張ラテン文字の呼び出し法が見つかった。
文字実体参照というものである。
これは便利である。
こんなのも、
Ç
こんなのも、
Í
こんなのも、
Æ
こんなのも、
ñ
こんなのだって、
æ
できちゃう。
こんなのも、
¿
こんなのも、
¢
こんなのだって、
ø
できちゃう。
この情報は中央大学のWEBサイト上にあげられている。
関心をお持ちの方はご参照ください。
日本語のWebページで、ウムラウト付きの文字を表示させる方法

comments: 0 »

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

Comment

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

This blog is kept spam free by WP-SpamFree.