基本データ形式

基本データ形式の説明

要素の内容や属性の値として使用されるデータ型は以下のとおりです。

1. 大文字・小文字の扱い

大文字・小文字の扱いは、次のキーワードで示されます。

  • CS : 値に大文字・小文字の区別があります。「a」と「A」は異なるものとなります。
  • CI : 値に大文字・小文字の区別がありません。「a」と「A」とを等しいものとなります。
  • CN : 数値などのため、値の大文字・小文字の区別は無関係です。
  • CA : 要素あるいは属性の定義自体が大文字・小文字を区別します。
  • CT : 大文字・小文字の区別については、各データ形式の定義を参照してください。

属性の値がリスト形式のときには、他に特記されていない限りリスト中の全ての値に適用されます。

2. SGML基本形式

文書型定義(DTD)は、HTMLの要素内容や属性値のシンタクスについて、PCDATA、CDATA、NAME、ID等のSGMLトークンを用いて定めます。トークンの完全な定義は[ISO8879]を参照してください。

  • CDATAは、文書文字集合中の任意の文字の列であり、文字実体をも含みます。
    • 文字実体は文字で置き換える。
    • 改行文字LFは無視する。
    • 個々の改行文字CRあるいはタブ文字は、1つの空白文字で置き換える。

    CDATA型属性値の、冒頭あるいは末尾の空白文字を無視します。

    style要素script要素はCDATA型の内容モデルを持っていますが、両要素についてはCDATAを以上とは異なる方法で処理します。マーク付けと実体は生のテキストとして扱い、あるがままでアプリケーションに渡します。最初に現れる文字列「</」(終了タグ開始区切り子)は、そこで要素の内容が終わるものとして扱います。

  • IDトークンとNAMEトークンは、アルファベット([A-Za-z])で開始し、任意の数のアルファベット、数字、([0-9])、ハイフン(-)、アンダースコア(_)、コロン、(:)、ピリオド(.)のみで記述する必要があります。
  • IDREFIDREFSは、他の属性で定義されるIDトークンへの参照です。IDREFは単一のトークンで、複数形のIDREFSはスペース区切りで列記したトークンのリストになります。
  • NUMBERトークンは、1桁以上の数字([0-9])です。

3. テキスト列

DTDで %Text; と示される多くの属性値は、「人間が読んで解る」という意味の普通のテキストを示します。

4. URI

URI(%URI;)は、[URI]が定義する通りの意味で用います。

URIにはURLも含まれます。([RFC1738][RFC1808]で定義されています。)

相対URIは、基底URIを用いてフルURIへと解決されます。基底URIについては、base要素の解説を参照してください。

URIは基本的に大文字小文字の区別があります。コンピュータ名など、URIあるいはURIの一部分において大文字小文字が区別されない場合もありますが、安全性の面からURIは常に大文字小文字を区別すると覚えたほうがいいです。

5. 色

属性値形式「色」(%Color;)は、[SRGB]モデルで定義される色指定を表します。

色の値は、#記号を冒頭につけた16進数値、または、下記の16個の色名の、どちらかとします。色の値は、大文字小文字を区別しません

色名とsRGB値
Black = "#000000" Green = "#008000"
Silver = "#C0C0C0" Lime = "#00FF00"
Gray = "#808080" Olive = "#808000"
White = "#FFFFFF" Yellow = "#FFFF00"
Maroon = "#800000" Navy = "#000080"
Red = "#FF0000" Blue = "#0000FF"
Purple = "#800080" Teal = "#008080"
Fuchsia = "#FF00FF" Aqua = "#00FFFF"

5-1. 色を用いる際の注意

カラー化によって、文書はより多くの情報を表すようになり、また読みやすくもなりますが、カラー化については以下の指針を考慮に入れることを勧めます。

  • HTML4.01では、HTMLの要素や属性によって色指定を行うことを推奨していません。その代わりにスタイルシートを用いるようにしましょう。
  • 色盲の人に配慮した配色にします。見分けにくい色の組み合わせには様々なパターンがありますが、どのパターンにおいても見分けやすい色の組み合わせで配色するようにします。
  • 背景画像や背景色の指定を行う場合は、同時にテキスト類への色指定も行うこと。
  • body要素font要素、そして表のbgcolorによる色指定は、環境が違うと見え方も異なります。(例えば、ワークステーション、マック、ウインドウズの違いや、液晶表示とCRT表示の違い。) 従って、ある特定機種での見栄えに完全に依存するべきではありません。

6. 長さ

HTMLには、属性値となる長さの形式に、3つの形式があります。

  • ピクセル : ピクセル(%Pixels;)の値は、スクリーンや紙などキャンバスに表示する際のピクセル数を表す整数です。従って、「50」という値は50ピクセルを意味します。ピクセルに関する規範的情報は、[CSS1]を参照してください。
  • 長さ : 長さ(%Length;)の値は、%Pixel;または水平・垂直方向で利用可能な空間に対するパーセンテージです。従って、「50%」という値は、可能な空間の半分を意味します。
  • 複合長 : 複合長(%MultiLength;)の値は、%Length;または『相対的な長さ』です。『相対的な長さ』は、「i*」という形式で示し、この「i」は整数です。複数の要素が表示可能空間を取り合う場合、ユーザエージェントは、ピクセル及びパーセントで示された長さを先に割り当て、その残りを相対的な長さで分割します。相対指定されている区画は、分割可能な空間について、「*」のついた整数の比率に従って分配を受けます。値が「*」の場合は、「1*」に等しくなります。従って、ピクセル値とパーセント値を割り当て終えた残りが60ピクセルだったとしたとき、「1*、2*、3*」という3つの相対指定があれば、「1*」には10ピクセル、「2*」には20ピクセル、「3*」には30ピクセルが割り当てられることになります。

なお、長さの値は大文字小文字の区別に無関係です。

7. MIMEタイプ

MIMEタイプ(%ContentType;)は大文字小文字を区別しません

MIMEタイプの例には、以下のようなものがあります。現在登録されているMIMEタイプの一覧は、[MIMETYPES]を参照してください。

text/htmlHTMLファイル
text/cssCSSファイル
text/javascriptJavaScriptファイル
image/gifGIF画像ファイル
image/jpegJPEG画像ファイル
image/pngPNG画像ファイル
audio/midiMIDIサウンドファイル
video/mpegMPEG映像ファイル
application/pdfAdobe PDFファイル
application/javaJAVAアプレットファイル

8. 言語コード

属性値が言語コード(%LanguageCode;)の場合、[RFC1766]の2が定義する内容を指します。

言語コードは大文字小文字を区別しません。また、空白文字を含めることはできません。

言語コードの例には、以下のようなものがあります。

arアラビア語
deドイツ語
en英語
esスペイン語
frフランス語
itイタリア語
ja日本語
ko韓国語
laラテン語
ptポルトガル語
ruロシア語
zh中国語

9. 文字符号化方法

「charset属性」(%Charset;)は、文字符号化方法を指し、「euc-jp」等のように、[IANA]に登録された文字列でなければいけません。登録されている全一覧は、[CHARSETS]を参照してください。

文字符号化方法の名称は、大文字小文字を区別しません

ユーザエージェントは、次の優先順位で文字符号化方法を決定します。

  • HTTPヘッダのContent-Typeフィールドのcharset属性。
  • meta要素でhttp-equiv属性値が "Content-Type" かつ value属性の値にcharset情報があるもの。meta要素の宣言は、head要素の可能な限り先頭の方に記述するようにします。
  • 外部リソースを指している要素に設定されているcharset属性値。

また、ユーザエージェントは一般的に、文字符号化方法の情報が得られない場合に利用するローカルなデフォルト文字符号化方法を、ユーザが設定できるようになっています。

日本語の文字符号化方法の例には、「Shift_JIS」「EUC-JP」「UTF-8」などがあります。

10. 単一文字

%Character;は、任意の1文字(単一文字)を指します。

この単一文字は、「&amp;」のように、文字参照で指定することもできます。

11. 日付と時刻

[ISO8601]では、日付と時刻(%Datetime;)の表現に関して、多くのオプションとバリエーションが認められていますが、HTML4.01では、プロファイル[DATETIME]で記述される1つの形式のみを正当な日付/時刻文字列として採用しています。

[DATETIME]は閏秒を指定することができません。

11-1. 日付・時間の表記方法(ISO8601形式)

YYYY-MM-DDThh:mm:ssTZD

YYYY年 (4桁)
MM月 (2桁)
DD日 (2桁)
hh時 (2桁/00〜23)
mm分 (2桁/00〜59)
ss秒 (2桁/00〜59)
TZDタイムゾーン
ZUTC (協定標準時)
+hh:mmUTCよりhh時間mm分進んでいる現地時間
-hh:mmUTCよりhh時間mm分遅れている現地時間

年は4桁、それ以外は2桁で指定します。

区切り「T」を含めて、全ての文字を指定どおりに書く必要があります。

たとえば、日本(+09:00)で、2002年8月27日22時33分44秒の場合は、以下のように記述します。

2002-08-27T22:33:44+09:00

12. リンクタイプ

リンクタイプ(%LinkTypes;)は、スペースで区切って複数の値を指定をすることができます。個々のリンクタイプ自体には、スペースの存在は許されません。

リンクタイプは大文字小文字を区別しません

  • Alternate : 別バージョンの文書を指します。lang属性と併用した場合は、その言語の翻訳版を示します。media属性と併用した場合は、別メディア版を示します。
  • Stylesheet : 外部スタイルシートを指します。「Alternate」と併用した場合は、ユーザが選択可能な代替スタイルシートを示します。
  • Start : 続き物の文書群の、最初の文書を指します。検索エンジンに対して、最初に読ませたいと著者が想定している文書がどれであるかを示すことができます。
  • Next : 続き物の文書群の、次の文書を指します。ユーザエージェントは、「次」の文書を先読みしておいて、ダウンロード時間を節約することもできます。
  • Prev : 続き物の文書群の、前の文書を指します。同義語の「Previous」をサポートするユーザエージェントもあります。
  • Contents : 目次の文書を指します。同義語の「ToC」をサポートするユーザエージェントもあります。
  • Index : 当該文書の索引である文書を指します。
  • Glossary : 当該文書に関連する用語集である文書を指します。
  • Copyright : 当該文書の著作権表示を指します。
  • Chapter : 文書群の中の章である文書を指します。
  • Section : 文書群の中の節である文書を指します。
  • Subsection : 文書群の中の項である文書を指します。
  • Appendix : 文書群の中の付録である文書を指します。
  • Help : 詳説、他リソースへのリンク等の、ヘルプ文書を指します。
  • Bookmark : ブックマーク(しおり)を指します。ブックマークとは、長い文書の中のある重要な入り口に対して設定されたリンクをいいます。例えばブックマークのラベルなどとして、title属性が使われることがあります。1つの文書に複数のブックマークを設定することが出来ます。

13. 出力メディア

下記は、認定された出力メディア(%MediaDesc;)の一覧です。

  • screen : 非ページ型のコンピュータスクリーンを示します。
  • tty : 固定文字幅での出力、例えばテレタイプ、端末機器、表示能力に制限のある携帯機器、などでの出力を示します。
  • tv : 低解像度で、色やスクロール能力に制限がある、テレビ型機器を示します。
  • projection : プロジェクターを示します。
  • handheld : 画面が小さく、モノクロ、ビットマップ画像、帯域幅に制限がある、モバイル機器を示します。
  • print : ページ型の不透明素材での出力、および印刷プレビューモードでのスクリーン出力を示します。
  • braille : 点字出力機器を示します。
  • aural : 音声合成装置を示します。
  • all : すべての出力に適合します。

14. スクリプトデータ

スクリプトデータ(%Script;)は、script要素の内容及び組込みイベント属性の値であり得ます。

スクリプトデータが大文字小文字を区別するかどうかは、スクリプト言語に依存します。

要素の内容であるスクリプトデータには文字参照を含むことができませんが、属性の値には文字参照を含むことができます。

15. スタイルシートデータ

スタイルシートデータ(%StyleSheet;)は、style要素の内容、及びstyle属性の値であり得ます。

スタイルデータが大文字小文字を区別するかどうかはスタイル言語に依存します。

要素の内容であるスタイルデータには文字参照を含むことができませんが、属性の値には文字参照を含むことができます。

16. フレーム・ターゲット名

下に示す予約済みのフレーム・ターゲット名(%FrameTarget;)を除いて、フレーム・ターゲット名は、アルファベット(小文字・大文字)で始めなければなりません。ユーザエージェントは、それ以外の名称を無視します。

特別な意味を持つ、予約済みのフレーム・ターゲット名は以下のとおりです。

  • _blank : 指定された文書を名前のない新規ウインドウに表示します。
  • _self : 指定された文書を、現在のフレームに表示します。
  • _parent : 指定された文書を、現在のフレームの直接の親フレームに表示します。現在のフレームに親フレームが存在しない場合は、「_self」と同様の扱いになります。
  • _top : すべてのフレームを解除し、元ウインドウいっぱいに指定された文書を表示します。現在のフレームに親フレームが存在しない場合は、「_self」と同様の扱いになります。
お気に入りに追加
基本データ形式
スポンサードリンク