ITパスポート試験 用語辞典

えいちてぃーえむえるふぁいぶ
HTML5
【HyperText Markup Language version 5】
Webサイトにおける画像、音声、ビデオなどを含むページを表現できるページ記述言語であり、HTML4の次期規格である。従来のHTMLから幾つかの文書記述が見直されているほか、ウェブアプリケーションを支援するためにマルチメディア要素を扱うAPIが多数追加されている。
↓ 用語データを見る
分野:
分野:テクノロジ系
中分類:情報メディア
小分類:マルチメディア技術
重要度:
(Wikipedia HTML5より)

HTML5(エイチティーエムエル・ファイブ)は、 HTML の 5 回目に当たる大幅な改定版である。

HTML5 は WHATWG によって2004年に定められた Web Applications 1.0 に Web Forms 2.0 を取り入れたものが W3C の専門委員会に採用され、W3C より2008年1月22日にドラフト(草案)が発表され、2014年10月28日に勧告された。2016年にHTML 5.1が勧告される予定。

改訂の主要目的のひとつとして人間にも読解可能でコンピューターやディバイス(ウェブブラウザ、構文解析器など)にも矛盾せず読解されるとともに最新のマルチメディアをサポートする言語に向上することである。HTML5 では HTML だけでなく XHTML、Document Object Model の HTML 関係の部分、ECMAScript の API も追加になっている。

表記は HTML 5.1 のようにバージョン表記で小数点以下を含める場合は HTML と 5.1 の間にスペースを入れ、HTML5 のように小数点以下を含めない場合は HTML と 5 の間にスペースを含めない表記法が採用されている。過去のバージョンについても HTML4 や HTML 4.0 という表記法が使われている。XML の文法で記述する場合、XHTML5 と表記する。

概要

HTML5 は、プロプライエタリなプラグインとして提供されているリッチインターネットアプリケーションのプラットフォーム(JavaFX、Adobe Flash、Microsoft Silverlight 等)を置き換えることを標榜しており、ウェブアプリケーションのプラットフォームとしての機能やマルチメディア要素が実装されている。そのため HTML5 が普及すれば Adobe Flash などのプラグインは不要になるという意見がある(後述)。

2008年以降に発表されたウェブブラウザの多くは HTML5 に段階的に対応している。Google Chrome 3.0 以降、Safari 3.1 以降、Firefox 3.5 以降、Opera 10.5、Internet Explorer 9 などであり主に audio要素・video要素・canvas要素への対応が進んでいる(2010年3月現在)。また WebSocket など、当初 HTML5 の一部とされていたものの切り離され別の規格として策定作業が進められているものがある。

広義のHTML5

厳密には別仕様書として分離されているものの、一般的には、Web Storage・WebSocket・Geolocation API・XMLHttpRequest Level 2などもHTML5に含める場合が多い。

W3C の HTML5 Logo では以下のカテゴリを HTML5 に含めている。

  • セマンティックス - HTML5の新タグ、RDFa、マイクロデータ、マイクロフォーマット
  • オフラインとストレージ - App Cache、Web Storage、Indexed Database API、File API
  • デバイスアクセス - Geolocation API、マイク・カメラ、アドレス帳・カレンダー、端末の向き
  • 接続性 - WebSocket、Server-Sent Events
  • マルチメディア - audio要素, video要素
  • 3D、グラフィックス、エフェクト - SVG、canvas要素、WebGL、CSS3 3D
  • パフォーマンスと統合 - Web Workers、XMLHttpRequest Level 2
  • CSS3 - WOFFも含む

技術仕様

エンコーディング

文書の文字コードの指定は、meta要素におけるcharset属性やBOMでも可能。また、UTF-32を用いたエンコーディングは禁止となる。

文書の構造

従来のHTMLやXHTML規格は、仕様に書かれた文書構造のルールだけではなく、妥当性検証のためのDTD(およびそのほかのスキーマ)を提供していた。一方、HTML5仕様ではスキーマは提供されない。文書構造のために提供されるのはHTML5仕様に列挙されている各種ルールのみである。

従来の HTML との文法の差異

HTML5仕様は以下のふたつの構文を採用している。
  • HTML5仕様書の中で定義されるHTML構文 → 狭義のHTML5
  • HTML5仕様書からXMLおよびその関連仕様を参照して定めているXHTML構文 → XHTML5と呼ばれる
一方、従来のHTML仕様はSGMLをその構文に採用している。SGMLおよびその関連仕様を参照しており、規格ごとに以下のような差異もある。
  • SGML規格本体のみを参照しているもの → HTML 4.0以前
  • SGML規格本体および付属書J、付属書Kを参照しているもの → HTML 4.01や、ISO/IEC 15445など

主にこのような違いのために、HTML5と従来のHTMLとの間には基本的な文法の差異が多い。以下にその代表的な例を挙げる。

SGML宣言

SGMLを採用していた従来のHTML規格においては、HTML文書は本質的にSGML文書であったため、HTML規格がそれぞれ提供するSGML宣言を文書の先頭に記述することが仕様上許されていた。一方HTML5の仕様では、HTML構文、XHTML構文のいずれを用いた場合でも、文書中にSGML宣言を記述することは許されていない。

文書型宣言およびDTDの扱い

HTML5仕様においては、文書型宣言はもはやモード指定以外の意味をなさず、その書式は “<!DOCTYPE html>” である。

HTML構文では文書型宣言は必須である。XHTML構文では、HTML5で導入される新しい機能を利用する場合は必須、それ以外の場合は文書型宣言は必須ではない。

従来のHTML規格で提供されていたDTDがなくなり、また文書型宣言の書式が決まっているため、HTML5ではDTDが利用できず、DTDに依存する多くの機能のほとんどが扱えなくなる。例としては、HTML4以前に扱えていた文字実体参照のほとんどがHTML5では扱えなくなる(XMLは文書内部にDTDを書くこともできるが、上記の文書型宣言の決まりを無視する結果となるため、HTML5の仕様の範疇ではない)。

処理命令

SGMLを採用していた従来のHTML規格では、文書内に処理命令 (Processing instruction) を記述することができた。実際に用いられている例として、DTDを他の処理系で利用するための "architectural support declaration" が存在する (ISO/IEC 15445)。

一方、HTML5仕様におけるHTML構文ではSGMLの処理命令は記述できず、同様の機能も利用できない。XHTML構文であればXMLの処理命令は書ける。

マーク区間

SGMLを採用していた従来のHTML規格では、マーク区間 (marked section) と呼ばれる仕組みが利用できた。以下に例を挙げる。

<!DOCTYPE HTML PUBLIC "ISO/IEC 15445:2000//DTD HTML//EN">
<html><head><title>...</title></head>
  <body>
    <p><![INCLUDE[ INCLUDE...マーク区間宣言がない場合と同じように解釈される ]]></p>
    <p><![IGNORE[  IGNORE ...マーク区間の中身を無視される ]]></p>
    <p><![RCDATA[  RCDATA ...マーク区間の中身がRCDATAとして処理される ]]></p>
    <p><![CDATA[   CDATA  ...マーク区間の中身がCDATAとして処理される ]]></p>
    <p><![TEMP[    TEMP   ...マーク区間の中身が一時的なものとして扱われる ]]></p>
  </body>
</html>

上に挙げた例のうち、HTML5仕様で利用できるのはCDATAセクションのみである。

コメントと注釈宣言

SGMLのコメントは "-- コメント文 --" という形を取り、マーク宣言中の空白文字の出現が許されている場所に任意の回数書くことができる。したがって従来のHTMLでは文書型宣言の中などでもコメントを挿入することが可能で、例えばISO/IEC 15445の文書型宣言は

<!DOCTYPE HTML PUBLIC "ISO/IEC 15445:2000//DTD HTML//EN" --コメント-->

のようにも書ける。一方、HTML5の文書型宣言にはコメントを挿入することはできない。

また、注釈宣言の扱いも従来のHTMLとHTML5では異なる。SGMLを採用していた従来のHTMLでは注釈宣言の中に任意の回数コメントを書くことができるが、HTML5ではHTML構文でもXHTML構文でもこのような書き方は認められていない。また、従来のHTMLでは注釈宣言内の最後のコメントと終了区切り子の間に空白文字を挿入することもできたが、HTML5ではこのような書き方も認められていない。

<!-- この注釈宣言の書き方もHTML5では不可能--  >

終了区切り子の省略

SGMLをもとにした従来のHTMLでは、タグやマーク宣言の終了区切り子 ">" が、文字列 "<", "</"の直前に存在する場合、その終了区切り子 ">" を省略することが仕様の上では許されていた。HTML5では終了区切り子の省略はできない。

<!DOCTYPE HTML PUBLIC "ISO/IEC 15445:2000//DTD HTML//EN">
<html<head<title>Sample</title</head>
<body<p>「閉じないタグ」の例。終了区切り子が省略されている</p</body</html>

空タグ

SGMLにおける空タグ (empty tag) とは要素型名などが書かれていない空っぽのタグのことである。従来のHTMLでは空タグの存在を許しており、利用できる場所は限られるが、空開始タグ "<>" と空終了タグ "</>" が仕様の上では記述できる。一方、HTML5では空タグを利用することはできない。

簡略終了タグ

SGML規格には、NET(Null End Tag、簡略終了タグ)と呼ばれる仕組みが存在する。従来のHTMLでのNETは "/" であり、仕様上では、 "<p>文章</p>" という記述を "<p/文章/" と書くような記法が許されていた。

一方のHTML5に簡略終了タグという仕組みはない。ただし、後述する空要素の開始タグを "<br />" などと記述する方法は、(従来のSGMLの立場では)NETを利用したものと解釈することはできる。XMLの空要素タグも、SGMLの立場からはNETおよび付属書KのNESTCを利用した記法であると解釈できる。

空要素のタグ

従来のSGMLおよびHTMLにおける空要素 (empty element) は、DTDで内容モデルを空 (EMPTY) と決められた要素のことである(例:br要素)従来のHTMLでは、空要素の終了タグを書くことは許されていない。よって例えば、br要素のタグを "<br />" や "<br></br>" のように記述することもできない。

HTML5のHTML構文における空要素 (void elements) は、内容を含むことができない要素のことである。空要素はその開始タグを ">", "/>" のいずれかで閉じることができる。例を挙げると、br要素のタグは "<br>" と記述するほかに、XHTML構文のように "<br />" と記述することもできる。ただし空要素の終了タグを書くことはできない。また、このような記法が許されるのは空要素または外部要素 (foreign element) のタグのみで、その他の要素の開始タグは ">" で閉じねばならない。例えば、HTML5のHTML構文では内容を含まないp要素を "<p />" のように書くことはできない。

XML仕様においては、空要素 (empty elements) は内容を含まない要素のことである。HTML5のXHTML構文では、空要素は直後に終了タグを伴う開始タグ(例:"<br></br>")、あるいは空要素タグ(Empty-Elements。例:"<br />")のどちらでも表現できる。

ルート要素のタグ

SGMLをもとにした従来のHTMLでは、ルート要素(ex. HTMLにおけるhtml要素)の開始タグは必ず存在せねばならなかった。

一方、HTML5仕様のHTML構文では、ルート要素の開始タグが省略できる(XHTML構文では不可能)。これはHTML5仕様にDTDなどのスキーマがないこととも大きく関係している。以下にルート要素の開始タグ・終了タグを省略したHTMLの例を載せる。

<!DOCTYPE html>
<head><title>Sample</title></head>
<body><p>これは妥当なHTML文書</p></body>

HTML5 の要素と属性

nav要素(ナビゲーションのブロック用)や footer要素(作者や著作権の状態を表すまとまり用)や section要素(節)や progress要素(進捗状況)など、特別な意味を持つ要素が追加される。これらは検索エンジンのインデックス作業を容易にする。また、マルチメディアのための audio要素や video要素や2次元ビットマップ画像を描画するための canvas要素も追加される。

HTML 4.01 で非推奨だった font要素や center要素などの CSS によって実現されるべきマークアップはすべて廃止されることとしている。acronym要素も廃止され、abbr要素に一本化される。

lang属性は、XHTML構文における xml:lang属性のように空の文字列をとり得る。

新しい API

HTML5 ではマークアップだけでなく、API も新しく追加された。たとえば、以下のようなものである。
  • ビデオやオーディオの再生
  • 保存
  • オフライン
  • 編集
  • ドラッグ&ドロップ
  • 戻るボタン
  • Webページ上のメニュー

エラーの取り扱い

HTML5 (text/html) 対応ブラウザは間違った構文を柔軟に処理できる。HTML5 は、古いブラウザが新しい HTML5 の構造を安全に無視することが出来るように設計されている。HTML 4.01 とは対照的に、HTML5 は対応したブラウザであれば間違った構文に対して同じ結果となるように、字句解析と構文解析のための詳細な規則を規定している。

既存技術との競合

Adobe Flash

2010年頃までに急速に普及したのiPhoneとiPadがFlash非対応を貫き、スティーブ・ジョブズCEO(当時)がHTML5を支持しFlashを厳しく批判したことが大きな影響を与えた。iPhoneやiPadにFlash対応を求める声は多かったが、特にスマートフォン向けでは徐々にFlashからHTML5への転換が進んでいる。

Flashの開発元であるアドビシステムズは社をあげてFlashを擁護しているが、2011年11月には、モバイルブラウザー用のFlash Playerの開発は止めると発表した。

補足として、アドビはHTML5の推進にも積極的であり、FlashからHTML5への変換ツールなどをリリースしている。

モバイルアプリケーション

スマートフォン向けのアプリの多くは、HTML5で開発されたウェブアプリケーションに置き換わるという見方がある。2011年にイギリスのフィナンシャル・タイムズ紙がHTML5による購読アプリを発表し注目を集めた。アップルのApp Storeには審査や課金に関する制約が大きく、Androidでは1つのアプリで様々なハードウェア仕様に対応する必要があるが、Webアプリケーションではそれらの制約を受けない。一方で各端末向けの公式アプリストアで配布されるネイティブアプリにもメリットはあるため、2012年時点では置き換えが大きく進んでいるわけではない。

「マルチメディア技術」の用語

「情報メディア」の他の分野

「テクノロジ系」の他のカテゴリ

このページのWikipediaよりの記事は、ウィキペディアの「HTML5」(改訂履歴)の記事を複製、再配布したものにあたり、このページ内の該当部分はクリエイティブ・コモンズ 表示 - 継承 3.0 非移植 ライセンスの下 に提供されています。


Pagetop