テレビの画面に表示される映像は、カラーテレビが登場した1950年代に策定された標準規格に従っています。現在の主流となっている形式は、NTSC(National Television System Committee)とPAL(Phase Alternating Line)の2つです。一般的には、NTSCは米国や日本で標準として採用されており、PALは欧州、オーストラリア、中東およびアジア地域で採用されています。
コンピュータのモニタに表示する場合に関しては、いずれのビデオ標準も最適とは言えません。Web配信向けに最適化しようとする際には、それぞれに異なる問題がともないます(表3はそれらをまとめたものです)。
表3.ビデオの標準規格の相違点
| イメージサイズ | フレームレート | 縦横比 | ディスプレイ | |
|---|---|---|---|---|
| NTSC | 720×480 | 29.97 | D1 | インターレース |
| PAL | 720×576 | 25 | D1 | インターレース |
| コンピュータ | 可変 (非常に大きい) |
– | 正方形 | プログレッシブ |
伝統的なテレビ画面は水平の走査線の集まりによって構成されますが、コンピュータのモニタは水平および垂直のピクセルの集まりによって構成されます。走査線の標準的な本数は、NTSCテレビでは525本、PALでは576本です。現在のコンピュータで使われているモニタの垂直解像度(ピクセル数で表されます)は、これらよりはるかに高い(768ピクセル、1024ピクセルなど)のが普通なので、モニタ全体に表示するには、再生時に垂直方向の拡大処理が必要です。
NTSCビデオのイメージについては、業務用のSMPTE 259M規格により、525本の走査線を720×486(水平方向のピクセル数720個、垂直方向のピクセル数486個)で表現するよう指定されています。このデフォルトのビデオサイズは、一般にD1と呼ばれています。最新のビデオキャプチャカードのほとんどでは、BetaSPやDigital Betacamソースから素材をキャプチャすると、D1サイズのフレームが得られます。ただし、DV(デジタルビデオ)ソースの素材をキャプチャすると720×480のフレームになります。D1仕様とDV仕様では垂直方向のピクセル数が6個しか違いませんが、多くの圧縮アルゴリズムは(DV圧縮も含め)、イメージのピクセル寸法が16の倍数である場合に最も効率よく機能します。そのため、DV形式ではD1解像度から6ピクセルを削除し、ネイティブ解像度を16の倍数にしています。
PALビデオのイメージについては、フレームのサイズはビデオソースに関係なく常に720×576ピクセルです。PALの垂直解像度576は16の倍数なので、DV圧縮の場合でも変わりません。
基本的にビデオとは、イメージを次々に高速に切り替えて画面上に表示することにより、イメージが動いているような印象を与えるものです。1秒間に表示されるフレーム数は「フレームレート」と呼ばれ、ムービーの再生速度はfps(1秒あたりのフレーム数)で表されます。フレームレートが高いほど、イメージシーケンスの表示に使用される1秒あたりのフレーム数は多くなり、モーションがスムーズになります。ただし、フレームレートを高めると、ビデオの表示に大量のデータが必要となり、結果的により大きな帯域幅が必要となります。
NTSCビデオのフレームレートは普通30fpsであると言われ、PALでは25fpsです。実際には、NTSCのフレームレートは29.97fpsです。この切りの悪い数値は白黒テレビ信号の名残です。かつて白黒テレビからカラーテレビに移行した際、既存のテレビ受像機の後方互換性を保証するために、同じ29.97fpsのレートが踏襲されました。1秒間に30フレームが表示されるのは確かなのですが、厳密な時間にすると0.1%だけ遅いため、フレームレートの値としては29.97fpsになります。
Flashビデオのような形式の圧縮されたビデオを扱う場合、フレームレートがビデオの画質に影響する可能性があります。この影響は、ビデオとそのコンテンツのエンコード方法によって左右され、予測するのが困難です。フレームレートを低くすると、表面的には、エンコードするコンテンツが少なくなります。その結果、理論的には、画質が向上するか、ファイルサイズが小さくなります。ただし、その一方で、フレーム間のピクセルの変化が目立つようになる可能性が高くなります。その場合は、より多くのデータをエンコードする必要があります。データレートを維持したままフレームレートを低くすると、ビデオの動きがぎこちなく見え、十分にスムーズな表示にならないことがあります。
フレームレートを下げる場合は、元のフレームレートを整数で割った値にするのが望ましいと考えられます。例えば、24fpsのソースを使用してフレームレートを下げる場合は、12fps、8fps、6fps、4fps、3fpsまたは2fpsにするようにします。30fpsのソースからフレームレートを下げる場合、通常は30fps、15fps、10fps、6fpsなどのフレームレートに調整することをお勧めします。ビデオの長さが10分を超える場合、29.97fpsレートまたはこのフレームレートを整数で割った値(29.97の半分の14.98fpsなど)に従わないと、オーディオとの同期のずれが目立つようになります。
D1/DV NTSCおよびPALの仕様では正方形でない(D1縦横比と呼ばれる)ピクセルが指定されていますが、コンピュータのモニタでは正方形のピクセルが使用されます。D1ピクセルは横長です。したがって、D1ビデオイメージをコンピュータのモニタに表示すると、イメージの縦方向がつぶれ、俳優がずんぐりした体型に見えます。このイメージを放送用モニタで見た場合は、ピクセルが横長になっているため、次の図のように正常に表示されます(図2を参照)。

図2.ビデオモニタに表示したイメージ(左)とコンピュータのモニタに表示したイメージ(右)
この理由により、コンピュータのモニタ上で表示されることが前提のビデオイメージは、伸縮してピクセルの縦横比を修正し、正しい4:3の縦横比にする必要があります。完全な正方形ピクセルでの解像度は、NTSCの場合は720×540(垂直方向に補完)、PALの場合は768×572(水平方向に補完)です。インターネットで最終的なビデオ表示の解像度としてよく使われているのは、640×480、512×384、320×240、160×120などです。
ほとんどのビデオ編集アプリケーションでは、コンピュータのモニタ上にレンダリングする際にリアルタイムでビデオイメージを伸縮することにより、ピクセル縦横比の食い違いを吸収しています。これは、編集したイメージが最終的にはテレビのモニタで表示されることになるからです。ビデオファイル自体のピクセルを伸縮してしまうと、その操作によって無用な歪みがわずかに生じる可能性があります。しかし、Webでの表示が前提の場合、このようにリアルタイムで補正するのは合理的ではありません。正方形ピクセルのモニタで表示されることが前提のビデオシーケンスならば、実際のデータを伸縮加工してピクセルの縦横比を補正する方が適切です。
ビデオイメージでは、2つのインターレースフィールドを組み合わせて1つのフレームが構成されます。この方式はテレビが発明された時代の技術的制約に起因するものです。当時は、フレーム全体を1回で「プログレッシブ」に(上から下へと連続的に)モニタ上に表示すると、イメージが表示された後に画面上から消し去られていくように見えてしまい、点滅が発生するのを避けられませんでした。そこで、イメージを2つのフィールド(半分ずつの情報)に分け、交互に表示することにより、ちらつきを排除しました。この旧来の技術は、ビデオやコンピュータが使われるデジタル時代においては非常にわずらわしい弊害となったため、新しい高品位テレビのビデオ規格では、インターレースではなくプログレッシブ表示(イメージを1回で上から下へと連続的に表示)する方法が採用されています。一度に表示される走査線の集まりは、フィールドと呼ばれます。2つのフィールドはそれぞれ、上位フィールド(フィールド1、奇数フィールド、トップフィールド)および下位フィールド(フィールド2、偶数フィールド、ボトムフィールド)などと呼ばれていますが、標準的な用語は確立されていません。これらすべての用語が、2つのインターレースビデオフィールドを表します。テレビ映像が表示されるときには、2つのフィールドがすばやく連続的に表示されて重なり合います(図3を参照)。

図3.2つのビデオフィールドからなるインターレースビデオ
実際のビデオ素材において、インターレースの2つのフィールドは非常によく似ていることが多く、そのような場合は、コンピュータのモニタ上でビデオフレームを見ても表示上の不都合は特に感じられません。しかし、動きの激しい、目まぐるしく変化する素材(カメラ自体やフレームに映る人物などの動きが速い場合)では、コンピュータのモニタ上に2つのフィールドを同時に表示するとフィールドの副作用が非常によく目立ち、ゴーストが発生したような画質に見えます。これは、タイミングが異なる2つの瞬間を組み合わせて1つのフレームが構成されているためです。
したがって、コンピュータのモニタ上に鮮明なビデオを表示するには、デインターレース処理によって2つのフィールドのいずれかを排除することが不可欠です。各フレームに含まれる情報の半分を捨てて、残った情報を二重化したり、補間したりすることになります。NTSCの場合、この処理によって、30の異なるタイミングを表す30個のフレームが得られます。その結果、はるかに鮮明なビデオイメージになります(図4を参照)。

図4.ビデオ静止画のインターレースのフレーム(左)とデインターレース処理後のフレーム(右)
デジタルテレビ向けの新しいビデオ規格では、インターレースを避けて、プログレッシブスキャンの表示技術が優先的に採用されています。プログレッシブスキャンのビデオカメラの多くは、プログレッシブスキャンからインターレースビデオに切り替える機能を持ち、インターレースあり/なしの両方を含む様々なフレームレートに対応しています。標準的なフレームレートは、60p(60fpsプログレッシブ)、30i(30fpsインターレース)、30p(30fpsプログレッシブ)、24p(24fpsプログレッシブ)と表記されます。プログレッシブビデオの素材を扱う場合、Webで配信する前にビデオクリップをデインターレース処理する必要はありません。