バイナリとは?ジッターとは?

バイナリとは何でしょうか。

まずは定義を知ろう

さて,前項はバイナリという単語がでてきました。PCに限らずデータ通信の世界においても,バイナリという値は非常に重要であり基本でもある指標です。まずはwikipedia日本語版のバイナリを参照するところから始めましょう。
http://ja.wikipedia.org/wiki/%E3%83%90%E3%82%A4%E3%83%8A%E3%83%AA

「バイナリ (binary) とは2進数のことであるが、コンピュータが処理・記憶するために2進化されたファイル(バイナリファイル)またはその内部表現の形式(バイナリデータ、バイナリ形式)のことを指して用いられることが多い。」(バイナリ – Wikipediaより引用)
この点,本稿でいうところのバイナリとは,バイナリファイルのことを意味します。PCの世界では「ファイル」という形式で利用されますが,CD再生の場合もデータの固まりとして利用されると考えておけば良いでしょう。

データの同一性はバイナリの同一性を確保することにより達成され,バイナリが一致すればデータ的には同じファイルであるとして良いとされます。全てのデー タ通信技術は,送信元と受信先で同一であるべきデータのバイナリが一致(ビットパーフェクト等とも言われることがあります)することを最低限達成すべき目標として開発されます。
したがって,音楽データについても,バイナリが一致していなければデータ的に違う内容なのですから,違って聞こえても何ら不思議なことではありません。

バイナリ一致≠良い音

注意していただきたいのは,ここで言うところのバイナリの同一性(=バイナリ一致=ビットパーフェクト)は,たとえばCDなどの記憶媒体に保存されているデータと,DACが処理するデータが同一であるということを意味しているに過ぎないという点です。聴いて判断するわけではありません。
つまり,音楽として鑑賞してみた時に本物らしいかどうかということではないということです。非常にリアルに聞こえたとしても,バイナリが不一致な状態であれば,それは記録されたデータとは異なるということであり,データの中身としては「不正確」なものである,ということになります。
だからといって,バイナリ不一致状態の音が好ましいと感じるのであれば,それを否定するものではありません。そのCDに記録されているデータをあるがままに再現したらいつでも完璧で心地よく素晴らしい再生音になるという保証はないからです。

これはある意味でバイナリドグマとも言うべき問題であり,特にPCオーディオの世界では問題になる部分でもあります。専用のCDプレーヤーやCDトランスポートの大半は当たり前のようにバイナリが一致しますが,PCオーディオの世界ではその当たり前の部分が当たり前でないのがやっかいなのです。

ジッターとはなんでしょうか。

まずデジタル伝送で重要な「クロック」について知ろう

デジタル方式のデータ伝送で必ず必要なのが「クロック」と呼ばれる信号です。デジタル方式のデータ伝送では,必ず「データ」と「クロック」がセットになっています。
データそのものは,0と1を意味する連続した電圧の上下の組み合わせであるということは既に述べたとおりですが,これをどのタイミングで判断すべきかを示さなければ,データの受け手側の機器はどういった0と1の組み合わせなのかを判断することができないからです。
全てのデジタル方式のデータ伝送はデータとクロックがセットになっているということは,いつも頭の片隅に置いておきましょう。

サンプリング定理とジッターの関係について知ろう

上記のデータとクロックの関係はデジタルオーディオの分野でも同様に当てはまるものです。音楽データについても,バイナリが一致したからといって聞こえる音が物理現象として完全に同一の状態で再現されるという保証はありません。
なぜなら,アナログドメインにある音楽をデジタルに変換するためのサンプリング定理自体が,一切の揺らぎのない正確な時間軸(クロック)に基づいてA/D変換され,事後デジタル化された信号が一切の揺らぎのない正確な時間軸(クロック)に基づいてD/A変換される,という前提にたっているためです。

「ジッター」とは,必要な周波数以外の周波数成分が及ぼす時間軸上の波形の位相のずれのこと

特にデジタル通信においては,基準となる時間軸のずれ・揺らぎのことを意味します。特に時間軸のジッターのことを「クロックジッター」と呼んで他と区別することがあります。

この点,CDに代表されるデジタルオーディオのアナログ再生時にはジッターが必ず問題になります。
なぜなら,現状では,ジッターの量が多ければ多いほど不正確な変換結果となってしまう可能性が高まるわけですから,サンプリング定理の理想はジッターがゼロであるわけですが,現実的には回路の実装に限界があるためジッターをゼロにすることは出来ないためです。
そこで,なるべく正確な時間軸に基づいている状態,つまり基準となる時間軸のずれ・揺らぎが少ない状態を「ジッターが少ない」とか「低ジッターである」というように表現します。他にも,やや曖昧な表現ですが「クロックの精度が高い」などと表現することもあります。

この再生時というのが非常に重要で,ピュアオーディオの分野では,とにかく再生時のジッターの状態がどうなっているのかに関心を払う必要があります。デジタルデータをアナログデータに変換するから問題となるわけで,変換時に低ジッターにすればするほど正しいD/A変換に近づきます。

ジッターが音楽再生に影響を与えるデジタル領域の例

  • CDPがCDを再生するとき
  • CDトランスポートを使ってS/PDIFまたはAES/EBUでデータをDACに送るとき
  • マザーボード付属のチップでD/A変換して再生するとき
  • USB-DACを使って再生する時
  • USB-DDCやオーディオインターフェース等を使ってS/PDIFまたはAES/EBUでデータをDACに送るとき

ジッターが問題にならないデジタル領域もある

なお,音声データといえども,たとえばCDやHDDなどの記録メディアに記録された場合には,バイナリが同一なデータは音質的に全く同一であるとされることが一般で,少なくともメディア間でバイナリが一致しているのであればデータ的には一切の違いがないとされます。
これは,メディアに記録された後は単なるデータを順次読み出すに過ぎないため,データ読み出しの時間軸の正確性は問題とならないからです。
同様に,デジタルデータをデジタル方式で伝送して,デジタル方式で記録するならば,ジッターは問題になりません。たとえば,CDPからデジタルケーブルで出力してCDR機にコピーするような場合です。この場合もバイナリとしては一致します。
やっかいなのは,デジタル方式で伝送してアナログ再生する場合には,やはりジッターが問題になるという点です。とにかくアナログ再生する場合には必ずジッターが問題になります。

また,文章データや静止画データなどは時間軸と関係なく伝達・認識できればよいわけですから,変換時のジッターはさほど問題となりません。故にジッターはデータの読み取りが正しく行われる程度でよいとされています。
これに対して,音楽データは時間軸的に連続したデータの流れですから,変換のタイミングが規格上適切に行われなければ,正しい変換がなされたとはいえないわけです。

ジッターが音楽再生に影響を与えないデジタル領域の例

  • CDからリッピングする時
  • リッピングしたデータがHDD等に記録するとき
  • HDD等に記録したデータを同じHDD等にコピーするとき
  • HDD等に記録したデータを別のHDD等/PCにコピーするとき
  • インターネットを経由してデータをHDD等に記録するとき
  • 音楽データをオーディオインターフェース等に送信するとき

バイナリとジッターの対比:バイナリの特徴

このように,バイナリとは,データの内容そのものが正しく記録・伝達されているかという問題であり,ジッターとは,データ内容を解釈する際に必要な基準となるタイミングの調整が正しく行われているのかという問題である,ということになります。
こうした定義の違い以外にも,特にバイナリを確認する,ジッターを確認する,という観点でも違いがでてきます。

バイナリはデジタル的に確認できる

バイナリの特徴として,録音(コピー)したデータ(ファイル)が同一かどうかを事後的にチェックすることが可能であるということが挙げられます。これはとても重要なことです。この際,データと組み合わさっていたジッターは問題になりません。なぜなら,デジタル領域のみでデータをやりとりした場合には,データが記録される際にジッターがなんら影響を及ぼさないからです。
バイナリの確認は専門的な機器を使わなくとも確認できますが,バイナリは連続した量を0と1という二つの値の組み合わせで表現するしくみであって汎用性が高く,デジタル領域の特徴がそのまま持つものということができるでしょう。

下掲の画像は同一のWAVファイルのデータを比較したものです。バイナリの世界ではこのようにデータ同士の比較が容易で,完全に同一であることを簡単に確かめることが出来ます。

バイナリの判断基準は絶対的:正しいか正しくないか

まず,バイナリの議論は閾(しきい)値を超えればON,超えなければOFFという判断基準が明確で,かつ元のデータと処理後のデータが同一かどうかを確か める仕組みが比較的安価に提供されているため,正しいか正しくないかを確認するのが容易です。
唯一の正しさがあり,それ以外は正しくないわけですから,たとえば,「手を5回叩いて下さい」といわれたら5回叩くのが唯一の正解ということと似ています。

バイナリの判断基準はデジタル的に行えるということを述べましたが,デジタル的であるということはすなわち判断基準が絶対であるということになるでしょうか。

バイナリとジッターの対比:ジッターの特徴

ジッターはアナログ的に確認できる

これに対して,ジッターは後から量を確認することができません。特にクロックジッターはいかなる場合であっても,その時・その場所・その機器限りで起きている現象ですから,その場でジッターカウンターと呼ばれる機器かオシロスコープと呼ばれる機器など,専門性の高い測定機器を使ってリアルタイムに測定する他ありません。
こうした測定環境が要求されるのは,ジッターが連続した時間軸の揺らぎの量を電圧・電流などの連続した量(物理量)で観測されるためで,それ故高価な測定機器が必要となります。このように,ジッターはむしろアナログ領域の特徴を持つものであるということができます。

下掲の画像は理想的なクロックの波形(=方形波,矩形波)と実際のクロックの波形です。本来であれば,1枚目の画像のように,垂直に立ち上がり直角に曲がり垂直に立ち下がり,を繰り返します。縦軸は電圧値,横軸が時間と考えてください。


『図1: 矩形波の波形』 フーリエ級数展開(ディジタル信号処理) (http://ufcpp.net/study/dsp/fourierseries.html 岩永信之 2010)

ところが,実際は下の画像のようになります。これでもかなり優秀なクロック波形と言われています。クロック信号は高速に生成しなければならないので,どうしても波形が崩れがちです。この崩れの原因となるものがジッターであり,いかに理想に近づけるかが勝負となります。その違いを量で表すことになるため,クロックやジッターはアナログ的に考える必要があるということがいえるわけです。


『Noise and Jitter Free Clock Signal.』(http://www.newclassd.com/index.php?page=20 DEXA Technologies ApS 2008)

ジッターの判断基準は相対的:量が多いか少ないか

ジッターの議論は閾値というものがなく,基準となるタイミングそのものの正確性が問題になると説明しました。この場合,より正確かという程度問題となります。論理的には無限に正しさに近づく状態というのも観念できますが,実際には大なり小なり理想からのずれがあるわけで,これの大小を問題に します。小さい方が当然良いわけです。
このずれを測定するのは非常に難しく,大変高価な測定器を要します。求める精度にもよりますが,一般には300万円~1000万円程のものが必要で,かつ定期的な校正作業(これも有償)が必要です。
バイナリで挙げた例でたとえると,「毎秒手を叩いて下さい」といわれて手を叩き,その正確なリズムキープを評価するのと似ています。

ジッターの測定方法はいくつもある

加えて,時間軸の揺らぎ(不安定さ)であるジッターの測定方法にはいくつかの方法があります。つまり,ジッターと一言に言っても様々な評価項目でジッターの量や質を表現することができるということです。

問題は,我々人間が音を聞く際に影響が大きいのはどの測定方法によって知ることが出来るジッタの振る舞いなのかと言うことが明らかになっていないという点にあります。
一般には,基準として使いたい周波数が長期的に安定していること(単位はppm[パーツ・パー・ミリオン])よりも,短期的に安定していること(単位はps[ピコセコンド])が重要であるとされます。

なお,日本水晶デバイス工業会の規定するジッター測定法の紹介記事『水晶発振器とSAW発振器の位相ジッタ測定法ガイド』(PDF)がとても素晴らしいものになっていますので,是非ご一読下さい。各種ジッターの測定法について,web上でこれほど簡潔かつ詳細に書いてあるものは初めて読みました。
また,日本水晶デバイス工業会は『用語 – 水晶振動子、水晶発振器、水晶フィルタ』(PDF) を公開していますので,不明な用語はこちらで調べてみると良いでしょう。