海外カンファレンスで得た知見を最大化する 〜 NAB Show 2018 編 〜

こんにちは、AbemaTV でエンジニアをしている五藤( @ygoto3_ )です。エンジニア版あした会議「あしテック会議」での決議を受け、昨年から動画技術におけるエバンジェリスト役を別ミッションとして兼務しております。世界での動画技術の進歩がめざましい中、AbemaTV を始めとした動画関連サービスが最新のテクノロジーを適切に判断し、活用できるよう社内のエンジニアに技術やトレンドを伝える活動を(開発の合間を縫って)しています。

そうした活動の一環として、今年 4 月 7 日〜 12 日にかけて AbemaTV を始めとした開発チームからエンジニアを厳選して NAB Show 2018 に参加し、そこで得た知見を社内にフィードバックし、そして徐々に開発にも取り入れていきました。本記事では、過去に海外の大型カンファレンスに参加した際に感じた課題を踏まえ、どのように海外カンファレンスを得た知見を最大化するように取り組んだか、を実際に得た知見のトピックとともに書きます。

アジェンダ

  1. NAB Show 2018
  2. 個人での情報収集の限界を超える
  3. 国内における事前準備
  4. 現地での連携に備える
  5. 言語の壁を超える
  6. 段階的にレポートする
  7. レポート・トピック:UHD と次世代コーデック
  8. レポート・トピック:MAM によるコンテンツ管理と動画品質
  9. レポート・トピック:QoE と再生品質可視化
  10. レポート・トピック:配信品質
  11. レポート・トピック:透かし技術によるコンテンツ保護
  12. レポート・トピック:SDI over IP と対応機器
  13. レポート・トピック:インターネット伝送の進化

NAB Show 2018

NAB Show は、1991 年からネバダ州ラスベガスで毎年開催されている歴史ある放送に関する世界最大規模のコンベンションです(※ 1990 年以前も米国各都市で開催されていたようです)。インターネット動画配信を含めた放送業界における技術動向、世界各社が投資している最新技術の発表、実用が一般的でない技術のトライアルレポートなど、貴重な情報を一堂で得ることができます。

過去この Developers Blog で記事にも取り上げておりますが、私自身も昨年このカンファレンスに参加して、少々多くの投資をしてでも参加して知見を持ち帰ることが AbemaTV など動画サービスの将来的な技術的発展に繋がると確信しました。

個人での情報収集の限界を超える

NAB Show は参加人数 10 万人を超えるとにかく大きなカンファレンスです。(私が直近参加した海外カンファレンスで比較すると Google I/O の推定参加人数が 5,000 人だったので、同じく同イベントに参加された方などは比較するとその規模の大きさが想像しやすいかと思います。)2000 社に近い企業が出展しており、トーク・セッション数も膨大にあります。

昨年私が参加して強く感じたのは「とにかく1人では情報収集に限界がある」という点です。今年はその反省を活かし、この貴重な機会で得られる知見を最大限に活用するために、エンジニアの中から特に動画/放送技術に精通し、普段の業務から技術課題に取り組んでいるメンバーを厳選しました。動画トランスコーディング専任エンジニア、動画技術分野での経験が長いクライアントサイド・エンジニア、中学時代から動画サービスを手掛けている若手配信エンジニアなど経験豊富な人材に声をかけて総勢 8 名で遠征に臨みました。

国内における事前準備

見知ったメンバーで行く海外遠征は楽しいですが、多人数の場合は修学旅行のような雰囲気になってしまうことも多いので、参加メンバー全員の遠征目的を明確にしなければいけません。今回は、まず参加メンバーから普段の業務における課題や気になっている技術トピックをベースに参加したいセッションを列挙しました。

NAB Show 2018 の気になるセッションを Slack 上で共有しているスクリーンショット
Slack 上で気になるセッションを共有して徐々にモチベーションを上げていきます

その中からキーワードを絞り込み、各個人がレポート責任を持った上での担当領域を設定しました。

キーワードを基にした各個人の担当領域一覧
実際に絞り込んだキーワードと各個人の担当領域

NAB Show は会場が広いため、セッション会場間の移動だけでも徒歩 20 分弱かかることもザラにあります。見るべきセッションの会場間の物理的距離が離れていることや、まとまったブース訪問時間の確保などを考えると、1 つの技術領域に対して担当 1 人では効率的な情報収集ができません。そこで 1 人が複数の技術領域を、そして 1 つの技術領域を複数人でカバーするように戦略的にスケジュールを組んでいきます。

Google Spreadsheet 上のスケジュール表
Google Spreadsheet 上でスケジュールを調整

メンバー全員でおよそ 1 ヶ月前から複数回顔を合わせて打ち合わせを行い、Slack でも専用チャンネル上で徐々に細かい内容を詰めていきました。

現地での連携に備える

今回の遠征では、技術的な情報収集はもちろんのこと、さまざまな企業とのコネクションを持つことにも重きを置いています。そのため、現地では NAB Show 2018 の拡張イベントや他企業との会食などにも分散して積極的に参加するので、ほかのメンバーと効率的にコミュニケーションを取れるようにしておく必要があります。

会場では WiFi が提供されていますが、拡張イベントや会食は会場外で行われることが多いので、現地でメンバーがいつでも連絡が取り合えるようにポータブルなインターネット環境は必須です。

また、NAB Show 推奨の宿泊ホテルと会場間の移動であればシャトルバスやモノレールなどで事は済みますが、拡張イベントなどでは Uber や Lyft などの配車サービスを使用した方が移動がスムーズなことも多いです。Uber や Lyft ではピックアップがうまくいかないことも少なくないので、現地でも SNS や通話ができる状態でいた方が安心で確実です。

そのために現地で使えるプリペイドの SIM カードを購入することがお勧めですが、ラスベガスの空港などで購入すると割高だったりするので、事前に高速無制限使い放題の SIM カードを購入しておくようにします。

今回は 1 週間程の滞在だったので、多くのメンバーはアクティベートしてから 7 日間使用可能な下記のようなプリペイド SIM カードを事前に購入しておきました。

MOST SIM – アメリカ SIMカード インターネット 7日間 高速無制限使い放題 (通話とSMS、データ通信高速) T-Mobile 回線利用 US USA ハワイ

言語の壁を超える

海外カンファレンスについてまわるのは、英語による口頭コミュニケーションです。私自身は米国のほかヨーロッパの動画関連カンファレンスに参加することもありますが、英語が公用語ではない国で開催されるカンファレンスでも会場内の公用語は英語というケースは珍しくないと感じています。

エンジニアであれば技術ドキュメントなどで英文を読むことに慣れていても、口頭コミュニケーションは苦手という方も多いと思います。今回、参加したメンバーのうち 8 名中 5 名も口頭での英語コミュニケーションは苦手というメンバーでした。技術力には定評があるメンバーですが、コミュニケーションで機会損失してしまうかもしれないという課題がありました。

そこで、国内で既に持っているコネクションを活かし、お付き合いがあるパートナー会社などと事前に相談をして日程前半の方にパートナーさん付き沿いによるブース訪問をご願いしました。こうすることで今年のトレンド感や聞いておくべき情報の整理ができ、ブース訪問の勘所も早いうちに掴むことができます。

パートナーさん付き沿いでブース訪問している写真
パートナーさん付き沿いによるブース訪問

もちろん、パートナーさんに関係がないブースにまで付き沿っていただくわけにもいきません。メンバーも随時気になったことを個別で情報収集したいので、勘所を掴んだ後は単独でのブース訪問も積極的に行っていきます。そんなときも一人より複数人でブース訪問すると、互いにコミュニケーションを補完し合えるので、結果多くのことを相手に伝えられますし、最終的に相手から得られた情報を複数人で解釈するので整理もしやすくなります。心理的な緊張感も断然和らぐことでしょう。

現地での Slack 上の会話のスクリーンキャプチャ
現地での Slack 上の会話

段階的にレポートする

さまざまな準備をして NAB Show 2018 遠征に臨んだ結果、私たちが抱えている技術課題を解決するソリューション、先端技術を持った各社とのコネクション、今後投資すべき技術への知見など多くが得られました。しかしながら、得られた情報は膨大ですぐにレポートとして咀嚼してまとめられる量ではありませんでした。とはいえ、持ち帰った新鮮な情報はできる限りすぐに共有したいですし、参加していないほかの開発メンバーも聞きたいと思っています。

そこで、NAB Show 2018 からメンバーが全員帰国した直後、参加メンバーの所感を各技術分野ごとに数スライドで開発チーム全体に簡易的にレポートしました。このレポートでは、技術に関する報告ではあるものの、非技術者にも分かるようにトピックスを抜粋して紹介しました。

トピックスレポートの抜粋
トピックスレポートの抜粋

このトピックスレポートを受けた他の開発メンバーからのフィードバックも参考にして、更に技術的に深掘ってレポートした方が良い内容を後日 NAB Show 参加メンバーで洗い出しました。もちろんフィードバックの形はレポートだけに留まりません。今回普段の業務から動画技術課題に取り組んでいるメンバーを厳選したのは、できる限り直接的に開発やサービスに反映させるためです。実際に開発に取り入れた知見やその進捗なども報告として取り入れ、全社員が任意で参加できる形で 3 ヶ月後に再度詳細な技術レポート会を開催しました。

技術レポート会の様子

ここからは、この技術レポート会で各 NAB Show 参加メンバーが社内のエンジニアに共有した内容の一部を抜粋して紹介します。

レポート・トピック:UHD と次世代コーデック

私自身は現在、次世代デバイス事業部という部署でエンジニアをやっている関係でさまざまなデバイスにおける動画技術に携わります。その中には大画面のデバイスもあるため、UHD など高解像度な動画に関する技術情報を得ることも今回の遠征目的の1つでした。

UHD に関するレポートのスライド

UHD( Ultra High-Definition )は映像を構成するさまざまな要素の情報が高解像度になったもののパッケージです。一般的に映像の品質は、平面空間の画素数を表す平面解像度、時間軸方向の解像度であるフレームレート、画素の階調数、画素が表現可能な輝度と色域の範囲で決まると言われています。テレビ HDR の国際標準規格である ITU-R BT.2100 でも、輝度の規定とともにサポート対象とする平面解像度、フレームレート、階調数、色域を定義していますが、その対象範囲は普段視聴している地上波の放送よりも高解像度なものにまで及びます。

当然ですが、映像の解像度が高いということは、より多くの情報量を持っているということです。動画データは基本的に何かしらのコーデックを利用して圧縮されて視聴者に届けられます。このような高解像度の映像を既存のネットワークで配信するためには、より高効率なコーデックが必要です。AbemaTV では現在 AVC/H.264 という映像コーデックを採用しています。その他多くの動画サービスも一般的に AVC/H.264 を採用していることが多いと思います。しかし、高解像度の映像データを配信する場合を想定すると AVC/H.264 ではデータ量が大きくなりすぎて、トラフィックを圧迫し、視聴者もより多くのパケットを消費することになってしまいます。

この問題は、利用するコーデックを変更することで解決する可能性があります。たとえば、AVC/H.264 の後継である HEVC/H.265 は AVC/H.264 の 2 倍の圧縮効率を実現します。HEVC/H.265 は、Apple 社の iOS 11 から動画撮影にも使われているコーデックなので、日常的に利用している人も多いと思います。しかし、HEVC/H.265 は AVC/H.264 と同様に複数の企業/団体が持つアルゴリズム特許を使用したコーデックのため利用には条件に従った特許使用料を支払う必要があります。特に HEVC/H.265 は関連する特許の数が多く、いざ利用しようとなると費用的な問題でひっかかります。特に AbemaTV は無料で動画を配信しているので、ビジネスモデルとしても成立しづらい現実があります。

そこで、オープンソースで開発されている AV1 という新コーデックに注目が集まっています。ちょうど NAB Show 2018 が開催される直前 3 月 28 日にビットストリーム仕様とデコーディング・プロセスがリリースされました。AV1 は Google によるオープンソース・コーデック VP9 を基に開発されていますが、同じくオープンソースである Daala や Thor が持っているアルゴリズムの良い部分が追加されています。VP9 にはない in-loop deringing filter などのモダンなコーデックが持っているアルゴリズムを Thor の constrained low-pass filter で補うなど、VP9 を大幅に機能向上させた仕様になっています。既存特許に抵触しないように、HEVC/H.265 などモダンなコーデックが持つ強力なエンコーディング・ツールに対抗できるアルゴリズムを各オープンソース・コーデックから揃えているのです。それらのエンコーディング・ツールを備え、HEVC/H.265 より 30% 圧縮効率が良いコーデックとして期待されています。

NAB Show 会場では多くのセッションで AV1 に関する話題を扱うとともに、多くの企業が AV1 対応を謳ったソリューションを展示していました。

AV1 のエンコーディング処理速度を表示しているスクリーンキャプチャ

NAB Show から帰ってきて、AbemaTV 開発チームでも AV1 を試していますが、現状まだエンコード速度は実用的なものではありません。もちろん、NAB Show でもエンコード速度についてはここから最適化が必要だと言われており、ロジックの最適化、FPGA などハードウェア・アクセラレータを使った高速化、並列処理による高速化などなど、各社さまざまな最適化のアプローチの途中経過を公開していました。

AV1 に対する各社の取り組みの様子

もちろん NAB Show 後もこれらの技術は徐々に進化していっています。現地で訪問した企業とは帰国後も度々コミュニケーションを取り、進捗を報告していただいています。また、NAB Show と同じく世界最大規模の放送関連コンベンションである IBC の開催が今月に控えています。更なる最適化を施したエンコーディング技術やその他関連技術が披露されることでしょう。

レポート・トピック:MAM によるコンテンツ管理と動画品質

AbemaTV の動画トランスコーディング・ストラテジストである御池は、コンテンツ管理システムを改善するための技術情報の収集というミッションを持って今回の NAB Show に参加しました。

コンテンツ管理の技術領域の対象は単純に動画コンテンツ・データだけではありません。コンテンツの周辺データであるサムネイル画像や演者などのアセット・データ、動画自体の映像や音声の品質管理、マスターとなる動画素材から映像フォーマットを変更するトランスコードなどの複雑なワークフローを管理する技術です。

AbemaTV でも大量の動画コンテンツを管理していますが、課題を抱えています。開局から 2 年半、これまで番組として配信してきた大量の動画データは共有ストレージに保存しているものの、コンテンツとしての管理手法が十分に仕組み化されていないため、必要なデータと不必要なデータの判断ができなかったり、編集/変換した際に品質が保たれているかのチェック体制が不十分であったりします。

それを解決するために、コンテンツ管理における QC(品質管理)強化やアーカイブ自動化を行い、より効率的なコンテンツ管理を行うためのヒントを探したいと考えていました。クラウド・ベースの MAM(Media Asset Management)システムが理想です。クラウドであれば、コンテンツ・プロバイダー、運用オペレータ、編集オペレータが人手を介在させることなく適切に管理された手段でコンテンツにアクセス、納品することができます。

クラウド運用による MAM を図示したスライド

今回の NAB Show に参加したことにより、動画ファイルの取り込みから送り出しまで包括したソリューションを持つ複数の企業と時間をかけて直接コミュニケーションを取ることができ、AbemaTV が持っている固有の課題を各社のエンジニアにぶつけて、効率的なワークフローに落とし込むためのヒントを得ることができました。

私たちが持つ課題はワークフローだけではありません。大量のコンテンツ・データの品質確認も人の手だけではリソースが足りないため、納品動画が正しいフォーマットかどうか、綺麗か汚ないか、差し戻しが必要かどうか、編集が必要なのかどうかなどソフトウェアに判定させています。しかし、その判定処理の精度は私たちが求めているものに達していないため、結果的に人の手と目で確認して補っている部分も少なくありません。そういった品質制御に関するソフトウェア上の性能面を向上させたいため、より良いQCソリューションを求めていました。実際にトランスコード面を管理している御池自身が NAB Show で出会ったさまざまな QC ソリューションに関して深くベンダーにつっこむことで、構築すべき品質管理の絵が見えてきました。

MAM をクラウド運用へと移行したいと考えている私たちは、クラウド・ベースのトランスコード・ソリューションを持つ企業とも多く話しました。一昔前はクラウド・べースのトランスコーダーは処理速度も遅く、細かなチューニングを施せない印象がありましたが、今回 Elemental Media Convert、Dalet Amberfin、Telestream Vantage、Harmonic VOS といったクラウド・ベースのトランスコード・ソリューションのエンジニアたちと話すことで、その印象は払拭されています。とはいえ、私たちが求めている品質を実現するためには課題も多いため、こういったソリューションを使用する場合にも彼らエンジニアとスピード感あるコミュニケーションを取ることができることが大事です。今回の遠征でその素地が作れた点は大きいです。

トランスコーダーの検証結果サンプル

遠征から帰ってきてからは、各ソリューションを検証しています。上図は各トランスコーダーで私たちの実際のコンテンツを処理した映像データを画像類似度指標である SSIM と PSNR を測定したものです。PSNR は 2 枚の画像における同位置のピクセルを輝度を比較し、SSIM は輝度、コントラスト、構造などを軸にピクセル単位の比較だけではなく周囲のピクセルとの相関も考慮に入れることができる指標です。このようにソリューションと私たちのコンテンツとの相性もじっくり検証しています。

レポート・トピック:QoE と再生品質可視化

動画技術に長く携わっているクライアントサイド・エンジニアの鈴木( @toshi0383 )は、QoE(Quality of Experience)を向上する技術をキャッチアップするというミッションの下 NAB Show 2018 に参加しました。

動画サービスにおいて、クライアント側の再生品質は QoE を一番左右する要素の1つです。提供する動画コンテンツの品質がどんなに良くても再生環境の品質がそれを台無しにする可能性は十分にあります。残念ながら現在は AbemaTV でも SNS 上で不具合報告されて初めて再生障害を知ることも度々あります。

QoE に関するレポートスライド

しかし、世の中の全ての端末に対して再生テストを行うことは現実的ではありませんし、再生時の環境もユーザーによってさまざまです。あるユーザーの環境では発生する不具合も、別のユーザーの手元では正常に再生できていることもあります。そういったユーザーの手元で起こっている再生の実態を可視化することに課題を持っていました。

QoE ツールへの期待を説明したスライド

再生品質を向上させるための第一歩は、品質を構成する要素を可視化して現状をしっかり把握することですが、リバッファリング処理、動画データのビットレート変動、フレーム落ちの発生タイミングなど多くの要素が互いに影響しあうため再生品質の可視化は容易とは言えません。

しかし、たとえば Conviva、NPAW、Mux といった会社はその技術領域を牽引しています。今回のミッションではこういった技術を持つ会社のエンジニアと直接対話して課題解決の糸口を見つけるように動きました。

彼らは、統計的にユーザー体験が悪くなる指標の算出アルゴリズムを独自で構築しているため、ただ再生品質を構成する要素をメトリクスとして取得するだけではなく、どれだけそれらの要素がユーザー体験に影響したかを可視化できます。また、異なるプラットフォーム間の差異を吸収して再生状態を一律で可視化する術を持っているため、品質に影響している原因をフラットに解析することが容易になります。

再生品質の可視化の効果は現状の再生障害を減らすことだけに留まりません。動画コンテンツに対するエンコード・パラメータや配信メソッドの最適化を施す際も、実際にユーザーの手元での影響を確認しながら進めることが可能になります。

こういった知見を基に現在 AbemaTV でも再生品質を可視化する取り組みを進めています。こういった現状を可視化する投資は直接的なメリットを生むかどうか確証を得ることが難しいものですが、今回のように NAB Show で実際に見たり聞いたりすることで、取り組みを担当するエンジニアたちも自信を持って進めることができました。

レポート・トピック:配信品質

AbemaTV の動画配信サーバー担当のエンジニアみゆっきこと山中( @toriimiyukki )は、サービスの配信品質の向上を主目的にカンファレンスに臨みました。

インターネット動画配信における品質は次の 3 つの要素で決まると言われています。

  1. 配信遅延時間
  2. スケーラビリティ
  3. 映像/音声などの解像度

つまり、低遅延で高スケーラビリティで映像/音声の解像度が高い配信ができれば良いわけですが、残念ながらこの 3 要素はトレードオフの関係にあるため、全ての要素を一律理想の状態に持っていくことは容易ではありません。

動画配信品質のトレードオフを説明したスライド

電波を使った地上波放送は完全に帯域が保証されている中で、何万人という人が見ていても確実に届けることができますが、インターネットで配信する場合には視聴人数のスケールに限界があります。映像や音声の解像度を落としてより多くの人に届けることを優先したり、遅延を許容してデータのキャッシュを増やすなど、要素の取捨選択が求められます。NAB Show で低遅延に関する講演をしていたライブストリーミング配信サービスの Twitch では、OTT の生配信に関しては低遅延、スケーラビリティを動画の解像度より若干優先することでバランスを取り品質を決定しているそうです。

近年は HTTP ベースのストリーミング技術が主流です。HLS や MPEG-DASH といった HTTP ベースのストリーミング・プロトコルは、安定配信はできるものの低遅延には向いていないのですが、そんなデメリットを相殺するために世界中の動画サービスのエンジニアたちが日々試行錯誤しています。低遅延を実現するためのアプローチはいくつかあります。例えば、HLS や MPEG-DASH でも HTTP の chunked Transfer-Encoding を使ってチャンクサイズより細かい単位で動画データを配信することで遅延を短縮できます。AVC/H.264 などの映像コーデックを使っている場合であれば、圧縮効率が高い B フレームをあえて含めずにエンコードすることで帯域を犠牲にして圧縮時間とバッファ時間を削減することが可能です。最近では、低遅延に適した動画ファイル・フォーマットである CMAF( Common Media Application Format )も注目されています。

先述した Twitch の講演では、遅延を復旧することで視聴体験を向上させる方法についても紹介していました。たとえば、生放送時にバッファーしていたデータがなくなった場合、動画プレイヤーはリバッファリングする必要があります。その結果、ライブエッジからは遅れますが、その際に 1 分間に 2 秒程の割合で遅延を回復するように再生速度を上げるなどの工夫をすることでユーザーの視聴体験を最小限の犠牲に抑えて生放送を楽しんでもらうなど実践的な知見を得ることもできました。

P2P 型 CDN サービス一覧を表示したスライド

また、より高いスケーラビリティを実現するために CDN を使った配信をすることも多いと思います。今年は複数の会社が実績などを訴求していたこともあり、CDN への接続数自体を大幅に減らすことができる手法として P2P による動画配信が再度会場で注目を集めていました。AbemaTV でもこういった P2P を使った動画配信ソリューションなども検討の土台に入れており、NAB Show 後もいくつかの企業とコミュニケーションを続けています。

STREAMROOT のサイバーエージェント訪問
STREAMROOT など数社がサイバーエージェントを訪問しビジネス・コミュニケーションを続けている

レポート・トピック:透かし技術によるコンテンツ保護

先述したコンテンツ管理技術システム構築の責任者である岸は、私たちが持っていなかった視点でのコンテンツを保護する手法に目をつけました。

インターネット動画配信においては動画データを暗号化して、復号されたファイルを作らないことでコンテンツを保護するのが一般的です。しかし、この手法はデータ自体を守ることはできても画面に出力されている映像をカメラで録画されることを防ぐことはできません。ウォーターマーキング、いわゆる透かし技術はこういった録画による海賊行為を抑制することを目的とした技術です。

この技術は、人の目では見ることができない透かしを再生端末ごとに一意となるように挿入します。どんなにアナログ的な手法であっても、透かしが入ったコンテンツは透かしとともに撮影されるため、どの端末で再生されたコンテンツを撮影したかを判別することができます。

例えば、透かし技術を提供している企業の 1 社である NexGuard 社は、その中でもトップレベルのシェアを持っています。ノイズや回転、クロッピングといった動画編集にも耐性を持つ透かしを挿入することができ、また動画の一部だけからも透かしの解析を可能とする高度な技術を持っています。

電子透かしを埋め込む仕組みを図示したスライド

HLS であれば複数のセグメントを MPEG-2 TS や Fragmented MP4 などのファイル・フォーマットで取得して、動画コンテンツを再生しますが、NexGuard はこのセグメント・ファイルを異なる透かし情報入りで複数パターン作り、端末によってその配信セグメントの順序・組み合わせをユニークになるように構成します。

流出動画解析を説明した図

透かしは人の目にはもちろん分かりませんが、解析ツールにかけると一発で判別でき、提供元と再生ユーザーを特定することができます。

このように、現地では思いもしなかった発見もあったりするので面白いです。

レポート・トピック:SDI over IP と対応機器

AbemaTV でスタジオの技術管理を担当している近藤は、普段はサーバーに上がる前の映像を扱っています。

テレビスタジオでは、複数の部屋に置いてある機器間で映像を引き回す必要があるので、放送業界では長らく 100m 程の長距離伝送が可能な SDI 信号を同軸ケーブルで利用してきました。

しかし、今後 8K や 4K といった高解像度の情報を扱うようになると、広帯域の情報を流す必要があるため信号が減衰しやすくなり今まで同様の伝送距離を確保することが難しくなります。また、たとえば 8K の映像を伝送すると、現状の規格の SDI ケーブルでは 1 つのカメラからスイッチャーなどに接続するのに 4 本必要になります。これが複数のカメラになれば、その掛け算分のケーブルを接続することになるので、配線が大変なことになるという課題があります。

そこで、伝送距離に限りがあり、物理的な配線に悩みがつきまとう SDI ケーブルを止めて、IP 化すればカメラから 1 つのファイバーケーブルで伝送距離に制限されることなく接続することが可能になります。

また、番組のノンリニア編集や送出などの設備は既にファイルベースで運用されているため、IP 化されているので、より柔軟にシステム構築ができるようになります

昨年 SMPTE 2110 という IP 接続の規格が標準化されたことで、1 年経った今年の NAB Show では SDI over IP に対応した周辺機器の拡充が見られました。放送エンジニアにとっては IP は新しいプロトコルのため、従来の放送機器の操作感で IP で受けた映像の波形や状態を確認できることは嬉しいことです。

放送エンジニア・フレンドリーな SDI over IP 対応機器を紹介したスライド

特徴的なものでいうと、Web ブラウザベースの IP のルーティング管理ツールを操作インターフェースを放送エンジニアに親しみがある物理ボタンにした機器なども展示されていました。

放送エンジニア・フレンドリーに UI に物理ボタンを使った SDI over IP 対応機器を紹介したスライド

また、国内メーカーであるパナソニックさんは SDI over IP の別規格である NDI を採用したライブスイッチャーなどを展示していました。SMPTE 2110 は非圧縮で伝送を行うため高価なハブが必要になったりしますが、NDI は 100 Mbps 程に圧縮する規格のため、既存の LAN 設備なども利用可能というメリットがあります。アメリカでは大学や教会など中規模な市場も多いため、そういった潜在市場を優先したマーケティングのようです。

AbemaTV でも現在部分的に NDI を使った番組制作を行っているが、今後本格的なリモート・プロダクションを NDI ベースで実施することに向けて今回の NAB Show で得た知見をフル活用しています。

レポート・トピック:インターネット伝送の進化

放送とインターネット両方の知識を持つエンジニアである田添( @TZU39 )は、放送におけるインターネット伝送の可能性を模索することをミッションの1つに NAB Show 2018 に参加しました。

先述した SDI over IP のトピックでは IP という言葉を使っていますが、これはインターネットで伝送するという意味ではありません。一般的に放送業界で IP 伝送を行うというのは、専用回線をひくことを前提としています。ここでいう専用線とは、専用光ファイバー網の利用、FPU(マイクロ波回線)、衛星回線を使って通信することを指します。

こういった専用線を使った IP 伝送に関しては放送規格として SMPTE 2022 で定義されていますが、ここにインターネットを使った伝送は定義されていないため、これまでは各社が独自に実装していて、互換性がない状態でした。

元々インターネットは帯域も安定していないネットワークで、パケットロスも当然発生しますし、常時定速で通信の送受信がなされるわけではないので、ジッターも発生します。そういった理由もあり放送用のギャランティード・ネットワークに対してダーティー・ネットワークと呼ばれています。そのインターネット回線を経由して放送品質でデータを送受信することは耐えられるものではありません。インターネットを使う場合、伝送データの信頼性を担保するために TCP を使うことも多いですが、信頼性を引き換えに遅延を発生させることになり、期待したスループットが出せないという問題も持ち合せています。

そういったインターネット伝送における問題を解決すべく、昨年 SRT というインターネット伝送に特化したプロトコルがオープンソース化されています。SRT は Secure Reliable Transport の頭文字を取ったストリーミング・プロトコルの名前です。その名前の通り、動画ストリームを暗号化し、パケットロスから回復する機能を持ち、インターネットにおいて安定的に動画を伝送することができます。SRT は TCP ではなく UDP を拡張した UDT を採用しているので、長距離通信においてもスループットを確保することができます。UDT による通信ではパケットにシーケンス番号がつき、ACK によるパケット再送機能もあります。また、独自の前方誤り訂正も備えているので、伝送情報に対しての信頼性は高いものになっています。

SRT 伝送の仕組みを説明したスライド
https://www.haivision.com/blog/broadcast-video/created-srt-difference-srt-udt/

SRT ではインターネット伝送を安定的にするために、ジッターや遅延、パケットロスがインターネット伝送上で発生されることを前提にして、あらかじめ受信側にバッファー時間を設定しています。このバッファー時間の中で、喪失したパケットに対して再送信を求めたり、ジッターや遅延によってずれた時間を再構成して動画ストリームをデコーダーに渡すことができるようにしているのです。

今年はそのSRTでのアライアンスができてから初めての NAB Show ということで SRT を使った中継システムやユースケースなどに注目が集まっていました。米大手プロダクション AZZURO は NFL の中継で SRT による簡易中継システムの事例を紹介していました。さすがに試合中継自体に SRT を使うことはリスクが高いようでしたが、各チームのクラブハウスなどからの中継に SRT による簡易中継システムが導入されたなどさまざまな事例も聞くことができました。

想定される SRT の利用例を図示したスライド

SRT を使うことができるようになると、専用線や FPU、衛星より低コストに伝送することが可能です。また、リアルタイムのインターネット配信で RTMP の代わりに SRT を使って伝送することが考えられます。現在動画の生配信では RTMP(Real-Time Messaging Protocol)を使うことが一般的ですが、プロトコル上の制約で 4K など大容量の配信をするには不向きですし、RTMP は TCP ベースなので遅延の問題もあります。SRT を使うことにより大容量の配信に対する制限の問題も解決でき、低遅延の伝送が可能になる可能性があります。

インターネット伝送の進化は SRT のような固定回線を前提とした技術も進化していますが、携帯回線を使ったモバイル伝送においても進化しています。会場に中継車を持っていくことなく最大 6 つのカメラ映像全てのモバイル伝送によりリモートプロダクションを可能にしたシステムの展示など、今回の NAB Show ではより精度が高い簡易中継のシステム構築のヒントも多く得ることができました。

おわりに

海外カンファレンスへの遠征は費用がかかるものの、適切かつ十分に準備をすることで現地での戦略的な情報収集、技術パートナーとの長期的なコネクション、自身の開発サービスへの反映など、かけた費用以上の結果に繋げることができると感じています。サイバーエージェントはこれまでインターネット技術の会社ではありましたが、取り分け動画技術に強い会社ではありませんした。しかし、現在は AbemaTV、FRESH LIVEOPENREC.tv を始め動画サービスも多く展開しています。動画技術および放送技術との関連も無視することはできません。

今回は NAB Show 2018 を例に海外カンファレンスに参加して得た知見を(できる限り)最大限に活用するための取り組みをレポートさせていただきました。これから海外カンファレンスに参加されるエンジニアの方々に少しでも参考になれば幸いです。