ライブ配信の一般化と、状態監視の必要性

コロナ禍になって、リモートコミュニケーションの需要が高まり、それまでは一部の方だけが利用していた、インターネットによるライブ配信も、小規模なイベントで実施することが増えたかと思います。サイバーエージェントでも、セミナールームで利用できるライブ配信機材の利用回数が大幅に伸びました。

クラウドサービスや、ZOOMやその他国内のASPサービスを用いることで、専門の知識がなくても非エンジニアの方でも気軽にオンラインイベントを開催できる土壌が整ったように見えます。
しかし、ビデオカメラを用いたり、イベント会場のマイクから音をもらうなどやることが増えると、接続した機器やソフトが動く再現性についての確認が重要になります。

機材やソフトの再現性の確認は、比較的容易です。複数の機材がある場合になると、リハーサルや長時間確認を行うことで、課題のあぶり出しが可能です。

ライブ配信に利用するネットワークの課題は、事前確認では出現しづらい部分です。
その理由は大まかに、ライブ配信のネットワークインフラが他用途と共用することが多い、配信サーバがインターネット上にあり経路状態が特定不能である、ことだと思います。
細かいところを上げるときりがないのですが、
今回は、共用部分が多いネットワークを利用した配信で、課題発生時の簡易切り分けが行える監視手段を紹介したいと思います。

ライブ配信のデータは途切れることが許されない中、少しでも安心感を上げることが重要になります。

1:ローカルサイドでの監視その1

Youtubeライブでは、配信管理画面でエンコードデータの受信状況が表示されます。ただ、接続し始めた際には異常を示す値を表すこともあり、常に頼りきることもできません。
Wirecastなどのエンコーダソフトでは通信状況を詳細に表す機能があります。状態監視では、十分なことも多いですが問題箇所を確認するのは難しい場合があります。
エンコーダから監視画像 
一般的なライブ配信では、エンコーダソフトがインストールされたPCとルータ、インターネット上の配信サーバが常時疎通されていれば問題がありません。
ネットワーク状況を常時確認するためにはPINGを利用します。PINGは3種類を用意します。
1)エンコーダPCからルータまで。
2)エンコーダPCから配信サーバまで。
3)エンコーダPCからその他のサーバまで。
LAN内の経路が複雑であれば、1に追加をしても良いかなと思います。
2でPINGを返す設定がない場合は省略しても良いかなと思います。
3は海外ではなく国内の大手サービスが運用する稼働率の高いサービスが良いかなと思います。

この3つのPING結果を用いることで、下記の可能性を疑うことができます。
・1から3までNGが続く場合は、PC本体・ルータもしくはLAN内部の問題
・1までOKで2と3がNGの場合は、ルータもしくはアップロード回線の問題
・2だけがNGの場合は、配信サーバ側の問題
トラブルが発生している状態で大まかにこの程度の状態が切り分けてあれば、問い合わせを受けた技術担当者も、即座に次の行動に移すことができると思います。
(ローカルのネットワークを管理するセクションと、サーバを管理するセクションが違うことが多いため)

PC上でのPING監視画面
デスクトップ上に極端に配置をしてみました。実際には、エンコードソフトのエリアを多くとって、
操作をしやすくすることになるようにします。
また、無線LANでのキャプチャーですので、結果が3桁であったり、タイムアウトしています。
配信の際は必ず有線LANを利用しましょう。

2:ローカルサイドでの監視その2(Liveshell/Elemental Link)

また、最近ではエンコーダをPCではなく、LiveshellElemental Linkなど専用ハードウェアを利用することが増えています。機器の接続が不要になったり設定が簡易になった反面、状態管理については省略されている部分も多く、問題発生時の切り分けは準備をしておかないと、入力信号の確認さえおぼつかない場合があります。
一体型エンコーダでの監視
簡易的にPING監視を行う場合は、同一LAN内に設置をしたPCから、エンコーダへのPING監視を、前述の2および3に追加をすることで、LAN内の課題とWAN側の課題に切り分けができるようになります。

3:もう少し継続的に配信を行う場所での監視

24時間ずっと配信をしている環境や、スタジオなど複数の配信機器がある場合には、個別の配信機器から監視をするよりも、監視用の環境を作るほうが効率的なことが多いと思います。

パケロス監視datadogの例


サイバーエージェントのスタジオでは、LAN側に置いたエージェントからデータセンターにPINGを送信しDatadogで可視化を行っています。LAN側のNW機器は監視が行われているため、インターネットから先の課題と切り分けが即時にできることが目的となっています。

ライブ配信で発生するトラブルは、今回のように分かりやすい事象だけではなく、
コマ落ちや途切れなど、切り分けが難しいトラブルも多いです。
多くのナレッジを貯めることで、想定されるトラブルを予め回避する仕込みが必要となります。