https://docs.livekit.io/intro/about/
LiveKit は、音声・ビデオ・物理AIエージェントをリアルタイムで構築するための オープンソースフレームワークおよびクラウドプラットフォームです。 リアルタイムの音声・映像・データのストリームを通じて、ユーザーとインタラクションする エージェントを構築するためのツールを提供します。 低遅延なインフラ(WebRTCベース)により、信頼性の高いパフォーマンスを実現します。([docs.livekit.io][1])
- WebRTCはブラウザネイティブのリアルタイム通信技術で、音声やビデオに最適化されたプロトコルです。
- HTTPのようなリクエスト/レスポンス型通信とは異なり、継続的なメディアストリームを効率的に扱えます。
- LiveKitはWebRTCの複雑さ(運用やスケールなど)を抽象化し、さまざまなプラットフォームでの利用を容易にします。([docs.livekit.io][1])
LiveKitは次のような利点を持っています:([docs.livekit.io][1])
-
高速開発 高レベルの抽象化を提供する「Agents framework」により、音声処理・ターンテイク・LLM統合などが簡単。
-
クロスプラットフォーム対応 同じSDK/APIでWeb、iOS、Android、Flutter、Unity、バックエンド環境などへ対応。
-
インフラ構築不要 WebRTCの複雑な運用をLiveKitが担い、自前で構築する必要がありません。 — Cloud版とセルフホスト版があり、APIは共通です。
-
システムとの連携容易 録画(Egress)、外部ストリーム受信(Ingress)、電話ネットワークとの統合(Telephony)などを提供。([docs.livekit.io][1])
LiveKitでは以下のようなリアルタイムアプリを構築できます:([docs.livekit.io][1])
- 🎙 AIアシスタント:音声・映像・テキスト対応の対話型AI
- 📹 ビデオ会議アプリ:プライベートかつセキュアな会議
- 📡 インタラクティブライブ配信:視聴者とリアルタイムで交流
- 🤝 カスタマーサービス:Web・モバイル・電話対応サポート
- 🏥 ヘルスケア:AIと人を組み合わせたテレヘルス
- 🤖 ロボティクス:リアルタイム映像とAIを活用したデバイス制御
リアルタイム性・低遅延・スケーラビリティを満たす基盤を提供します。([docs.livekit.io][1])
LiveKitは以下の主要コンポーネントから構成されています:([docs.livekit.io][1])
- オープンソースの WebRTC SFU(Selective Forwarding Unit)
- 参加者/エージェント間のリアルタイム通信を中継管理
- シグナリング、NAT越え、RTPルーティング、QoS制御などを担当
- LiveKit Cloud(マネージド版)または セルフホストを選択可能([docs.livekit.io][1])
- AIエージェント構築向けの高レベルツール
- 音声処理、ターンテイク、マルチモーダルイベント、LLM統合をサポート
- エージェントはLiveKitのルームに参加し、メディア処理やユーザーとの対話が可能([docs.livekit.io][1])
- Web、iOS、Android、Flutter、Unity、バックエンド向けSDKを提供
- エージェントと人間クライアントは同じSDK/APIを使ってルームに参加し、 メディアトラックやデータをやり取りします。([docs.livekit.io][1])
LiveKitは以下のような追加サービスをサポートします:([docs.livekit.io][1])
- Egress(録画/エクスポート)
- Ingress(外部メディア取り込み)
- Telephony(電話統合)
- サーバーAPI(ルーム管理など)([docs.livekit.io][1])
ドキュメントは複数のセクションで構成されており、主に以下をカバーしています:([docs.livekit.io][1])
- Introduction (概要)
- Build Agents(AIエージェント構築)
- Agent Frontends(UI構築)
- Telephony(電話統合)
- WebRTC Transport(低レベルWebRTC解説)
- Manage & Deploy(デプロイ/観測)
- Reference(APIリファレンス)([docs.livekit.io][1])