FFmpeg v8とSVT-AV1を極める：高画質・高効率エンコードの最適設定術

2025年12月22日

当ページのリンクには広告が含まれています。

FFmpeg v8とSVT-AV1を極める：高画質・高効率エンコードの最適設定術

動画配信基盤における帯域コスト削減とユーザー体験向上の切り札として、AV1コーデックの採用は不可避な選択です。特にFFmpeg v8.0 “Huffman”（2025年8月リリース）では、Vulkanベースのフィルターパイプラインとlibsvtav1（Scalable Video Technology for AV1）の統合が深化し、実用的なエンコード速度と圧倒的な圧縮効率の両立が可能となりました。

本稿では、FFmpeg v8環境下におけるSVT-AV1の挙動を技術的に解剖し、商用レベルの配信に耐えうる「高密度かつ堅牢なエンコード設定」を提示します。

この記事を書いた人：Mitsu（StudioMitsu代表）

フルスタックエンジニア（15年）。大手SIerで金融システム（与信判定、利息計算）を5年間開発した経験を持つ。Web・インフラ・動画処理など幅広い技術領域で実務経験があり、システム的な視点から実践的なノウハウを発信。

→ 詳しいプロフィールはコチラ

FFmpeg v8におけるSVT-AV1の実装特性

FFmpeg v8の最大の功績は、Vulkan APIによるハードウェアコンテキストの取り扱いが標準化された点にあります。SVT-AV1自体はCPUベースのソフトウェアエンコーダーですが、デコードやフィルタリング処理（スケーリング、トーンマッピング）をVulkan経由でGPUにオフロードすることで、CPUリソースをSVT-AV1の演算に集中させることが可能になりました。

v8環境下では、SVT-AV1のボトルネックは「前処理」ではなく純粋な「エンコード演算」に集約されるため、PresetとCRFの選定がリソース効率に直結します。

実戦的エンコードコマンド：Production Ready

以下は、品質と効率を最大化するためのベースラインとなるコマンドです。単純なコピー＆ペーストではなく、各フラグの意図を理解して運用してください。

Windows (PowerShell) 用スクリプト

# Windows PowerShell Script for FFmpeg v8 SVT-AV1
# 実行ポリシーでスクリプトがブロックされる場合は
# Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope Process
# を実行してから動かしてください。

# 入力ファイルと出力ファイルの定義
$InputFile = "input_master.mov"
$OutputFile = "output_av1.mkv"

# FFmpeg実行
# Windowsでは改行にバッククォート(`)を使用します
ffmpeg -y -init_hw_device vulkan=vk:0 `
    -i "$InputFile" `
    -c:v libsvtav1 `
    -preset 6 `
    -crf 24 `
    -pix_fmt yuv420p10le `
    -svtav1-params "tune=0:enable-overlays=1:scd=1:scm=0:lookahead=120:keyint=240:film-grain=0" `
    -c:a copy `
    "$OutputFile"

# 解説:
# -preset 6       : バランス型設定。数値を変える場合はクォート不要
# -svtav1-params  : パラメータ文字列全体をダブルクォートで囲む必要があります

macOS / Linux (Bash) 用スクリプト

#!/bin/bash

# 入力ファイルと出力ファイルの定義
INPUT="input_master.mov"
OUTPUT="output_av1.mkv"

# SVT-AV1 エンコード実行
# 改行にはバックスラッシュ(\)を使用します
ffmpeg -y -init_hw_device vulkan=vk:0 \
    -i "$INPUT" \
    -c:v libsvtav1 \
    -preset 6 \
    -crf 24 \
    -pix_fmt yuv420p10le \
    -svtav1-params "tune=0:enable-overlays=1:scd=1:scm=0:lookahead=120:keyint=240:film-grain=0" \
    -c:a copy \
    "$OUTPUT"

# 解説:
# -preset 6       : バランス型設定。数値を変える場合はクォート不要
# -svtav1-params  : パラメータ文字列全体をダブルクォートで囲む必要があります

パラメーターの内部ロジックと最適化

単なる推奨値の羅列ではなく、SVT-AV1の内部アルゴリズムに基づいたパラメーター選定の論理を解説します。

1. Preset：パーティショニング決定の深さ

Preset値は、エンコーダーが「どれだけ深く探索を行うか」を決定します。具体的には、ブロックパーティショニング（画像を分割して動きを予測する処理）の細かさと、動きベクトル探索の精度が変化します。

Preset 0-3 (Research/Archival): 全探索に近い挙動。計算コストは指数関数的に増大するが、ビットレート削減効果はPreset 4と比較して5〜10%程度にとどまる。商用配信では採算が合わないケースが大半。
Preset 4-6 (VOD Production): 推奨レンジ。RDO（Rate-Distortion Optimization）が十分に機能し、複雑なテクスチャの保持とエンコード速度のバランスが最適化されている。
Preset 7-13 (Real-time/Live): 高速化のために早期終了（Early Exit）の閾値が緩くなり、画質よりもスループットが優先される。

技術的トレードオフ： Presetを 6 から 4 に下げると、CPU使用率は約2倍になる一方、同一CRF値でのファイルサイズは5〜8%削減されます。帯域コストとコンピュートコストの損益分岐点を見極める必要があります。

2. CRFとPsycho-visual Tuning (tune=0)

AV1の強みは、人間の視覚特性（HVS）を利用した圧縮にあります。

-crf (Constant Rate Factor): x264/x265のCRFとはスケールが異なります。SVT-AV1のCRF 30 は、x265のCRF 24 程度に相当します。高画質配信では 20〜26 の範囲がゴールデンゾーンです。
tune=0 (Subjective Quality): デフォルト（tune=1）はPSNR（信号対雑音比）スコアを最大化しようとしますが、これは数値上の正しさを優先し、視覚的な「ぼやけ」を許容する傾向があります。tune=0 は視覚的なシャープネスとディテール保持を優先し、SSIM/VMAFスコアとの相関性が高くなります。

設定の結論： ユーザー体験（QoE）を指標とする場合、必ず tune=0 を指定し、数値スペックよりも「見た目の解像感」を優先すべきです。

3. 10-bit Color Pipeline (-pix_fmt yuv420p10le)

入力ソースが8-bitであっても、必ず10-bitでエンコードすべきです。

内部ロジック: 8-bitソースを8-bitで圧縮すると、量子化プロセスでの丸め誤差により、空や壁などの平坦なグラデーション部分にバンディング（縞模様）が発生します。10-bit空間で計算することで、この量子化ノイズをディザリングなしで大幅に抑制できます。
オーバーヘッド: SVT-AV1のアーキテクチャは最新のSIMD命令（AVX2/AVX-512）に最適化されており、10-bit処理による速度低下は無視できるレベル（数%以内）です。

svtav1-params 詳細設定とマイクロチューニング

FFmpegのオプション体系から溢れた、SVT-AV1固有の制御パラメーターは -svtav1-params で直接渡します。

Lookaheadとシーンチェンジ検出 (scd)

lookahead=120: エンコーダーが処理中のフレームより先を「見る」フレーム数です。これにより、ビットレート配分（Rate Control）が最適化され、複雑なシーンの直前にIフレームを配置するなどの先回りが可能になります。FPSの数倍（例: 5秒分）確保するのが理想です。
scd=1 (Scene Change Detection): シーンの切り替わりを検出し、強制的にキーフレーム（Iフレーム）を挿入します。これにより、シーン転換時のブロックノイズを防ぎ、シーク性能を向上させます。

Film Grain Synthesis (FGS)

AV1の「魔法」とも言える機能です。

film-grain=<value>: ノイズ（フィルムグレイン）を忠実にエンコードしようとすると、高周波成分として扱われ、大量のビットレートを消費します。FGSは、エンコード時にノイズを除去（デノイズ）し、そのノイズの「特徴パラメーター」だけをメタデータとして記録します。再生時にデコーダーがノイズを再合成します。
運用: 実写映画やドラマでは film-grain=8 〜 15 程度を設定することで、低ビットレートでも質感のある映像が得られます。アニメーションの場合は 0（無効）が基本です。

Temporal Filtering (enable-tf)

enable-tf=0: デフォルトでは有効ですが、極端な高画質を狙う場合は無効化（0）を検討します。有効にすると、時間軸方向のノイズを除去するためにフレーム間の平均化が行われますが、動きの速い細かいディテール（雨、紙吹雪など）が消失するリスクがあります。ビットレートに余裕がある場合は 0 に設定し、ディテールを保存します。

トラブルシューティングとFAQ

1エンコード速度が出ない: CPUのリソース配分とNUMAノードを確認してください。 SVT-AV1はスレッド並列化に優れていますが、コア数が多すぎる場合（64コア以上など）、スレッド間の同期オーバーヘッドが発生します。FFmpegの -threads オプション制限に加え、SVT固有の logical_processors パラメーターでの制限、またはFFmpegインスタンスを複数立ち上げてチャンク分割エンコード（Chunked Encoding）を行う設計が有効です。
特定のプレイヤーで再生できない: プロファイルとTierを確認してください。 profile=main は最も互換性が高いですが、4:2:2や4:4:4のクロマサブサンプリングを使用する場合は profile=professional が必要となり、ハードウェアデコーダーのサポート外になる可能性があります。コンシューマー向け配信では yuv420p10le と profile=main の組み合わせを厳守してください。
アニメ映像で線が滲む: tune=0 に加え、bias-pct の調整が必要です。アニメーションなどのフラットな領域が多いコンテンツでは、psy-rd などの心理視覚調整が強すぎると、エッジ周辺にリンギングが発生します。アニメ専用の設定として、tune=0 を維持しつつ、もしノイズが気になる場合は film-grain=0 を明示し、CRFを通常より2〜3下げて（品質を上げて）対応してください。

FFmpeg v8とSVT-AV1の組み合わせは、設定値一つで出力結果が劇的に変化します。上記の設定を「正解」として盲信するのではなく、これをベースライン（基準点）とし、配信するコンテンツ特性に合わせて Lookahead や Film Grain の微調整を行うことが、最も大切です。

SVT-AV1エンコードを加速させる推奨ハードウェア構成

本記事で紹介したFFmpeg v8のVulkanパイプラインとSVT-AV1のパフォーマンスを最大化するには、ボトルネックを解消する適切なハードウェア選定が不可欠です。用途と予算に応じた3つの選択肢を提案します。

1. Intel Arc A380 / A750

【コスパ重視・サブマシン用】

メリット: 市場で最も安価にAV1ハードウェアデコード・エンコード（QSV）環境を入手可能。
技術的優位性: FFmpegのQSV対応は歴史が長く堅牢です。SVT-AV1（CPU処理）が重すぎる場合、即座にハードウェアエンコード（av1_qsv）へ切り替えるバックアップとして優秀です。Vulkanフィルター処理のオフロード用としても十分な性能を持ちます。
ターゲット: 自宅サーバーを安く構築したいエンジニア、省電力重視のユーザー。

【1日と5.0のつく日、18日はポイント3倍！】Intel グラフィックカード Intel Arc A750 Challenger D 8GB OC PCIExp 8GB

エクセラー

¥46,800 （2025/12/22 13:02時点 | 楽天市場調べ）

Amazon

楽天市場

Yahooショッピング

ポチップ

2. NVIDIA GeForce RTX 4060 Ti 以上

【安定性重視・メインマシン用】

メリット: Vulkan APIのドライバ品質が最も高く、FFmpegでのトラブルが最小限です。
技術的優位性: 記事内のコマンド（init_hw_device vulkan）を使用した際、ソース動画のデコードとフィルタリングをGPU側で高速に処理し、CPUをSVT-AV1の演算に100%集中させることができます。4070 Ti以上ではデュアルNVENCを搭載し、並列処理性能が跳ね上がります。
ターゲット: ゲームや編集作業とエンコードを1台で兼任させたいハイエンドユーザー。

【25日は24時間限定クーポン配布】ASUS エイスースDual GeForce RTX 4060 Ti V2 OC Edition 8GB GDDR6 グラフィックボード DUAL-RTX4060TI-O8G-V2(2641920)送料無料

e-zoa 楽天市場 SHOP

¥71,980 （2025/12/22 12:58時点 | 楽天市場調べ）

Amazon

楽天市場

Yahooショッピング

ポチップ

3. AMD Ryzen 9 7950X / 9950X (CPU)

【画質・速度追求・エンコード特化】

メリット: SVT-AV1はCPUリソースをリニアに消費するため、物理コア数が正義となります。
技術的優位性: 16コア32スレッドの並列処理能力により、高品質な「Preset 4〜5」設定でも実用的なFPSを叩き出します。GPUが「前処理」を担当し、Ryzenが「圧縮」を担当する分業体制が、現時点での画質/速度の最高到達点です。
ターゲット: 妥協のない最高画質を求める映像エンジニア、専用エンコードサーバー構築者。

【送料無料】AMD Ryzen9 7950X W/O Cooler (16C/32T,4.5Ghz,170W) 正規代理店保証付 cp1358

メモリーショップ・アーク

¥117,800 （2025/12/22 13:03時点 | 楽天市場調べ）

Amazon

楽天市場

Yahooショッピング

ポチップ

よかったらシェアしてね！

URLをコピーしました！

URLをコピーしました！

コメントするコメントをキャンセル

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください。

FFmpeg v8とSVT-AV1を極める：高画質・高効率エンコードの最適設定術

FFmpeg v8におけるSVT-AV1の実装特性

実戦的エンコードコマンド：Production Ready

パラメーターの内部ロジックと最適化

1. Preset：パーティショニング決定の深さ

2. CRFとPsycho-visual Tuning (tune=0)

3. 10-bit Color Pipeline (-pix_fmt yuv420p10le)

svtav1-params 詳細設定とマイクロチューニング

Lookaheadとシーンチェンジ検出 (scd)

Film Grain Synthesis (FGS)

Temporal Filtering (enable-tf)

トラブルシューティングとFAQ

SVT-AV1エンコードを加速させる推奨ハードウェア構成

1. Intel Arc A380 / A750

2. NVIDIA GeForce RTX 4060 Ti 以上

3. AMD Ryzen 9 7950X / 9950X (CPU)

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル