🧪
概念 #claude-code #動画編集 #whisper #auto-editor #ffmpeg #実践 📚 claude-code-video-editing

テスト実践録 — 実際に動かしてわかったこと【第12回】

IMG_7903.MOVを使ってWhisper・auto-editor・ffmpegを実際に動かした記録。パラメータのチューニング・できたこと・できなかったことを整理する。

30秒のiPhone動画(日本語しゃべりあり)を素材に、ツールを実際に動かした記録。

素材

  • ファイル: iPhoneで撮影した30秒のMOV(HEVC+AAC、44100Hz)
  • 内容: 日本語で話している動画(デモ用に意図して「天気がいい」を繰り返した)

やったこと・結果

文字起こし(Whisper)

whisper /tmp/test.mov --language Japanese --model turbo --output_format srt --output_dir /tmp/

結果: 成功

[00:00.560 --> 00:06.000] こんにちはよろしくお願いします 今日はとてもいい天気で
[00:06.000 --> 00:12.320] 外がとても明るいです これはデモ用の動画です
[00:12.320 --> 00:15.120] ジェットカットなどの 作業で
[00:15.120 --> 00:22.040] 使用するためにテストで撮っています 今日はとても天気がいいです
[00:22.040 --> 00:26.800] 2回目ですが 今日は天気がいいので
[00:26.800 --> 00:30.560] 繰り返し言ってみました

日本語の精度は問題なし。「ジェットカット」など専門用語も正しく認識された。


ジェットカット(auto-editor)— パラメータ調整の記録

1回目: 切りすぎた

auto-editor /tmp/test.mov --margin 0.2sec --edit audio:threshold=0.04 -o /tmp/cut.mov

元: 30.67秒 → カット後: 2.33秒

この動画は話と話の間に長めの沈黙があったため、threshold=0.04 が厳しすぎた。Whisperが「ご視聴ありがとうございました」とハルシネーションを起こすほど短くなった。

2回目: 適切にカット

auto-editor /tmp/test.mov --margin 0.5sec --edit audio:threshold=0.02 -o /tmp/cut2.mov

元: 30.67秒 → カット後: 18.4秒

自然なテンポになった。

学び: パラメータは動画の特性に合わせて調整する必要がある。最初に --preview でどの区間がカットされるか確認してから本番実行するのが安全。


フェードイン/アウト(ffmpeg)

ffmpeg -i /tmp/test.mov \
  -vf "fade=type=in:st=0:d=0.5,fade=type=out:st=28:d=2" \
  -af "afade=type=in:st=0:d=0.5,afade=type=out:st=28:d=2" \
  /tmp/demo_effects.mp4 -y

結果: 成功

映像・音声ともにフェードイン(0〜0.5秒)とフェードアウト(28〜30秒)が適用された。


字幕焼き込み(ffmpeg subtitlesフィルター)

ffmpeg -i /tmp/test.mov -vf subtitles=/tmp/test.srt output.mp4

結果: 失敗(環境依存)

ffmpegのsubtitlesフィルターはlibassというライブラリが必要で、Homebrewでインストールした標準のffmpegには含まれていない場合がある。

回避策:

# libass付きでffmpegを再インストール
brew install ffmpeg --with-libass
# または
brew reinstall ffmpeg

字幕をPremiere ProのSRTインポートで対応する場合はこの問題は関係ない。


できること・できないことのまとめ

機能可否ツール・コマンド
文字起こし・SRT生成できるWhisper
ジェットカットできる(チューニング必要)auto-editor
フェードイン/アウトできるffmpeg
字幕焼き込み環境依存ffmpeg + libass
Premiere ProへのSRTインポートできる(手動)Premiere Pro
テロップデザイン細部できない手動
場面別エフェクトできない手動

チューニングのコツ

auto-editorのパラメータは動画の特性によって大きく変わる。

動画の特性marginthreshold
テンポよくしゃべる0.2sec0.04
間が多い・ゆっくり話す0.5sec0.02
対談・複数人0.3sec0.05

必ず --preview で確認してから本番実行すること。