YTSummary - YouTube動画を自動要約するmacOSアプリ - AIでアプリ開発

  • 投稿日:
  • カテゴリ:

【CursorエディタとXcodeでアプリ開発】

Diaブラウザでは、AIを使って、表示している動画の中を読み取って要約するという機能があります。とても便利なのですが、有料です。そこで、URLを貼り付けて、同様の機能を実現しようというのが今回のコンセプトです。

screenshot_m222.png

YTSummary - YouTube動画を自動要約するmacOSアプリ

YouTube動画の内容を素早く把握したい時、長い動画を最後まで見る時間がない時はありませんか?YTSummaryは、そんな悩みを解決するmacOSアプリケーションです。YouTube動画のURLを入力するだけで、AIが自動的に動画を文字起こしし、重要なポイントを日本語で要約してくれます。日本語、英語、中国語、韓国語など、あらゆる言語の動画を日本語で要約できるのが最大の特徴です。

主な機能

  • ワンクリック要約 - YouTubeのURLを入力するだけで自動処理
  • 高精度な文字起こし - OpenAI Whisperを使用した高品質な音声認識
  • 日本語要約 - あらゆる言語の動画を日本語で要約
  • AI要約 - Gemini APIを使用した自然な日本語要約
  • 字幕優先 - 利用可能な場合は字幕を優先して処理速度を向上
  • タグ自動削除 - タイムスタンプや効果音タグを自動でクリーンアップ
  • 多言語対応 - 100以上の言語を自動検出して文字起こし

使用方法

  1. アプリケーションを起動
  2. YouTube動画のURLを入力フィールドに貼り付け
  3. 「要約開始」ボタンをクリック
  4. 処理完了まで待機(通常1-3分程度)
  5. 生成された要約を確認

使用技術

  • フレームワーク: SwiftUI (macOS)
  • 動画ダウンロード: yt-dlp
  • 音声認識: OpenAI Whisper
  • 要約生成: Google Gemini API
  • 動画処理: FFmpeg

処理フロー

YTSummaryは以下の手順で動画を処理します:

  1. 動画ダウンロード - yt-dlpを使用してYouTube動画をダウンロード
  2. 字幕取得 - 利用可能な字幕ファイルを優先的に取得
  3. 文字起こし - 字幕がない場合はWhisperで音声を文字起こし
  4. テキストクリーニング - タイムスタンプやタグを自動削除
  5. 言語検出 - 100以上の言語を自動判定
  6. 要約生成 - Gemini APIで重要なポイントを抽出
  7. 翻訳 - 必要に応じて日本語に翻訳

YTSummaryを使って、YouTube動画の内容を効率的に把握し、時間を有効活用しましょう!

リンクソース

  • 記事用リンクソース:
  • Wiki用リンクソース(PukiWiki):
  • Wiki用リンクソース(MediaWiki):
  • SNS投稿用: