AI Launcher メニュー

1. 概要

本ドキュメントは、Launcher の AI メニューについて以下を整理したものです。

  • 処理内容

  • スクリプト一覧

  • 実行フロー

  • 各ボタンの詳細仕様


2. 全体概要

AIメニューは以下を目的とした統合ランチャーです:

  • PythonスクリプトのGUI実行

  • AI API(OpenAI / Gemini / DeepL)の統合利用

  • 音声・翻訳・文書処理の一元管理


3. 共通処理パターン

3.1 ファイル選択

get_open_file_name
set input_path=$o

3.2 作業ディレクトリ管理

read_ini
chdir
write_ini

3.3 Python実行

$(start_cmd_c) python script.py

3.4 GUI生成

new_dialog
add_dialog
custom_dialog

4. ボタン詳細仕様

4.1 Translate file (GUI)

スクリプト: translate5_GUI.py

処理内容:

  • GUIベース翻訳ツール起動

  • API設定不要

フロー:

  1. ボタン押下

  2. Python GUI起動

  3. ファイル選択

  4. 翻訳実行


4.2 Translate file

スクリプト: translate5.py

処理内容:

  • ファイル翻訳(CLI + GUI設定)

主な設定:

  • API: openai / gemini / deepl

  • mode: je / ee

  • 単位: paragraph / md

フロー:

  1. ファイル選択

  2. APIキー読込

  3. 設定ダイアログ表示

  4. 翻訳実行

  5. 出力生成(md/docx/html)


4.3 Transcribe Audio (API)

スクリプト: transcribe_whisper.py

処理内容:

  • 音声→テキスト変換

  • 話者推定

  • 要約生成

出力:

  • transcript.txt

  • summary.txt

  • guessed.json


4.4 Transcribe Audio (local)

スクリプト: transcribe_whisper_local.py

処理内容:

  • ローカルWhisperで音声認識

  • API不要


4.5 Media info

スクリプト: media_inf.py

処理内容:

  • 動画/音声のメタ情報表示


4.6 Convert/Split audio

スクリプト:

  • to_audio.py

  • split_audio_with_overlap.py

処理内容:

  • 音声変換

  • 音声分割


4.7 Merge PDF files

処理内容:

  • PDF結合


4.8 Speak clipboard

処理内容:

  • クリップボード音声化


4.9 File converter

処理内容:

  • txt/html/pdf変換


4.10 AI Assistant / ChatGPT / Gemini / Claude

処理内容:

  • 各AIツールの起動


5. スクリプト一覧

AI系

  • translate5.py

  • translate5_GUI.py

  • transcribe_whisper.py

  • transcribe_whisper_local.py

  • get_from_ai.py

ユーティリティ

  • media_inf.py

  • to_audio.py

  • split_audio_with_overlap.py


6. 処理フロー

翻訳

ファイル選択 → 設定 → 実行 → 出力

音声認識

音声選択 → 設定 → 実行 → テキスト生成

AI生成

出力指定 → API設定 → 実行 → ファイル出力