AI Launcher メニュー

1. 概要

本ドキュメントは、Launcher の AI メニューについて以下を整理したものです。

処理内容
スクリプト一覧
実行フロー
各ボタンの詳細仕様

2. 全体概要

AIメニューは以下を目的とした統合ランチャーです：

PythonスクリプトのGUI実行
AI API（OpenAI / Gemini / DeepL）の統合利用
音声・翻訳・文書処理の一元管理

3. 共通処理パターン

3.1 ファイル選択

get_open_file_name
set input_path=$o

3.2 作業ディレクトリ管理

read_ini
chdir
write_ini

3.3 Python実行

$(start_cmd_c) python script.py

3.4 GUI生成

new_dialog
add_dialog
custom_dialog

4. ボタン詳細仕様

4.1 Translate file (GUI)

スクリプト: translate5_GUI.py

処理内容:

GUIベース翻訳ツール起動
API設定不要

フロー:

ボタン押下
Python GUI起動
ファイル選択
翻訳実行

4.2 Translate file

スクリプト: translate5.py

処理内容:

ファイル翻訳（CLI + GUI設定）

主な設定:

API: openai / gemini / deepl
mode: je / ee
単位: paragraph / md

フロー:

ファイル選択
APIキー読込
設定ダイアログ表示
翻訳実行
出力生成（md/docx/html）

4.3 Transcribe Audio (API)

スクリプト: transcribe_whisper.py

処理内容:

音声→テキスト変換
話者推定
要約生成

出力:

transcript.txt
summary.txt
guessed.json

4.4 Transcribe Audio (local)

スクリプト: transcribe_whisper_local.py

処理内容:

ローカルWhisperで音声認識
API不要

4.5 Media info

スクリプト: media_inf.py

処理内容:

動画/音声のメタ情報表示

4.6 Convert/Split audio

スクリプト:

to_audio.py
split_audio_with_overlap.py

処理内容:

音声変換
音声分割

4.7 Merge PDF files

処理内容:

PDF結合

4.8 Speak clipboard

処理内容:

クリップボード音声化

4.9 File converter

処理内容:

txt/html/pdf変換

4.10 AI Assistant / ChatGPT / Gemini / Claude

処理内容:

各AIツールの起動

5. スクリプト一覧

AI系

translate5.py
translate5_GUI.py
transcribe_whisper.py
transcribe_whisper_local.py
get_from_ai.py

ユーティリティ

media_inf.py
to_audio.py
split_audio_with_overlap.py

6. 処理フロー

翻訳

ファイル選択 → 設定 → 実行 → 出力

音声認識

音声選択 → 設定 → 実行 → テキスト生成

AI生成

出力指定 → API設定 → 実行 → ファイル出力