AI Launcher メニュー
1. 概要
本ドキュメントは、Launcher の AI メニューについて以下を整理したものです。
処理内容
スクリプト一覧
実行フロー
各ボタンの詳細仕様
2. 全体概要
AIメニューは以下を目的とした統合ランチャーです:
PythonスクリプトのGUI実行
AI API(OpenAI / Gemini / DeepL)の統合利用
音声・翻訳・文書処理の一元管理
3. 共通処理パターン
3.1 ファイル選択
get_open_file_name
set input_path=$o
3.2 作業ディレクトリ管理
read_ini
chdir
write_ini
3.3 Python実行
$(start_cmd_c) python script.py
3.4 GUI生成
new_dialog
add_dialog
custom_dialog
4. ボタン詳細仕様
4.1 Translate file (GUI)
スクリプト: translate5_GUI.py
処理内容:
GUIベース翻訳ツール起動
API設定不要
フロー:
ボタン押下
Python GUI起動
ファイル選択
翻訳実行
4.2 Translate file
スクリプト: translate5.py
処理内容:
ファイル翻訳(CLI + GUI設定)
主な設定:
API: openai / gemini / deepl
mode: je / ee
単位: paragraph / md
フロー:
ファイル選択
APIキー読込
設定ダイアログ表示
翻訳実行
出力生成(md/docx/html)
4.3 Transcribe Audio (API)
スクリプト: transcribe_whisper.py
処理内容:
音声→テキスト変換
話者推定
要約生成
出力:
transcript.txt
summary.txt
guessed.json
4.4 Transcribe Audio (local)
スクリプト: transcribe_whisper_local.py
処理内容:
ローカルWhisperで音声認識
API不要
4.5 Media info
スクリプト: media_inf.py
処理内容:
動画/音声のメタ情報表示
4.6 Convert/Split audio
スクリプト:
to_audio.pysplit_audio_with_overlap.py
処理内容:
音声変換
音声分割
4.7 Merge PDF files
処理内容:
PDF結合
4.8 Speak clipboard
処理内容:
クリップボード音声化
4.9 File converter
処理内容:
txt/html/pdf変換
4.10 AI Assistant / ChatGPT / Gemini / Claude
処理内容:
各AIツールの起動
5. スクリプト一覧
AI系
translate5.py
translate5_GUI.py
transcribe_whisper.py
transcribe_whisper_local.py
get_from_ai.py
ユーティリティ
media_inf.py
to_audio.py
split_audio_with_overlap.py
6. 処理フロー
翻訳
ファイル選択 → 設定 → 実行 → 出力
音声認識
音声選択 → 設定 → 実行 → テキスト生成
AI生成
出力指定 → API設定 → 実行 → ファイル出力