# sona **Repository Path**: jeepb/sona ## Basic Information - **Project Name**: sona - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-04-20 - **Last Updated**: 2026-05-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Sona [English](README.md) | [简体中文](README.zh-CN.md) **Sona** 是一款功能强大的离线转录(字幕)编辑器,由 [Tauri](https://tauri.app)、[React](https://react.dev) 和 [Sherpa-onnx](https://github.com/k2-fsa/sherpa-onnx) 构建。它使用高性能的 Rust 后端,直接在您的本地机器上提供快速、准确且私密的语音转文本能力。 ## ✨ 特性 - **🔒 离线与隐私**:所有语音处理都在您的设备本地进行。没有任何数据会离开您的机器。 - **🎙️ 实时转录**:以低延迟实时录制和转录音频。 - **📁 批量处理**:导入多个音频或视频文件,在后台进行批量转录。 - **🗂️ 工作区组织**:通过 `工作区`、`项目` 与 `Inbox` 整理已保存的录音和导入内容。 - **📝 交互式编辑器**:与音频播放同步的富文本编辑器,支持文本校对、说话人标签和版本快照。 - **👥 说话人档案与校对**:建立本地说话人档案,逐段修正说话人标签,并在导出前集中检查候选或匿名说话人分组。 - **✨ LLM 助手**:使用 OpenAI、Anthropic、Gemini 或 Ollama 对转录文本进行润色、翻译和摘要。 - **🗣️ 实时字幕与语音输入**:复用同一套离线实时转录能力,既可显示悬浮字幕,也可向其他应用直接输入文字。 - **📤 智能导出**:支持多种格式(TXT、SRT、VTT、JSON)和双语字幕的导出。 - **🛟 恢复、备份与诊断**:恢复中断任务、导出包含配置、工作区和文本历史的轻量备份,并在应用内检查模型与运行时健康状态。 - **🔔 通知与自动化**:通过顶部通知中心查看更新、恢复和自动化结果,并在设置中配置文件夹自动化规则。 - **🤖 强大的语音识别模型**:由 **SenseVoice**、**Whisper** 和 **Paraformer** 等最先进的模型驱动。 ## 🚀 快速开始 ### 从 GitHub Releases 下载 安装 Sona 最简单的方法是从 [GitHub Releases](https://github.com/AirSodaz/sona/releases/latest) 页面下载适合您平台的预编译二进制文件。 ### 用户指南 如果您想查看面向终端用户的完整使用说明,请阅读[用户指南](docs/user-guide.zh-CN.md)。其中包含首次设置、`Live Record`、`Batch Import`、`工作区` / `项目` / `Inbox`、转录编辑、说话人校对、版本快照、LLM 功能、`语音输入法`、导出、`仪表盘` / 备份 / 恢复入口,以及常见问题。 ### CLI Sona 现在通过桌面主程序直接提供离线批量转写命令。安装包里的 CLI 子命令由主程序二进制承载,但默认不会帮您写入系统 `PATH`。 安装包内的常见位置: - Windows:在安装目录运行 `Sona.exe transcribe ...` - macOS:运行 `/Applications/Sona.app/Contents/MacOS/Sona transcribe ...` - Linux:从安装位置运行 `Sona` 主程序并附带 CLI 子命令 - AppImage:运行挂载后的 AppImage 可执行文件并附带 CLI 子命令 如果您是从源码构建,也仍然可以直接通过 Cargo 运行 CLI: ```bash cargo run --manifest-path src-tauri/Cargo.toml -- \ transcribe ./sample.mp4 --config ./sona-cli.toml --output ./sample.srt ``` 当前 CLI 范围刻意保持精简: - 单文件离线转写 - 导出到 `json`、`txt`、`srt`、`vtt` - 通过桌面主程序提供,但不会注册到 `PATH` 完整 CLI 说明和最小 TOML 示例请查看 [docs/cli.zh-CN.md](docs/cli.zh-CN.md)。 ### 从源码构建 #### 前置条件 * **Node.js**: v20 或更高版本 (用于构建前端)。 * **Rust**: 稳定版 (用于 Tauri 后端)。 * **包管理器**: 通过 Corepack 使用 `pnpm` (推荐)。 ##### Linux 依赖 如果您使用的是 Linux (Ubuntu/Debian),请确保您已安装必要的系统依赖: ```bash sudo apt-get update sudo apt-get install libwebkit2gtk-4.1-dev \ build-essential \ curl \ wget \ file \ libssl-dev \ libgtk-3-dev \ libayatana-appindicator3-dev \ librsvg2-dev \ libasound2-dev ``` #### 安装步骤 1. **克隆仓库** ```bash git clone https://github.com/AirSodaz/sona.git cd sona ``` 2. **安装依赖** ```bash corepack enable pnpm install ``` 3. **运行应用** ```bash pnpm run tauri dev ``` 4. **运行前端测试** ```bash pnpm test ``` ## 📦 模型管理 Sona 允许您选择最适合您需求的 AI 模型,无论是离线转录还是在线助手。 ### 离线转录 1. 进入 **Settings > Model Settings**(设置 > 模型设置)。 2. 从精心挑选的高性能模型列表中进行选择: * **SenseVoice**:多语言支持和情感识别的最佳选择。 * **Whisper (Tiny)**:OpenAI Whisper 模型的轻量级版本。 * **Paraformer**:专为流式识别优化。 3. 点击 **Download**(下载)。模型将自动保存在本地。 ### LLM 助手(润色、翻译与摘要) 1. 进入 **Settings > LLM Service**(设置 > LLM 服务)。 2. 选择您的服务提供商(OpenAI、Anthropic、Gemini 或 Ollama)。 3. 输入您的 API 密钥和 Base URL(如果适用)。 4. 选择为润色、翻译和摘要生成提供支持的模型。 ## 🏗️ 构建 要构建生产环境用的应用程序: ```bash pnpm run tauri build ``` 可执行文件将生成在 `src-tauri/target/release/bundle` 目录中。