# Knowledge-Voice-Navigator **Repository Path**: zhuaiming/knowledge-voice-navigator ## Basic Information - **Project Name**: Knowledge-Voice-Navigator - **Description**: No description available - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 2 - **Forks**: 0 - **Created**: 2025-03-31 - **Last Updated**: 2025-04-01 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 知识库语音导航系统 (Knowledge Voice Navigator) ![版本](https://img.shields.io/badge/版本-1.0.0-blue) ![Python](https://img.shields.io/badge/Python-3.8%2B-brightgreen) ![更新日期](https://img.shields.io/badge/更新日期-2025--03--31-orange) ![证书](https://img.shields.io/badge/证书-MIT-green) ## 📚 项目简介 知识库语音导航系统是一款用于快速浏览和搜索知识库文件的智能工具。它支持语音控制,能够理解自然语言指令,让用户通过说话就能快速定位文档中的关键信息。无论是学习资料、技术文档,还是各类知识库,这款工具都能大幅提高阅读和检索效率。 ## ✨ 核心功能 - **智能导航**:快速定位文档中的章节和内容 - **语音搜索**:通过语音指令查找关键信息 - **模糊匹配**:支持近似搜索,容错能力强 - **多种搜索引擎**:支持Google、Sphinx和Vosk三种语音识别引擎 - **长对话理解**:处理复杂的多句语音查询 - **Markdown支持**:完整支持Markdown文档的渲染和导航 - **历史记录**:自动记录最近打开的文件 - **个性化标签**:保存常用搜索关键词为标签,一键快速检索 ## 🔧 安装要求 ### 基本要求 - Python 3.8 或更高版本 - Tkinter (通常随Python一起安装) ### 依赖项 ``` pip install -r requirements.txt ``` requirements.txt 文件内容: ``` SpeechRecognition>=3.8.1 PyAudio>=0.2.11 jieba>=0.42.1 nltk>=3.5 vosk>=0.3.32 # 可选,用于离线中文语音识别 ``` ## 🚀 快速开始 1. 克隆或下载本仓库 ```bash git clone https://github.com/username/knowledge-voice-navigator.git cd knowledge-voice-navigator ``` 2. 安装依赖 ```bash pip install -r requirements.txt ``` 3. 运行程序 ```bash python knowledge-voice-navigator_tag-v3.2.2.2.py ``` ## 📖 使用指南 ### 启动程序 程序启动时会显示选项菜单,可以: - 打开上次文件 - 浏览最近文件列表 - 打开新文件 - 查看使用帮助 ### 基本操作 1. **加载知识库文件** - 通过"文件"→"打开知识库"选择Markdown或文本文件 - 或从最近文件列表中选择一个文件 2. **文档导航** - 使用右侧目录树跳转到特定章节 - 直接滚动浏览文档内容 3. **文本搜索** - 在顶部搜索框输入关键词,按Enter或点击"搜索"按钮 - 在左侧面板查看搜索结果,点击可直接跳转到对应位置 4. **语音搜索** - 点击"开始监听"按钮启动语音识别 - 对着麦克风清晰地说出要搜索的关键词 - 系统会自动识别并执行搜索 5. **标签功能** - 搜索后,常用的关键词会被推荐添加为标签 - 点击标签可快速执行对应的搜索 - 可以添加、编辑和删除标签 ### 高级功能 1. **切换语音引擎** - "设置"→"语音识别引擎"菜单下选择不同引擎: - Google (需联网,准确度高) - Sphinx (离线,速度快) - Vosk (离线,中文支持好,需下载模型) 2. **处理长对话** - 点击"处理长对话"按钮可以分析多句组合的语音输入 - 系统会综合理解并执行搜索 3. **模糊匹配设置** - 在"设置"→"搜索设置"中可开启或关闭模糊匹配 - 通过"模糊匹配灵敏度"调整匹配的准确程度 4. **搜索结果过滤和排序** - 使用过滤按钮可按类型、相关度过滤搜索结果 - 使用排序按钮可按相关度、位置或层级排序 5. **调整界面** - 双击分隔条可快速折叠/展开对应面板 - 拖动分隔条调整各面板的大小 - 在"视图"菜单中可调整字体大小 ## 🔍 语音识别引擎说明 ### Google 语音识别 - 准确度最高 - 需要互联网连接 - 支持多种语言,包括中文 - 推荐在网络环境良好时使用 ### Sphinx 离线识别 - 完全离线运行 - 速度较快 - 准确度一般 - 适合简单关键词识别 ### Vosk 离线识别 (可选) - 完全离线运行 - 中文支持较好 - 需要下载额外的语音模型 - 可通过"设置"→"下载Vosk模型"进行设置 ## 🐛 故障排除 ### 语音识别问题 - 确保正确安装了所有依赖项 - 检查麦克风是否正常工作 - 使用"设置"→"诊断语音识别"来诊断问题 - 尝试切换不同的语音识别引擎 ### 文件加载问题 - 确保文件使用UTF-8或GBK编码 - 文件过大可能导致加载缓慢 - 检查文件路径是否包含非ASCII字符 ### 界面显示问题 - 如果界面显示异常,尝试调整窗口大小 - 使用"视图"菜单调整字体大小 ## 🔄 更新日志 ### 版本 1.0.0 (2025-03-31) - 首次发布 - 实现了基本的文本和语音搜索功能 - 支持Markdown和文本文件 - 增加了启动页面和最近文件记录 ## 📝 许可证 本项目采用 MIT 许可证 - 详见 [LICENSE](LICENSE) 文件 ## 👥 贡献 欢迎提交问题和功能请求,或直接提交代码改进。