# opencode-ai-knowledge-base **Repository Path**: hallo128/opencode-ai-knowledge-base ## Basic Information - **Project Name**: opencode-ai-knowledge-base - **Description**: 基于opencode创建AI知识库 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-04-18 - **Last Updated**: 2026-05-04 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # AI Knowledge Base > 自动化 AI 技术动态采集、分析与分发系统 —— 从 GitHub Trending 和 RSS 抓取,经 LLM 分析结构化,存入本地知识库,支持检索与多渠道分发。 ## 架构 ``` ┌─────────────────────┐ │ GitHub Trending │──┐ │ RSS Feeds × 16 │──┤ └─────────────────────┘ │ ┌──────────┐ ┌──────────┐ ┌──────────┐ ├────►│ Collect │───►│ Analyze │───►│ Organize │ │ └──────────┘ └──────────┘ └──────────┘ │ │ │ │ ┌─────────────────────┐ │ raw/ JSON LLM + Cost articles/ │ LangGraph 工作流 │◄─┘ Tracker JSON │ (workflows/) │ └─────────────────────┘ │ ├── Router(patterns/) 关键词匹配 → GitHub Search / 知识库 / LLM 对话 ├── Supervisor(patterns/) Worker → 审核 → 重做循环 └── MCP Server AI 工具搜索本地知识库 ┌─────────────────────┐ ┌──────────────────┐ │ Crontab (本地) │ │ Gitee Actions │ │ 每日 8:00 采集 │ │ 自动采集+推送 │ │ 周日 10:00 分析 │ │ 每日 UTC 8:00 │ └─────────────────────┘ └──────────────────┘ ``` ## 项目结构 ``` ai-knowledge-base/ ├── pipeline/ # 核心采集流水线 │ ├── pipeline.py # CLI 入口: 四步流水线 │ ├── model_client.py # 统一 LLM 客户端 (6 家 Provider) │ ├── rss_sources.yaml # RSS 源配置 (16 个源) │ └── requirements.txt # httpx, python-dotenv, pyyaml │ ├── workflows/ # LangGraph 工作流 │ ├── state.py # KBState 共享状态定义 │ ├── nodes.py # 5 个节点 (collect/analyze/organize/review/save) │ └── graph.py # 图组装 + 条件路由 │ ├── patterns/ # 设计模式 │ ├── router.py # Router: 两层意图分类 + 三种处理器 │ └── supervisor.py # Supervisor: Worker 生成 → 审核 → 重做 │ ├── mcp_knowledge_server.py # MCP JSON-RPC 知识库搜索服务 ├── knowledge/ # 知识库存储 │ ├── raw/ # 原始采集数据 │ └── articles/ # AI 分析后的结构化文章 ├── crontab.txt # 定时任务配置 ├── .gitee/workflows/ # Gitee Actions CI └── AGENTS.md # 编码规范 ``` ## 快速开始 ### 1. 安装依赖 ```bash pip install -r requirements.txt pip install -r pipeline/requirements.txt pip install langgraph # workflows/ 需要 ``` ### 2. 配置环境变量 ```bash cp pipeline/.env.example pipeline/.env # 编辑 pipeline/.env,至少填写一个 Provider 的 API Key # 示例 LLM_PROVIDER=deepseek DEEPSEEK_API_KEY=sk-xxxxx # 可选: GITHUB_TOKEN 提高 API 限流额度 ``` ### 3. 运行采集流水线 ```bash # 仅采集 (免费,不调 LLM) python pipeline/pipeline.py --step 1 --limit 20 # 分析入库 (调用 LLM,消耗 token) python pipeline/pipeline.py --step 3 --provider deepseek # 完整四步 python pipeline/pipeline.py --sources github,rss --limit 20 --provider deepseek ``` ### 4. 使用 Router(意图路由) ```bash python -m patterns.router "搜索 GitHub 上最火的 AI Agent 项目" python -m patterns.router "知识库里有没有关于 RAG 的文章" python -m patterns.router "什么是 Transformer" ``` ### 5. 使用 Supervisor(质量审核) ```bash python patterns/supervisor.py "分析 LangGraph 框架的优缺点和适用场景" ``` ### 6. 运行 LangGraph 工作流 ```bash python workflows/graph.py ``` ### 7. 启动 MCP 知识库搜索 ```bash # 配置到 Claude Desktop / Cursor 的 MCP 设置中 python mcp_knowledge_server.py ``` ### 8. 定时任务 ```bash # 安装 crontab 配置 crontab < crontab.txt ``` ## 支持的大模型 | Provider | 模型 | 格式 | 输入 ¥/1M | 输出 ¥/1M | |----------|------|------|-----------|-----------| | DeepSeek | deepseek-v4-pro | OpenAI | 3.0 | 6.0 | | Qwen | qwen-plus | OpenAI | 0.8 | 2.0 | | GLM | glm-4.5 | OpenAI | 0.8 | 2.0 | | Kimi | kimi-k2 | OpenAI | 4.3 | 18.0 | | MiniMax | MiniMax-M2.7 | Anthropic | 2.1 | 8.4 | | OpenAI | gpt-4o-mini | OpenAI | - | - | > 成本对比详见 [cost_comparison.md](cost_comparison.md) ## 知识条目格式 ```json { "id": "kb_20240419_001", "title": "OpenAI Agents Python", "source_url": "https://github.com/openai/openai-agents-python", "source_type": "github_trending", "summary": "OpenAI 官方 Agent SDK...", "tags": ["Agent", "Python", "OpenAI"], "score": 9, "status": "saved", "priority": "high" } ``` ## 开发 ```bash # Lint ruff check . # 类型检查 mypy pipeline/ patterns/ workflows/ # 测试 python patterns/router.py --test python patterns/supervisor.py --test python workflows/graph.py ```