# 案件识别分类_多标签文本分类 **Repository Path**: qidian_git/falv_anjian ## Basic Information - **Project Name**: 案件识别分类_多标签文本分类 - **Description**: ccf比赛:https://www.datafountain.cn/competitions/540/datasets 多标签的文本分类比赛 - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 5 - **Forks**: 0 - **Created**: 2022-01-06 - **Last Updated**: 2025-03-17 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 案件识别分类_多标签文本分类 #### Description ccf比赛:https://www.datafountain.cn/competitions/540/datasets 多标签的文本分类比赛 使用的是bert_wwm 作为主体框架 然后是 基于案件中的 标签的共现关系构建标签与标签之间的权重分数,然后基于所有的标签构图,进行游走, 使用word2vec进行节点的向量化。 在训练的时候是 案件的文本与最终标签向量的均值做最小loss 测试的时候得到一个相似性分析的相近值。 在预测的时候根据这个相近值进行筛选标签