• 一种基于层次聚类的可疑纳税人检测方法

    • 摘要:

      本发明公开了一种基于层次聚类的可疑纳税人检测方法,包括以下步骤:1)利用层次聚类算法根据纳税人之间的利益关系进行聚类,根据纳税人之间的关联关系程度将其分割成簇,每个簇形成利益关联社团;2)通过分析标注的纳税人样本数据,根据度分布、聚集系数等复杂网络指标提炼正常与异常纳税人的差异特征;3)计算识别出的利益关联社团和正常与异常纳税人特征计算相似度,进而检测可疑的纳税人.

    • 专利类型:

      发明专利

    • 申请/专利号:

      CN201410328004.2

    • 申请日期:

      2014.07.10

    • 公开/公告号:

      CN104102706A

    • 公开/公告日:

      2014-10-15

    • 发明人:

      郑庆华 李博 杜友田

    • 申请人:

      西安交通大学

    • 主分类号:

      G06F17/30(2006.01)I,G,G06,G06F,G06F17

    • 分类号:

      G06F17/30(2006.01)I,G06Q40/00(2012.01)I,G,G06,G06F,G06Q,G06F17,G06Q40,G06F17/30,G06Q40/00

    • 主权项:

      一种基于层次聚类的可疑纳税人检测方法,其特征在于,包括以下步骤:1)获取纳税人利益网络,并从纳税人利益网络中提取出各节点对应的纳税人以及任意两个纳税人之间的利益关联程度,再采用层次聚类算法对纳税人以及任意两个纳税人之间的利益关联程度进行层次聚类,形成二叉树,然后根据纳税人和任意两个纳税人之间的利益关联程度对所述二叉树进行分割,得若干簇,其中,每次层次聚类得到的簇均记作利益关联社团;2)从步骤1)中得到的利益关联社团中选取正常纳税人利益社团和异常纳税人利益社团,然后提取正常纳税人利益社团的特征信息及异常纳税人利益社团的特征信息,然后构建正常纳税人利益社团的特征库及异常纳税人利益社团的特征库;3)预处理的利益关联社团包括若干纳税人利益社团,分别获取各预处理的纳税人利益社团的特征信息,然后将各预处理的纳税人利益社团的特征信息分别与正常纳税人利益社团的特征库及异常纳税人利益社团的特征库进行相似度计算,分别计算出各预处理的纳税人利益社团属于正常纳税人利益社团的概率及属于异常纳税人利益社团的概率,当预处理的纳税人利益社团属于异常纳税人利益社团的概率大于或等于异常预设阈值时或者当该预处理的纳税人利益社团属于正常纳税人利益社团的概率小于正常预设阈值时,则该预处理的纳税人利益社团中存在可疑纳税人;4)通过步骤3)得到的各正常纳税人利益社团的特征信息及各异常纳税人利益社团的特征信息构建新的正常纳税人利益社团的特征库及异常纳税人利益社团的特征库,然后再根据新的正常纳税人利益社团的特征库及异常纳税人利益社团的特征库判断下一个预处理的利益关联社团中的各纳税人利益社团是否存在可疑纳税人.