• 一种基于广义最大流的纳税企业信用评估方法

    • 摘要:

      本发明公开了一种基于广义最大流的纳税信用评估方法.首先,通过纳税企业间的显式社会关系发现和隐式社会关系挖掘构建纳税人全局网络(Taxpayer Global Network,TGN),并对纳税企业间关系边的权重进行表征;其次,将纳税信用的影响传递过程与网络流中的最大流问题类比建模,用广义最大流建模影响路径的选择,用衰减函数建模随路径增长影响的减弱,得到企业的关联评价;最后,综合考虑纳税企业自身及其与关联企业间的交互关系,采用归一化融合方法,将纳税人个体评价和关联评价融合得到综合的纳税信用评估结果.

    • 专利类型:

      发明专利

    • 申请/专利号:

      CN201910507040.8

    • 申请日期:

      2019.06.12

    • 公开/公告号:

      CN110378559A

    • 公开/公告日:

      2019-10-25

    • 发明人:

      郑庆华 张发 阮建飞 董博 王伊杨 高宇达

    • 申请人:

      西安交通大学

    • 主分类号:

      G06Q10/06(2012.01),G,G06,G06Q,G06Q10

    • 分类号:

      G06Q10/06(2012.01),G06Q40/00(2012.01),G06F16/2458(2019.01),G,G06,G06Q,G06F,G06Q10,G06Q40,G06F16,G06Q10/06,G06Q40/00,G06F16/2458

    • 主权项:

      1.一种基于广义最大流的纳税企业信用评估方法,其特征在于,首先,对纳税人显式的历史涉税信息、纳税人社会关系进行网络表征,同时通过构建的网络挖掘纳税人间的隐式社会关系,完善关联企业间交互关系建模,通过纳税企业间的显式社会关系发现和隐式社会关系挖掘构建纳税人全局网络,并对纳税企业间关系边的权重进行表征;其次,将纳税信用的影响传递过程与网络流中的最大流问题类比建模,用广义最大流建模影响路径的选择,用衰减函数建模随路径增长影响的减弱,得到企业的关联评价;最后,综合考虑纳税企业自身及其与关联企业间的交互关系,采用归一化融合方法,将纳税人个体评价和关联评价融合得到综合的纳税信用评估结果. 2.根据权利要求1所述的一种基于广义最大流的纳税企业信用评估方法,其特征在于,具体包括以下实现步骤: 1)社会关系的发现 (1)显式社会关系的发现 基于有向图理论,将数据中涉及的自然人与纳税企业表示为显式社会网络中的节点,将数据中涉及的投资关系、股东关系、法定代表人关系和交易关系四种关系表示为显式社会网络中的边将得到的纳税人显式社会网络表示为: TESN=(V,E,VAttr,EAttr) 其中V={vi|i=1,2,...,N}表示节点集合,V=P∪C,P代表自然人集合,C为纳税企业集合;E={eij|i,j=1,...,N}表示在TESN中存在的边,eij=(vi,vj)代表第i节点到第j节点存在一条边;VAttr包括节点类别VCatg和VInd,VCatg表示节点属于自然人或纳税企业;VInd=(Name,ComplianceScore),Name是纳税企业的企业名或自然人的名称,ComplianceScore为初始纳税信用评分;EAttr包括节点类别ECatg和边权重W;ECatg∈{IR,SR,LR,TR},IR表示投资关系,SR表示股东关系,LR表示法定代表人关系,TR表示交易关系;最后通过双向关联利益挖掘,得到包含纳税企业与自然人的异构纳税人显式社会网络; (2)隐式社会关系的挖掘 在纳税人显式社会网络的基础上,挖掘纳税企业间隐蔽的关联关系,用于为董事互锁关系的引入;定义控制关系链T,满足: T={(p,c1,c2,...,cn,c)|p∈P;c1,c2,...,cn,c∈C;(p,c1),(c1,c2),...,(cn,c)∈E} 控制关系链T表示以自然人开始以纳税企业结束的控制关系链,不包括交易关系;其中p表示起始点,c表示终止点;P表示所有自然人,C为纳税企业,E自然人到纳税企业或纳税企业到纳税企业的边集合,(p,c)表示纳税人到企业的边;最后形成自然人-纳税企业二分图PCBN=(P,C,E);P和C为PCBN的自然人和纳税企业两部分点集合;E自然人到纳税企业的边集合;约简后使用N(c)={p|p∈P,(p,c)∈Ec}作为纳税企业的控制人集合; 最后把PCBN转化为纳税企业非二分图PCBNC={C,Ec},其中: 表示当任意两家纳税企业之间的控制人集合之间有交集,那么为这两家企业添加双向董事互锁关系,将TESN转变成纳税人全局网络,表示为: TGN=(C,Ec,VAttr,EAttrc) 其中,Ec表示新的边集;EAttrc包括节点类别ECatg和边权重W;ECatg∈{IR,SR,TR,CR},IR表示投资关系,SR表示股东关系,TR表示交易关系,CR表示董事互锁关系,最终得到仅含纳税企业的同构纳税人全局网络; 2)关系边权重表征 (1)计算关系边的正向影响值与反向影响值 由于交互发生在纳税企业之间,且影响程度应分别考虑纳税企业之间的影响与最终纳税所占总纳税的占比,因此定义投资方i对被投资方j的影响为正向影响,定义被投资方j对投资方i影响为反向影响,具体则由公式: 其中TRij表示交易比例,irij表示投资方i对被投资方j的金额,表示投资方i对所有被投资方金额;剩下的投资关系、股东关系、董事互锁关系IR,SR,CR同理; (2)多源边关系的融合 为了综合利用上述的四种关系,采用Dempster-Shafer证据理论来解决多值映射问题,故对于纳税信用情况能够传递这种类型上的4个m函数,分别为投资关系,股东关系,交易关系和董事互锁关系的权重比值,进行归一化常数: 其中mi(Ai)表示对该条边关系证据的信任程度,四种关系合成规则表示为: 最终将四维的边权重属性转化为了一维概率属性,表示关系边的源点纳税企业能以该概率影响终点纳税企业; 3)基于广义最大流传递影响计算纳税企业的关联评价 Step1:网络衰减的表征 为表征路径的增长,纳税信用影响的衰减,引入了衰减函数loss(x)来模拟每经过一个中间节点v∈V\{src,dst}时,流按照该比例进行衰减,其中x为当前中间节点到源节点的距离;考虑到计算代价及随着传递路径的增长,关联企业对纳税企业的纳税信用影响会逐渐减弱,甚至到0,选择与纳税企业关联程度较强的企业来传递其纳税信用影响,即按各纳税企业为中心,抽取与它关联的路径长度3步以内的所有关联企业节点及边关系形成纳税人最大流子图(Taxpayer Maximum FlowSubgraph,TMFS),其形式化为: TMFS=(Vid,MFGraph) MaximumFlowGraph=(MFVertex,MFEdge) 其中Vid为纳税企业唯一编号,MFGraph为该纳税企业的纳税人最大流子图;MFVertex表征该纳税企业最大流子图中包含的节点,其格式为(Vid,ComplianceScore,Distance,Capacity),Distance为该节点距离源节点的距离,Capacity为经过该节点能够产出的流量大小;MFEdge为该纳税企业最大流子图所包含的边,其格式为(SrcMFVertes,DstMFVertex,weight),SrcMFVertex为源纳税企业,DstMFVertex为最终纳税企业,weight为经过D-S证据融合方式得到的融合权重,即该边的最大容量限制; 为平衡信息缺失和重复利用信息,借鉴最大流Edmonds-Karp算法的思想,按照广度优先搜索方法来不断寻找最短路径作为可增广路径;为了合理的模拟传播过程中的信息衰减,按照衰减比例引入统一衰减和非统一衰减函数; 统一衰减:即衰减比例不随x变化 leak1(x)=0.2 非统一衰减:衰减比例随着x变化 leak2(x)=1-cos(0.09x) leak3(x)=e-x leak4(x)=(x+1)-4 Step2:路径的选择 先获取增广路径的流flow,设源点纳税企业的初始纳税信用评分为(src.ComplianceScore)为源点可以向外发送的总流量(fs),即源点的容量大小,对于选择出来的最短路径上的每一条边,都应该满足条件flow<fs,同时每当经过中间节点时,流量均有损失,损失比例由损失函数loss进行表征,记录使用过的路径及路径上各边所所用的流量,直到流向终点纳税企业; 由于信息传递过程中存在噪声信息,因此在经过中间节点时候,引入噪声拟合方法,对于信息流要传入的下一个节点,记录该节点传入边的剩余流量通路flowothers;同时对传递边的剩余容量进行记录c(i,j)-usedflow,最后对统一衰减函数进行更新,leak1(x)=0.2*(∑flowothers+c(i,j)-usedflow)),得到下一个要传递节点的新的统一衰减函数,当计算出来的新的衰减函数值小于0.2时,则保持当前衰减函数leak1(x)=0.2,进行信息的正常传递; Step3:修正残余网络 对于得到的增广路径中从源点src到终点dst的每条边,修正正向边的容量为c(i,j)-usedflow,并添加反向边e(j,i,usedflow),同时修正fs=fs-(src,j).usedflow,其中usedflow为使用的流量(src,j)表示从源到节点j的路径;迭代地获取增广路径、修正残余网络,对传递到dst的流量求和,得到该关联纳税企业对所关注纳税企业的最大影响程度; 纳税信用评估 首先定义归一化融合关联企业对纳税企业自身的纳税信用比例公式Inij: Inij=flowij/C(vi) Inij表示最大影响值的比例,i为纳税企业j的纳税人最大流子图中的除自身以外的所有关联企业节点,flowij由步骤3)求出,表示企业i对企业j可传递影响的最大值;C(vi)为纳税企业i的初始纳税信用评分;接着,定义其他企业对下游企业正面评分Es: Es=β·C(vj) β是指所关注纳税企业与关联企业的分配百分比,C(vi)为纳税企业i的初始纳税信用评分,然后计算其他企业对纳税企业的负影响评分Eo; 其中1-C(vi)表示关联企业对纳税企业的信用评分,表示纳税企业对关联企业的综合权重占比评分,最后,计算融合后的评分E(vj),表示节点j的最终评估: E(vj)=Es+Eo β是指所关注纳税企业与关联企业的分配百分比,取值范围是β∈{0.1,0.3,0.5,0.7,0.9}. 3.根据权利要求2所述的一种基于广义最大流的纳税企业信用评估方法,其特征在于,取阈值0.6,当E(vj)≤0.6表示该企业纳税信用正常,当E(vj)>0.6时,表示该企业纳税信用异常.