您好,欢迎来到爱够旅游网。
搜索
您的当前位置:首页一种处理不平衡大数据的并行随机森林算法[发明专利]

一种处理不平衡大数据的并行随机森林算法[发明专利]

来源:爱够旅游网
专利内容由知识产权出版社提供

专利名称:一种处理不平衡大数据的并行随机森林算法专利类型:发明专利发明人:秦静

申请号:CN201711248656.5申请日:20171201公开号:CN107886135A公开日:20180406

摘要:本发明公开了一种处理不平衡大数据的并行随机森林算法,属于不平衡大数据分类领域。为了解决基于MapReduce机制的并行随机森林算法对不平衡数据分类效率低的问题,本发明提出了融合分层自助抽样和敏感代价思想的并行随机森林方法(SBWMR_RF),首先对每个分块数据集的正类和负类分别进行自助抽样,保证随机性的同时增加正类的信息量,其次动态计算每个分块的代价敏感矩阵,将敏感代价用于基分类器构建的核心步骤。本发明从调整数据分布和调节算法两个方面对不平衡大数据分而治之,弱化了数据偏置的影响,提高了对不平衡大数据的分类准确率,在极不平衡环境下优势明显。

申请人:江苏蓝深远望科技股份有限公司

地址:214125 江苏省无锡市滨湖区雪浪街道楝泽路28号科教软件园B区7号楼

国籍:CN

更多信息请下载全文后查看

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- igbc.cn 版权所有 湘ICP备2023023988号-5

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务