- 参与品牌保护项目,该项目主要是对获得XX市标准院认证的食品企业进行信用评价和违法风险预警
- 构建指标体系:从0到1建立食品类企业信用评价指标体系,包括遵纪守法、经营状况、企业关联风险、企业食品风险4个一级指标,25个二级指标,57个三级指标以全面地量化企业信用
- 逻辑回归模型:根据包含20个特征的4万余条食品类违法案件数据,利用jieba分词、正则表达式筛选违法类型,通过pandas库进行数据清洗筛选违法企业,建立基于Logistic回归的违法企业预测模型,采用5折交叉检验进行参数优化,模型最终准确率为88.7%
- 输出数据分析报告:从企业自身、企业类型、关联企业三个角度进行描述性统计分析,输出13份信用风险报告
- 参与预付式企业失信预警项目,该项目主要是对深圳市存在预付款业务的企业(例如健身储值卡、理发储值卡)进行信用评价及失信“跑路”风险预警
- 数据库查询:根据110余万家深圳市企业的投诉举报数据,利用MySQL建立索引、制定取数规则筛选出30余万家存在预付款业务的企业
- 特征工程:通过特征工程确定信用量化因子,结合随机森林、XGBoost建立预付式企业失信概率预测模型,最终模型准确率达92.6%