众所周知,人工智能算法模型的训练需要大量数据做支持,拥有海量且优质的结构化与非结构化数据成为科技公司能否提升自身实力的重要基础和前提条件。而数据信息智能化是蚂蚁金服的核心能力,对公开信息的获取和挖掘能力是其中重要的组成部分。
由于公开数据中企业信息涉及大量的裁判文书、信息披露等非结构化文本,从中提炼关键信息进行去重、实体抽取、分词、清洗及分析等,这些需要具备nlp深度处理能力。
在面向小微企业的金融服务中,由于传统征信数据的缺失,公开数据成为了金融服务机构和企业控制风险的必要手段。而要把公开数据转化为助力企业发展的商业价值,需要跨越“数据孤岛、结构化程度低和应用认知低”这三个挑战。