庖丁科技赋能资本市场前线监管

2018-11-15 15:30:56 来源: 钱柜娱乐官网 作者: 李钊

本网记者 李钊

近期,庖丁科技中标证券期货业金融科技研究发展中心(深圳)(以下简称“深交所”)——“证券文本信息抽取技术研究”项目,以证券市场文本信息为对象,研究利用自然语言处理技术,从披露公告中抽取指定的文本信息,并且满足具有一定技术性能指标要求的课题。

资本市场上,信息披露作为法规,通常要求信息披露义务人“应当真实、准确、完整、及时地披露信息”。我国上市公司信息披露的内容大体可分为三类:证券发行文件、定期报告和临时报告。

上市公司的公告信息披露必须在指定信息披露网站发布,主要为PDF格式。以深市上市公司为例,2016年全年共披露265985篇公告,2017年共披露291607篇,随着上市公司数量日益增多,这一数字也会逐年增加,不但为深交所的合规检查带来压力,也给投资者带来极大的信息负载。如何将海量公告更有效、更高效地让阅读人“读薄”?其中通过自然语言处理、深度学习等技术将公告信息结构化提取成为关键所在。

正因如此,庖丁科技正在持续而坚定地推进该项工作。他们首先通过卷积神经网络对公告中的段落表格等信息进行分割抽取。为了适应样本数量稀少的问题,他们还提出了一种轻量级的机器学习方法。该方法能够高效地将不同类别公告的关键语句抽取出来,并使之具有在线学习的能力,抽取过程仅需公告制作业务专家对少量公告进行标注,即可达到可用效果。关键语句抽取后,再通过LSTM神经网络进行细粒度提取,从而将公告结构化。目前,庖丁科技对并购重组公告的结构化抽取的工作已取得较为理想的结果,提升了深交所监管工作的效率。这项工作的探索不仅为扩展更多公告类型奠定基础,也为其他类型文本处理带来了宝贵经验。

利用非结构化信息抽取技术,我们能够把隐藏在海量公开公告中企业与企业、企业与个人关系进行深度挖掘,并且透视、洞察企业的价值及风险。作为国内拥有世界领先的金融文本信息抽取技术、有能力利用深度学习和金融知识库进行高精度的结构化信息提取的先进团体,庖丁科技将继续全力服务金融行业,助力金融机构进一步提升服务实体经济的能力。

庖丁科技是一家以人工智能技术为核心的金融科技行业探路者,致力于将国际最前沿的深度学习(Deep Learning)、自然语言处理(Natural Language Processing)、富格式数据(Richly Formatted Data)解析等技术与金融各垂直领域专业知识进行深度融合,帮助传统金融行业打造新一代核心竞争力。庖丁科技专注于做一家人工智能领域的长青企业,从大处着眼,以小处入手,努力成为中国领先的新一代金融数据提供商和新一代智能金融服务商。

加载更多>>
责任编辑: 桂楷东
专题 更多>>
国内 更多>>

5G通信相关人才需求增幅...

返乡又返城,新一年求职热潮也来了。2月19日,BOSS直聘发布2019年春节后首周(2月9日-2月15日)人才市场供需...

无儿无女 他用20载芳华陪...

他正坐在轮椅上,他的夫人佝偻着身子在轮椅后面缓慢得推。阳光从他们身后的窗子里照进来,记者看不清他们的...

国家版权局:多部门联合...

记者18日从国家版权局获悉,春节期间,国家版权局安排多班值守、多线应对,对公众举报的信息进行认真筛选和...

重庆借力航天科技 实施智...

近日,重庆市九龙坡区人大、政协代表到重庆跳蹬河实地考察。在调研过程中,高度赞扬了航天科工智慧产业发展...

安徽阜阳界首高新区:对...

为推进国家高端装备标准化试点建设,提升园区企业标准化工作水平,2月15日,安徽阜阳界首高新区科技人才局、...

科报集萃 更多>>

掌门1对1官宣完成3.5亿美...

2月18日,掌门1对1“无双”年会在上海东方体育中心拉开帷幕,掌门1对1创始人兼CEO张翼在年会上正式宣布,掌...

全国矿业工作者日纪念活...

当前,矿业仍是国民经济的主要支柱产业之一。我国经济的稳增长仍然需要大宗矿产品保障,铁、铜、铝等资源虽...

我国发现2.48亿年前头部...

澳大利亚独有的奇特动物鸭嘴兽,是地球上最原始的哺乳动物之一。有关其产生年代和进化历史,仍有一些待解之...

为了铁路通信顺畅,无论...

2月13日清晨,中国铁路哈尔滨局集团有限公司哈尔滨通信段伊春车间工长付正强带着小徒弟秦瑞迪沿铁道线巡检铁...