基于知识图谱的“大数据+金融”服务发展分析
于翠
(长春职业技术大学,吉林 长春 130022)
摘要:伴随着大数据、区块链、金融科技的发展,金融服务发展模式得到优化。加之,金融行业在不断发展的过程中积累了大量的数据,这些数据共同构成了金融领域的大数据。在对“大数据+金融”服务发展情况进行分析的过程中,可充分发挥知识图谱的作用,通过构建和应用金融知识图谱深入挖掘金融大数据的价值。
关键词:知识图谱;大数据+金融;服务发展
引言
本文分析了基于知识图谱的“大数据+金融”服务发展模式的构建思路,也从金融风险管理和金融创新等角度提出了基于知识图谱的“大数据+金融”服务发展策略。这些内容的应用和普及可以进一步加深对金融知识图谱和“大数据+金融”服务发展情况的研究,充分发挥知识图谱的价值,强化“大数据+金融”服务发展水平。
一、基于知识图谱的“大数据+金融”服务发展模式构建思路
(一)知识获取
要构建基于知识图谱的“大数据+金融”服务发展模式,需要有充足的数据信息作为支持。技术人员应借助多元化的手段和方法,从不同途径获取相关数据信息,完成对数据信息的知识捕捉[1]。鉴于构建基于知识图谱的“大数据+金融”服务发展模式所需的信息包括结构化数据和非结构化数据,技术人员可从两方面入手开展数据整合工作。一方面,技术人员可利用“天眼查”“企查查”“国家企业信息公示系统”等网站公布的信息构建简单的金融信息知识图谱。另一方面,技术人员可利用技术手段获取企业招股说明书、年报财报、财经新闻等方面的数据信息。技术人员借助网络爬虫、HTML等方式从相应网站获取数据信息之后,可借鉴这些网站规范的结构化数据格式构建金融知识图谱的基本框架。这样做可以提升知识获取的质量及金融知识图谱构建的效率。在此基础上,技术人员也可以利用开源工具获取企业年报财报、招股说明书等信息数据,将这些数据与引擎接口识别的数据进行整合,以确保获得的数据信息更加完整准确。与此同时,技术人员也可以利用 DeepSeek 等人工智能模型深度分析数据信息,抽取和概括图谱实体和关系。技术人员将这些数据进行汇总和修正之后,即可完成对结构化数据和非结构化数据的知识捕捉任务。
(二)知识融合
由于构建基于知识图谱的“大数据+金融”服务发展模式需要大量的金融数据,但是这些金融数据来源广泛,且存在信息冗余、信息错误、信息格式不规范、关系类型冗余等问题,因此需要借助技术手段进行知识融合。
金融知识图谱构建过程中实体对齐是比较重要的一项工作,这项工作的开展质量关系到金融知识图谱的整体构建质量[2]。在这方面,技术人员可以采用基于实体语义的相似度计算方法开展实体对齐工作。具体来说,技术人员可以采用基于字符串的欧氏距离、余弦相似度计算和基于语料库的 Word2Vec 工具等多元化的手段完成这项工作。为有效解决数据知识融合过程中存在的属性信息不规范的问题,技术人员可以采用人工方式统一定义属性值规范,使结构化数据和非结构化数据能够实现信息规则化。例如,技术人员可将“YYYY-MM-DD”数据格式的涉资金属性单位统一设定为“人民币元”。经过设置后金融知识图谱中涉及的关系类型数量更加规范统一,可在很大程度上解决知识融合过程中存在的关系类型冗余问题。如果金融知识图谱中给出的关系类型无法满足知识融合的需求,可采用人工方式重新开展去重和统一工作,以确保不同类型、来源和时效的数据信息能够进行科学融合。
(三)知识加工
金融知识图谱构建工作历经知识获取和知识融合两个环节之后,已经有了充足的金融数据作为支撑。金融知识图谱中汇总的数据信息在“知识加工”环节之前还只属于事实,并不是能够直接用于图谱应用的知识[3]。想要使这些数据直接应用,需要将上述事实转化为知识,只有这样才能确保金融知识图谱可以充分发挥作用。技术人员将数据转换为知识需要历经模式层本体补充、知识推理和质量评估3个环节,每一个环节都需要采用合适的方法。技术人员可以采用自顶向下与自底向上两种方式相结合的手段完成模式层构建任务;采用训练算法模型完成知识推理任务;采用中文金融知识图谱原型系统完成质量评估任务。
(四)知识存储
金融知识图谱经过知识获取、知识融合、知识加工等操作后,已经形成了融合多个实体、关系类型和知识的多元图谱[4]。技术人员在金融知识图谱中整合了持股控股机构间的关系、董监高(即董事、监事、高级管理人员)等机构人物间的关系、经营管理业务间的关系、股东等人物机构间的关系等数据信息。技术人员通过高度整合这些信息能够使金融知识图谱更加全面,通过运用各种官方工具能够有效解决金融知识图谱容易出现的数据重复导入和数据导入冗余等问题。
二、基于知识图谱的“大数据+金融”服务发展策略
(一)基于知识图谱的金融风险管理
为有效解决我国金融风险管理方面存在的数据覆盖不全面、风险监控不实时、未来预期不准确、风险管理文化缺失等问题,技术人员可在大数据背景下广泛整合金融数据,构建金融知识图谱,以便更好地满足金融风险管理的要求。从本质上讲,知识图谱是一种比较科学高效的知识管理工具,具有强大的知识分类、知识搜索和知识可视化呈现的功能。金融行业可以借助知识图谱完成金融工具、商业实体和工作流程的标准化操作、管理、存储和展示等任务。
金融行业利用知识图谱技术开展大数据背景下的金融风险管理工作时,可从以下几方面入手。
1. 拓展基于知识图谱的金融风险管理覆盖面
随着金融行业的发展,各行各业形成了大量的金融数据,这些数据汇总在一起组成了与金融行业相关的大数据信息集群[5]。金融行业可以委派专业人员将结构化数据和非结构化数据整合在一起,构建能够高效存储金融信息的知识图谱大数据平台。金融行业可以利用基于知识图谱的金融大数据平台快速检索相关信息,借助智能搜索和深度挖掘功能为客户绘制精准画像,依据画像提供的信息为其推荐比较合适的金融产品。这样做有助于提升客户管理的效率和质量,也有助于强化金融风险控制的效果。
2. 增强基于知识图谱的金融风险管理透明度
金融知识图谱中通常是用节点表示金融实体,用边表示金融实体之间的关系。金融知识图谱用这种表示方式来构建数据结构,使客户身份信息、金融交易和结算的过程得以清晰呈现出来[6]。从这一点来看,金融行业借助知识图谱技术可以构建“大数据+金融”的风险管理模式,使工作人员可以依托先进的管理模式精准挖掘金融数据之间存在的联系,精准记录金融风险信息。这有助于金融行业有效解决信息不对称的问题,也有助于提高金融风险管理的透明度。
3. 构建基于知识图谱的金融风险管理数据库
当前金融行业受到各方面因素的影响,自身承受的金融风险不断增加。为有效规避和防御金融风险,金融行业应当利用知识图谱技术构建完善成熟的金融风险数据库。金融机构构建基于知识图谱的金融风险管理数据库后,即可更加高效便捷地捕捉金融风险管理信息,完成金融风险动态管理的任务。具体来说,金融行业可将知识图谱技术融入客户信用评级、风险数据监测以及管理行为合规识别等方面。金融行业将知识图谱技术有效应用于金融管理和服务环节中,可以汇总、整合、识别、分析和监测多方面的金融风险管理数据,形成金融风险管理数据库。在此基础上,金融行业可将知识图谱技术应用于风险交易行为监测中,借助逻辑推理功能提升金融风险监测、识别和管理的效率和精准度。
(二)基于知识图谱的金融创新
基于知识图谱的“大数据+金融”服务发展的另一个方向就是金融创新,侧重于业务创新、机构创新、技术创新。
1. 业务创新
金融行业可将互联网融资租赁、融资模式、物联网金融、贷款、信息不对称、金融排斥等方面归类到业务创新中。从“大数据+金融”服务发展历程来看,互联网金融模式是“大数据+金融”的前身。互联网金融模式刚出现时被认为是除商业银行间接融资和资本市场直接融资外的第三种融资模式。这种融资模式具备便捷高效、门槛低的优势,一定程度上对另外两种模式产生了冲击。随着互联网金融模式的完善和发展以及大数据等先进手段的融合,衍生出了物联网金融、消费金融以及电商金融等新的融资模式。
2. 机构创新
金融行业可将银行经营转型、金融机构、金融行业、传统金融机构等方面归类到机构创新中。银行是产生金融数据比较多的场所,也是金融行业变革的关键。我国银行业历经了水泥银行、鼠标银行、移动银行及开放银行4个阶段。基于知识图谱的“大数据+金融”服务发展方面的研究是金融行业在开放银行转型基础上进行的探索和尝试,具有前瞻性。当前,很多专家学者都在致力于研究如何将知识图谱、人工智能、区块链、云计算、大数据和物联网应用背景下的金融服务发展结合在一起。根据专家学者的研究成果可以发现,大中型银行凭借自身优势能够在短时间内更加高效便捷地构建闭环生态或是开放生态环境,而小型银行因为缺乏雄厚的条件支持,适合构建细分领域的开放银行环境。
3. 技术创新
金融行业可将金融创新划归到技术创新领域中。从金融创新的角度来看,金融行业可在大数据、人工智能技术的支持下开展系统自动生成投资组合建议的业务。金融行业利用先进的技术手段和知识图谱,解决了自动投顾业务中存在的监管和风险问题。这既是金融业务的发展和创新,也是现代科技成果的转化成果。未来,金融行业想要在基于知识图谱的“大数据+金融”服务发展方面得到更加深入全面的研究成果,应将研究的侧重点定位在大数据、云计算、人工智能和区块链等技术与金融业务管理和服务发展高效融合的层面上。
三、结语
基于知识图谱的“大数据+金融”服务发展分析研究的热点在于金融风险管理和金融创新两方面。金融行业可将大数据等先进的技术手段与知识图谱技术相结合,针对“大数据+金融”服务发展的要求,构建新的模式。在新模式的支持下,金融行业能够找到金融管理和服务发展的新方向,以便结合自身实际情况系统性规划和部署开放银行转型的策略。对于金融行业来说,基于知识图谱的“大数据+金融”服务发展是改革转型的趋势,也是自身应投入更多时间、精力和资源开展的重点工作项目。
参考文献
[1] 金宝生,郭越,侯守立.金融业融合大模型多模态知识图谱的构建研究[J].中国科技论文在线精品论文,2024,17(4):420-424.[2] 何颖,王俊.基于知识图谱技术进行金融风险管控的思考[J].焦作大学学报,2021,35(4):77-80.
[3] 刘政昊,钱宇星,衣天龙,等.知识关联视角下金融证券知识图谱构建与相关股票发现[J].数据分析与知识发现,2022,6(增刊1):184-201.
[4] 呼雪芳.基于知识图谱的“大数据+金融”研究热点与前沿分析[J].中国集体经济,2021(13):116-117.
[5] 林一松,秦祎,秦浩炜.知识图谱在金融行业的应用研究[J].经济管理文摘,2020(16):15-16.
[6] 凡美慧.面向金融分析的企业知识图谱构建与应用[D].武汉:武汉大学,2019.