当前位置 > 凤凰彩票网 > 招聘信息 > 2019年金融大数据应用的趋势,机遇和挑战

2019年金融大数据应用的趋势,机遇和挑战

时间:2019-02-27 08:30:48 来源:凤凰彩票网 作者:匿名



图片来自“欧洲网络”

从精准营销,智能客户服务,差异化定价到智能风险控制,智能索赔,智能收集,金融大数据,云计算,人工智能和区块链技术正在从数据,智能和产品转向金融。领域和业务链中各种环节的渗透极大地提高了金融机构的运作效率,金融服务也出现了越来越多的平台和智能标志。

金融业面临新的挑战和机遇。如何把握金融技术的发展趋势,有机地整合新技术和金融服务,增强综合实力和技术创新能力已成为金融机构面临的重要问题。

11月30日,由Yiou Finance主办的“2018E欧洲创新者年会——金融技术创新论坛”邀请了银行,消费金融公司,供应链金融服务公司,产业资本,智能风险控制和金融大数据。创新的金融技术公司将讨论监管技术,开放银行,情景融资,大数据风险控制和知识绘图等热门话题。

受邀参加此次峰会的嘉宾有:民生银行信息技术部总建筑师李晓东,盛京嘉诚产业互联网基金管理合伙人赵金喜,辉腾科技金融执行总裁杨江,江宁首席技术官消费金融,马宁,首席创始合伙人魏晋,创始人兼首席执行官魏进,王正明,副总裁,Bairong Jinfu,中国翻译语言技术有限公司董事长于忠义,高强,高鑫,合伙人兼副总裁余华资本,副总裁郑波,公司副总裁姚宇宇,智库研究院院长,Io公司合伙人,财经频道刘欢主编,姚智助理博士

本次金融技术圆桌论坛的主题是:2019年金融大数据应用的趋势,机遇和挑战。

参加本次圆桌论坛的嘉宾有:中国翻译语言技术有限公司CEO杨瑜;高强,余新合伙人兼副总裁;华创资本副总裁于振波出席并参与讨论。 Yiou的合伙人,财经频道编辑刘欢是圆桌论坛的主持人。

以下是圆桌论坛的简写:Ring Partner,财经频道编辑刘欢

刘欢(主持人):下次我将为大家举办圆桌论坛。在参与讨论之前,我们将回顾今天主题的背景。下午,九位发言人将从宏观背景,投资环境和具体业务谈论金融技术在行业中的具体应用。如果我们看一下底线,我们会发现所有的基础最终都是在金融大数据之上实现的。金融大数据是整个金融业的基础设施。在形象方面,金融大数据就像为整个“金融业建筑”建立“砖瓦”。根据过去的经验,大多数人认为财务数据是基于金融系统中的数据。金融系统的数据完整性,权威性甚至准确性都做得很好。另一方面,随着形势变得更加多样化,非金融数据对金融业的影响正在增加。刘欢(主持人):在讨论这个问题之前,先请客人向听众问好,并简要描述他们正在做的具体工作。

余毅,中国翻译技术有限公司CEO

于洋:大家下午好,我是从中国人到普通话的余阳。中文翻译始于2013年,主要关注大数据,人工智能和语言技术。金融是一个新领域,但在新领域,我们有自己独特的理解。

高强:大家下午好,我是一家高科技公司。我们是一家成立于2015年的金融科技公司。我们致力于通过人工智能和大数据技术,通过数据驱动方法帮助金融机构更好地服务于大数据时代的广大客户。 。我们希望通过AI的技术,我们可以更好地深入挖掘数据,让银行和其他组织更好地使用数据,更好,更灵活地为客户服务。我们提供完整的服务计划。最新的AI决策引擎“Non-Flat”发布了。谢谢你们!

于振波:大家下午好!华创资本是一家专注于早期高增长企业投资的风险投资公司。金融技术对我们来说是一个非常重要的方向。我们已经投资了30多家金融科技公司,其中包括市场上的一些知名公司。

刘欢(主持人):感谢三位嘉宾的介绍。 2018年,我们可以清楚地看到金融业的变化更加开放,金融业正在逐步突破垄断市场。在未来,它肯定会受到更多以市场为导向的运营的支配。金融开放肯定会成为金融业的主旋律。过去,金融大数据已经提到了很多,但从实证的角度来看,金融大数据的外部数据将更加广泛。它包括财务数据和非财务数据。邀请了三位嘉宾谈谈他们对非财务数据的理解。并具体思考。于洋:谈到非财务数据,人们更愿意在几年前将其转换为替代数据。替代数据在金融行业中也被称为替代数据/情景数据,但它现在更加标准化并被定义为“替代数据”。

代理数据与我们使用的基本数据相关,例如税收信息,例如从太空中的每个人获得的停车位的一些图像数据,其可能不用于传统数据的金融领域。从某种意义上说,我们通常说大数据称为结构化数据,科学数据,而收集的替代数据恰好是非结构化数据的90%。在所有大数据中,10%是结构化数据,例如来自银行的结构化数据。结构化数据在质量方面相对较小。非结构化数据是不规则的,例如图像,语音等。

但是今天,这些替代数据可能会爆炸很多。例如,在我们的第一次预测中,上海股指在8月左右波动,成为第一个算法。在20天的预测中,基本上我们的预测是准确的。的。每天上涨和下跌的上证指数的具体数量可控制在1%以内。除了基本数据之外,我们使用的算法对于包含情感数据更为重要。市场情绪非常重要,这些从未被包括在量化和对冲中,并且可能非常激烈。

例如,中国从伊朗购买原油并以人民币结算。但对于原油价格的预测,我们只使用供需两端的数据做出一些预测。但这笔交易本身,APEC会议后的市场反应是什么?中国市场的反应是什么?美国和俄罗斯之间的反应是什么?这些数据之前是阿拉伯语,英语等。对我们来说,第一语言是一个门槛。语言是0和1之间的关系用于计算,相同的自然语言处理,没有转换,一切都是0.在市场中,来自机构,公众分析和舆论的反馈是不同的。同样,每个人的情绪表达都是积极的,非常积极的,消极的,非常消极的。这些可能会对市场产生不同的影响。这些替代数据可以应用于财务水平,无论是系统性风险还是大趋势风险判断,都可以包含在替代数据中。另一方面,指数,期货和商品交易等指数的替代数据也将产生巨大影响。替代数据仅在美国讨论了两年。我相信仍有很多方法可以从理论到深度应用。这是我对替代数据的理解。谢谢。

高欣,合伙人兼副总裁

高强:我想在实践中和你分享一些感受。于欣一直强调数据挖掘的整合。于欣一直说它是人工智能的大数据。是什么让你这么说?让我们再说一遍,每项技术创新的作用是什么?人工智能技术革命的作用是什么?然后我们想要一种新技术,它实际上扩展了我们用于这些资源开发的人力资源。所以这次我们谈论人工智能和大数据,我们认为人工智能实际上是一种扩展我们挖掘业务资源能力的工具。该资源是数据。然后,当我们真正参与金融机构的数据战争时,我们真的觉得,随着新的技术突破,我们将扩大我们使用现有资源的能力,特别是在过去几年。这是付款的变化,其中之一是消费金融的变化。几年前,我们经常使用现金,今天我们很少使用现金。现在我们将在现场,这与解释我们新兴的非结构化和传统数据的人工智能技术密不可分。如果新技术没有这样的突破,我们的许多借款选择或借款要求都无法按照传统的银行控制和记分卡传递。这是第一点。

其次,我们刚刚提到大多数数据现在都是非结构化的,例如文本,例如一些图像数据,语音数据。刚才专家提到我们在证券领域有一些“情绪数据”。例如,当我们在医院时,我们可能会以传统方式审查我们的实验室报告和一些标准指标。慢慢地,通过我们的技术发展,我们可以观看CT胶片和越来越精细的扫描胶片。所以现在,在我们的一些实际工作中,我们开始使用深度学习技术将一些数据转换为图像格式来分析图像。这些新功能的出现实际上是由于当今AI技术的发展。在新的数据时代,人工智能和数据的结合,当然还有云计算算法,将产生巨大的能量。我认为这只是一个开始。华创资本副总裁于振波

于振波:首先回答主持人的提问。华创对所谓金融大数据和非金融大数据的看法:总的来说,华创并没有严格划清界限,明确区分金融大数据和非金融大数据。从华创看,金融大数据与非金融大数据之间没有明确的界限。

从投资角度看非财务数据,有几点需要注意:

首先,数据的来源,数据的产品是否可以扩展和标准化。这是一个条件,取决于这些数据可以发展成一个标准化的产品,可以增加一些有趣的公司。

其次,数据是否真的具有强大的解释力和良好的业务应用。例如,预测估值的波动,例如20天到200天,在市场异常中并不十分准确。这实际上很难判断。第三点是是否有客户实际支付账单。对于创业公司来说,这是最重要的事情,你的想法,以及你的意见是否得到他人的认可。我们实际上投资了一家名为百官科技的二级市场投资的所谓创业公司。

事实上,百官科技是传统的二级市场目标。它不使用数据或难以在二级市场获得数据。基本市场分析,利用互联网,大数据采集,使用自己的模型,制作产品,销售产品。投资者在二级市场。实际上,您可以看到从生成数据到中间到结尾的解释。没有人支付账单来形成一个完整的闭环,所以我们觉得如果你想创业,你可以分析我刚才提到的三个方面。

刘欢(主持人):只有少数嘉宾谈到整合数据和收集数据。在集成和收集过程中,我们会发现数据是多样的:社交数据,电子商务数据,交易数据,物流跟踪数据等。在这些各种数据中,什么样的数据是通过商业价值来衡量的?您认为?商业价值是否更有价值或可开发和可挖掘?于洋:一方面,我们要看数据的规模,但规模并不那么简单。

另一方面,您必须查看产品的属性和应用程序。客户的需求是什么,然后相应地调整数据类型。作为量化指标,它不应该是单一类别。今天我谈到了所谓的替代数据,事实上,它正在寻找不同类型数据之间的关系。

如今,中文翻译语言已经为美国许多知名公司提供了大数据服务。今天的数据不再是负面新闻。它必须是负面新闻有多大,它有多大,以及它与其他因素的关系。它不再是评估数据价值的单一主题。

高强:主持人的问题实际上与数据有关。其价值与其应用场景密切相关。因此,如果我们使用投资领域,不同策略使用的数据是不同的,价值肯定会反映出来。不同。例如,做一些期货投资可能与期货市场或某些基本面的某些实际市场变化有关。

我想要更多关于银行风险控制的数据。对于信用风险控制,最常用的传统人是信用数据,这是信用局长期积累的数据。近年来,数据扩展了一些维度并使用了其他行为数据,例如通信行为,例如电子商务消费的行为,包括当前正在使用的一些日常移动应用程序的行为。换句话说,当我们最终评估资产或评估个人时,这些数据形成的不同变量对我们来说是不同的。例如,一些变量可以看到长期变化并推动长期变化。有些是短期变化。为什么这封信总是关于数据集成?我们为银行做的是整合各种数据。对于我们不同的理财产品,不同的贷款条款,如短期,一个月或多长时间。从长远来看使用的数据是不同的,重点是不同的。所以这实际上与我们的应用场景非常相关。于振波:从投资角度判断数据价值有一些重要的方向和标准:

首先,我们认为最有价值和最有效的数据,如上市公司的财务数据,当然是非常有效的数据。

其次,它与现有的有效数据有很强的因果关系。例如,成熟电子商务网站中的紫外线量是通过其GMA进行的非常强大的因子分析。我们认为这将是一个比较。重要数据。

第三个可能无法达成强关系,但存在一定的相关性。相关性的解释不像因果关系的逻辑。在许多情况下,您需要具有创造力,或者您自己的新想法,创业机会。可能高于这一层数据。从商业价值的角度来看,这与您以前的产品的外观有关。如果您的产品更加标准化或高度解释,付费客户就是富裕的客户,例如对冲基金。银行,这件事本身的价值可能更大。

刘欢(主持人):我问俞宗。我刚从客户的角度出发,从使用领域的角度,从产品的角度,谈论大数据的风险控制,然后从风险控制的角度,应用了什么是新的大数据流程生产和流通?它会面临风险和新挑战吗?

于振波:刚才提到的对风险控制和投资熟悉的挑战有两个最重要的挑战:

您必须首先找到数据的目的或解释它的能力,这实际上是一个核心挑战。数据收集,分类,清洁和产品化不是创造性问题。最重要的是找出数据本身的目的,或者他的解释力在哪里?

第二是商业化的挑战。事实上,如何从创业的角度讲述客户是最重要的,也就是说,你必须让客户付出代价。

高强:对于替代数据,其独特之处在于其高维度。现在每个人都在讨论机器学习模型的使用,或者其他学习模型的维度越来越高。高维度是这个模型的解释越来越少,另一个是它具有更好的功能。很多时候我们会关注它。它。这个配件非常好。这时,每个人都容易出现幻觉。就像去年的现金贷款或消费金融一样。当时,很多人都认为每日贷款额达到数万亿美元。然后,在我用完这个模型后,我已经通过了大量的样本。检测,效果非常好,这个时候大家都觉得这个型号非常好,我想我发现了Alpha。事实上,我们都知道该模型实际上是一种归纳。特别是对于开放系统,开放系统始终是样品。该模型具有其背景逻辑和背景逻辑变化。目前情况并非如此。在这个时候,存在着非常大的破坏性风险。此时,这一逻辑尚未建立。监管面前有一些迹象。当您进行风险控制时,您会看到一些指标在变化和移动。每个人都变得越来越宽容。这一次,我发现Alpha不正确。随着行业的不断扩大,我们正在筹集测试资金。我们相信,我们一直在与金融机构合作,以加深人员和机器的整合。人们善于做出具有前瞻性,宏观和中观层面的判断。该机器在微观角度方面特别擅长,可以从大量海量数据中掌握细分规则。两者结合得很好。于洋:未来最大的挑战是数据合规性。我们谈论社交数据,移动数据,用户行为数据,这是否与数据一致?当您的业务需要扩展并需要首次公开募股时,数据合规性非常重要。这是一把剑。当然这需要一个过程,我认为数据合规性是最大的挑战。

第二个问题是公司清算和购买的能力。今天,我们从用户数据开始,处理周围的数据。关于金融部门的外围数据,实现流动性和用户购买力以及规模的能力相对具有挑战性。

我认为数据的安全性和现场清理能力是数据应用程序流程和业务实现的挑战。

刘欢(主持人):我刚才提到了数据的合规性。不可否认的是,每个人都非常关注整个行业的数据合规性。正是因为合规才允许大数据行业。避免数据孤岛并创建仅在今天解决的数据融合问题。关于大数据的融合,或者如何消除数据孤岛中的差距,我们可以从技术或业务模型的角度做些什么呢?于洋:首先,在技术方面,我们谈到的所有金融监管技术和其他数据都将在行业中发挥重要作用。当然,没有必要颠覆好事。

例如,彭博已经运营了几十年,所有交易员都在使用旧系统,而且每个人都不会为了新事物而取代整个行业系统,必须有一个渐进的过程。在数据合规的前提下,我们可以真正为金融监管,金融量化交易和企业用户肖像做出贡献。

高强:数据整合实际上是一件非常困难的事情。特别是在去年发布100年信用报告后,基本上信贷数据将集中在国家主导的平台上。从业务角度来看,我们认为对于当前的互联网巨头而言,数据整合可能会在现场出现。事实上,他们是场景,他们的内部数据整合已经显示出非常强大的力量,正如阿里已经向所有人展示的那样。此外,在核心企业和平台,大型企业中,由于财务本身是信息驱动型行业,这些大型平台也是数据集成。我个人认为没有独立于政府合规的平台,并且在大场景中存在数据集成。除了机会,我认为更多的机会是现场或大平台。刘欢(主持人):目前,许多有数据和情景的巨头开始自我生态循环,或者将自己产业链的上下游与核心企业结合起来。这种变化只意味着扩大岛的半径,或者据说数据应用的范围已逐渐扩大。事实上,仍然难以整合更大的跨学科,跨行业,跨区域和跨境的行业。高强:这是事实,但现在整个行业的发展都发生了变化。从2C方面开发这些平台后,首先,从信息获取的角度来看,我们变得非常容易。有了这些平台,我想获得非常方便的产品信息。

经过几年的发展,信用相关信息得到了极大的改善。在这两个发展阶段之后,整体交易摩擦现在已经下降了很多,这意味着数据流量比以前好很多。未来数据与整个经济数据流的整合涉及相关的国家政策,包括产业政策和数据隐私保护,因为欧洲现在非常严格,我认为这也是一种趋势,毕竟,如果数据不是我们看到保护对国内案件非常有害。刘欢(主持人):我们刚才提到,从目前的角度来看,数据岛仍然存在。面对积极形势的逐步进展,我已经谈到了这一趋势。我们正在考虑新技术和好主意。商业模式可以加速,还是可以更好地推动这一点?

于振波:我是投资人。我从不说我是最聪明的人。我相信公司的力量可能会把事情推向正确的方向。

举一个不太恰当的例子,过去两天的“基因编辑宝贝”事件引起了强烈的公众抗议。我坚决反对道德,但公司背后有利益驱动这一点,所以我理解数据行业是一回事。只要您有足够的业务需求,您就有足够的业务收益。我觉得这很聪明。找到自己的路线。至于监管或数据岛,这对企业家来说是一个难题。我并不是说每个人都应该挑战监督,但你需要结合这些限制,否则企业家精神的含义是什么?

如果我们谈论大趋势,数据的产生,数据本身的工业化以及所有大数据和人工智能技术的进步必将为人类带来更多的好处。我相信情况一定如此。我也想知道下一个最好的商业模式是什么。我想知道下一位伟大的企业家在哪里。刘欢(主持人):这个过程很难,但效果非常好。

于洋:分享一些汉英翻译经验。我们在2015年提出了跨语言大数据的概念。跨语言并不一定意味着将其翻译成中文。这些数据可能是英文,中文,日文和法文。对我们来说,第一语言是个问题。如果它没有通过,它将失去许多金融机会。其次,在解决语言问题时,数据的影响和影响,积极和消极情绪以及市场和投资者的行为都非常重要。

中文翻译提出了13种自然语言处理算法。我们涵盖超过12种语言。也就是说,当我们分析俄罗斯和德国的自然语言算法时,我们必须使用它。计算语言以识别其语义和意见。为了解决不同数据和不同语言之间信息的对称性,从这个角度来看,我认为它仍然是一个特别大的空间。

刘欢(主持人):谢谢俞先生。由于时间限制,最后一个问题用一句话概括,无论是在行业还是在他们所居住的行业。您认为2019年金融业最明显的机会是什么?

于洋:替代数据是新油。

高强:这很难。在2019年,银行消费金融等组织以一句话结束:每个人都更善于以更灵活和数据驱动的方式关注客户。服务。

于振波:从投资的角度来看,我认为数据行业既不是第一年也不是固定模式。它的存在状态令人困惑。所以我仍然希望更多的企业家可以用更具创新性的商业模式给我留下深刻印象