新闻中心高端对话:AI 新基建——开启智能化新时代

高端对话:AI 新基建——开启智能化新时代

image.png

在不久前结束的 Fabarta 首届产品和用户大会的高端对话环节,Fabarta 创始人兼 CEO 高雪峰、龙盈智达科技有限公司副总裁宫小奕、阿里巴巴集团副总裁、阿里云数据库产品事业部负责人李飞飞、IBM 咨询中国区金融行业总经理范斌四位行业大咖围绕 AIGC 带来的挑战和机会、AIGC 对数据基础设施的冲击等主题开展对话。

龙盈智达科技有限公司副总裁宫小奕强调,技术创新需要解决实际应用问题,科技公司应该聚焦和深耕应用场景。Fabarta 已成为华夏银行和龙盈智达的“雁群计划”生态伙伴,期待与 Fabarta 在金融科技场景创新和应用领域开展更深入的合作。

IBM 咨询中国区金融行业总经理范斌指出,经过十多年的发展,大家普遍认为金融科技已经进入了相对比较成熟和平稳的发展期。但生成式人工智能的突破为下一代金融科技的发展按下了启动键,大模型时代的金融科技重塑刚刚开始,图技术和数据基础设施领域大有可为。

阿里巴巴集团副总裁、阿里云数据库产品事业部负责人李飞飞提到, LLM 本质上是对数据的压缩和总结,图数据和向量数据的结合有机地融合了符号和概率。融合了图数据和向量数据处理技术的 Fabarta ArcNeural 是一个非常有价值的产品,图有非常多的应用场景,是符号的代表,结合 AI 的统计和概率,价值非常大。多模处理能力是从 AIGC 到 AGI 的必要条件,如何处理多源异构数据,打通数据孤岛,提高数据流转,构建 Data Fabric 是业界发展趋势,这与 Fabarta 要打造的方向也很一致。

Fabarta 创始人兼 CEO 高雪峰在与三位行业大咖的探讨中表示,数据基础设施是大模型时代非常重要的方向,Fabarta 图、向量和大模型融合的多模态智能引擎致力于打造 AI 时代的数据基础设施,将产品应用于金融和各行业的具体业务场景,解决客户痛点和问题,为客户数智化转型提供技术支撑。

以下是嘉宾对话实录,经 Fabarta 整理编辑:

01 AIGC 为下一代金融科技的发展按下了启动键

高雪峰: 非常感谢我在业界里的三位好朋友,也是三位非常资深的专家,今天能够参加 Fabarta 产品与用户大会,并与大家分享他们多年来在行业中积累的丰富经验和深入见解。李飞飞老师因为有非常紧急的事情,今天不能来到现场,我们将会在线上连线李飞飞老师。

范斌老师是我原来在 IBM 时的前辈,也是我多年的老朋友,一直在金融行业工作多年,对金融与科技融合领域有着深厚的见解与洞察。范老师,当下大家都在谈 AIGC 技术掀起的全面智能化浪潮,您在接触客户和业内用户时,都发现了哪些比较大的机遇,以及 AIGC 技术带来了哪些挑战?

范斌: 谢谢雪峰的邀请,今天过来参会感到非常开心。我自己也是一个创业爱好者,曾经在互联网 1.0 时代做了一家互联网 2.0 的公司,我认为创业的时机非常重要。雪峰在这个时间点做图数据库和基础设施,我认为是一个非常合适的时机。不是因为今年 AIGC 和 ChatGPT 出圈,而是因为在图数据库和 AIGC 实际的应用中,金融行业就有很多令人兴奋的产品与应用。雪峰在 IBM 期间,曾负责将全球资产引入中国并进行本地化,因此他在这方面有较丰富的经验。

在金融行业,金融科技为银行提供服务主要有两个方向,一方面是为银行基础设施进行赋能,另一方面是在金融科技领域为银行提供服务。金融科技已经发展了十多年,大家普遍认为金融科技已经进入了相对比较成熟和平稳的发展期。但生成式人工智能的突破为下一代金融科技的发展按下了启动键,大模型时代的金融科技重塑刚刚开始,图技术和数据基础设施领域大有可为。

回顾大约五六年前的情况,我们曾协助六大行中的大部分银行使用图数据库开发过多个项目。其中一个业务场景是关于工资流向的分析,当时我们利用图数据库对工资流向进行分析。相比传统数据库,图数据库的表现更加出色,处理速度更快,可采取的措施也更多。另一个业务场景是在行业风险传导的项目,当时某些地区出现了较大的经营连带风险。其中一家银行采用了图数据库技术,提前发现了潜在的风险,从而避免了重大损失。

使用图数据库等新技术有非常大的潜力。刚才看到 Fabarta 的一些新产品,包括数据、算法,以及算法的改进等,这里面有非常多的应用机会与应用场景。我们有一些详细的分类,这里就不展开讲了,稍后宫总应该会介绍更具体的应用。对 Fabarta 来讲,我是觉得第一是目前时机非常好,第二是产品应用场景非常多,我非常看好在当前的状况下,在银行、在金融行业的应用。

高雪峰: 谢谢范老师。刚才提到新的人工智能技术给金融行业、传统行业按下了一个重启键,这个比喻非常恰当。许多行业的客户都在密切关注新兴科技如何为企业带来核心的改变。

02 金融科技与产业数字金融的合作与挑战

高雪峰:宫总,您一直专注于金融科技领域,在金融业务场景中做出了许多创新和突破,您对这个领域有什么认知和感受?

宫小奕: 感谢雪峰的邀请。首先跟大家打个招呼,今天现场 Fabarta 邀请了许多来自投资界、科技界、产业界以及媒体界的朋友。今天很多来到现场的伙伴也都是行业里的头部企业,或者在行业里前沿探索中有着丰富经验的科技公司。在这样一个大的技术背景之下,我们今天讨论的问题并不仅仅是技术创新,因为所有的技术创新都是为了解决业务的应用问题。

从金融行业的角度来看,在场景应用领域当中我们发现许多科技公司并未涉足太多。例如在金融行业,如果进入到一个垂直的业务领域,大家对这个业务领域是否理解,是需要打问号的。龙盈智达作为华夏银行关联的科技公司,近年来为了解决这个问题,我们将重点锁定在产业数字金融领域。很多人对零售行业比较了解,其业务的通用性非常方便我们进入。但是从 2018 年之后,我们从消费互联转向了产业互联。当今在 To B 金融领域面临着很多问题,但这个领域的业务创新却并不是很多。在 To B 金融领域,龙盈智达有自己的偏好和选择。在产业领域 900 多个行业分类中,我们锁定了先进制造、物流仓储、乡村振兴、大宗能源等行业。对这些行业我们率先进行研究,同时对于图计算和向量技术的应用,我们首先在刚才提到的这些行业进行生态的拓客,进而进入我们原发风险的识别。

现在我们与生态伙伴(如 Fabarta ),也一起在做一些新的尝试。除了图和向量等技术的应用,我们也在生态获客进行了一些尝试,并取得了一定的成绩,只是前期没有进行太多的对外宣传。在行业的认知、行业经验沉淀以及金融业务创新驱动方面,我们探索出了一些独特的经验。范斌总是我们的生态伙伴,也是我们的生态专家,我们在这方面进行过深入的探讨。另外,对于合规和审计,我们注意到许多科技企业在这个领域没有投入太多。在金融领域,合规问题对我们来说非常重要,在业务开展过程中需要审慎和关注。在合规和审计领域大家需要更多的探索。

高总今天也提到了一些关键的方面,比如数据要素,在全球范围内我国已排名第二。然而,我们对于如何利用底层要素驱动上层业务发展的探索仍然不够。目前,我国的数字经济已超过 50 万亿,但与其他发达经济体相比,我们的数据仍存在差异。特别是在第一产业、第二产业的应用和渗透方面,仍缺少增长动力。数字要素、数据资产与数字经济之间存在很大差别。

当下产业和金融科技都各自感觉成长有挑战,有困境,为什么会出现这种情况呢?在之前华夏银行生态大会上,我们认真思考了这个问题。金融有时对产业理解不够,未在金融创新和授信技术方面进行转变。而产业侧也面临技术选择和应用的困难与挑战。大家普遍认为现在的技术已经非常成熟,科技端本身也是这样认为的,但许多企业机构却不这样认为。他们会思考:我应该投入什么才能对企业的发展产生直接的经济价值?当无法计算和评估时,就无法选择和投入。科技端也感到困惑,他们认为当前的技术完全可以在某些领域应用。为什么甲方在选择时需要这么长的周期呢?实际上,这是因为科技端对具体业务场景的理解不够深入,导致业务落地的时间周期非常长。我们非常欢迎具备技术成长性和经验的科技伙伴,在刚才提到的产业领域与华夏银行、龙盈智达一起进行创新。

高雪峰: 非常感谢宫总的分享。Fabarta 很早就加入了华夏银行和龙盈智达的产业数字金融生态圈,华夏银行和龙盈智达在这个领域中树立了标杆,建立了一个生态群体,真正把产业、金融和数字科技的力量深度融合在一起,我们真切感受到了诚意和力量。希望现场在座的、线上的科技公司,能够真正投身到能为实体经济带来发展的产业数字金融的浪潮中去。

image.png

宫小奕 龙盈智达科技有限公司副总裁

03 AI 智能时代数据基础设施的技术挑战与机会

高雪峰:刚刚提到新的人工智能技术对传统行业和金融领域有比较大的冲击。飞飞老师是数据基础设施领域、在国内和国际上都非常有影响力的领军人物,请飞飞老师从技术的角度为我们分享一下 DB for AI ,或者 AI 智能时代数据基础设施受到了什么冲击,遇到什么样的挑战?

李飞飞:范总和宫总的观点我非常赞同,他们的核心观点有两点,第一,从技术角度、产业角度来看,AI 带来的这一波机遇,对各行各业类似于重启或者开启新的一扇门,是非常大的一个机遇。第二,技术的创新最终还是要回归到应用价值,一定要与场景结合。针对雪峰提到的问题,我有几个关键的点与大家分享一下。

第一,以大模型为代表的 AI 技术到底是什么?我个人认为今天的 AIGC 技术、以大模型为代表的技术本质上还是对数据的压缩和总结,大模型本质上就是对非结构化文本数据进行了很好的压缩和总结。从这个角度看,在理论基础上来说有点像香农信息论,本质上还是从概率角度和方法上去解决数据压缩和总结问题。只不过它用的是 Decoder-only 技术,再加上 Attention 技术,让压缩的模型比以前用通用深度神经网络效率会更高,能够处理更大规模的数据,这是大模型技术上的特点。

从实际应用角度来说,大模型本质上是看到了前面一段话,预测下一个词出现的概率是什么,它本质上就干了这么一件事。就如同我见到雪峰说“今天早上你吃了?”,在中文语境下大家大概率会猜到下一个词是“吗”(吃了吗)或者“什么”(吃了什么),而预测下一个词是“铁”(吃了铁)出现的概率非常低。因为大家知道,不可能有人早上吃铁。

第二,今天 Fabarta CTO 杨总的分享中提到了图,Fabarta 发布的核心产品也是将图和向量相结合,我个人认为是非常有价值的产品。首先,“图”有图数据库,在金融、风控等领域,图数据库、图技术的应用有非常大的价值;其次,在这波 AI 技术出现之前,我们实现推理的一个重要方法是通过知识图谱,把知识变成 Triple (Subject+Predicate+Object)的形式。从人工智能、机器学习理论和技术范畴来讲,知识图谱属于符号领域的代表。将图和向量结合起来,再结合大模型能力,实际是把经典的 AI 概率统计方法和符号方法有机结合起来。这带来的商业机会、技术创新的机会都非常大。

第三,我认为接下来图与向量的结合非常重要。大模型本质上是对文本数据的处理,其最基本的核心思想是先对文本进行截断处理。就如我刚才讲的,大模型能够识别一段话并预测下一个词是什么,它是如何做到这一点的呢?大模型首先将一个文本切成很多段,然后对每个段落进行嵌入,将其映射到一个几千维的高维向量空间。然后将成千上万的向量进行归类分析,例如使用聚类(clustering)算法和最近邻(nearest neighbor)算法。这对处理海量高维向量提出了非常高的要求。

目前业界最常用的方法是 HNSW 算法(Hierarchical Navigable Small World),杨总在刚才分享中也提到过。其本质是将向量作为图的节点,实际上与图又有关联。那为什么称之为 Navigable Small World 呢?因为它将每个向量看作图中的一个节点,并通过构建向量之间的距离来建立最近邻图,然后在该图上进行最近邻搜索。而为什么称之为 Hierarchical 呢?因为单层搜索的成本太高,所以它建立了多层结构,每一层之间有点像经典的概率跳跃表(probability skip list),按照一定概率跳到下一层,这与图天然有着非常紧密的关系。所以我认为将这两者结合起来非常重要。从技术和理论的角度来看,符号、概率图和向量等看似不相关的技术,实际上在理论和技术层面是紧密相关的。

第四,刚才在杨总的分享里面,包括雪峰前面也提到了,结合云原生技术将多模数据处理能力结合起来,我觉得这是一个关键点。我认为未来从 AIGC 到 AGI 还是有巨大的鸿沟,而多模数据一定是跨越这个鸿沟的必要条件。除了图和向量能力,我们还要结合文本处理能力。因为很多时候我们处理大模型本质上就是文本处理、全文检索等能力。Fabarta 今天发布的产品,将这些能力有机地结合起来,同时结合云原生、存储计算分离,又考虑到成本的问题。

最后一个非常重要的关键点,在前面的分享里也提到了,就是与场景相结合,比如与金融场景,风控场景相结合,我认为会产生非常巨大的价值。为我们接下来在图、向量、文本多模数据结合领域,将 AI 能力发挥到极致,将传统数据库能力发挥到极致,起到非常好的推动作用。

高雪峰:谢谢飞飞老师。飞飞老师很清晰为大家剖析了大模型技术,以及在整个数据基础设施里面涉及到的符号、逻辑推理、概率、向量和图技术,还帮大家剖析了向量距离计算算法背后的计算逻辑。

04 数据基础设施在大模型落地应用中的关键性作用

高雪峰:刚才提到了很多新型的技术,包括很多当前大家都感兴趣,而且也要去推广的生成式人工智能技术。当大家真正要把这些技术应用到具体的行业,尤其是金融行业时,一定会遇到非常多问题。我了解 IBM 也有自己的 Watsonx 大模型技术,也有 CP4D 为核心的数据基础设施产品,请范老师从国际视角谈一谈,数据基础设施在企业级场景中,为大模型落地发挥怎样的重要作用?

范斌:我先分享下 IBM 在 AI 基础设施方面的建设情况。目前 IBM 推出了 Watsonx ,大家看到它的架构,基本上就会明白它产生的背景及其重要性。Watsonx 的架构有三个部分组成:第一部分是 wastonx.ai,模型训练、生成、产生以及结果都涵盖在其中;第二部分是 watsonx.data,主要负责收集以及存储数据,是湖仓一体的结构,这部分在底部;另外,我们现在也认识到,除了借助 AI 本身产生的内容,在各类应用场景中实现降本增效以外,还有另外一个非常重要的方面,即模型管理和 AI 应用管理。这部分是 watsonx.governance,通过自动化和整合多个工 具、应用程序和平台,同时记录数据集、模型元数据和管道的来源,来管理整个 AI 生命周期。通过自动化工作流程更好地检测公平性、偏见和偏差来管理风险和保护声誉。通过将不断增加的法规转化为可执行的策略来遵守法规。Watsonx 总共有以上三个部分。所以,我们可以看到在整个 AI 体系里,数据作为底层是特别重要的。

IBM 每年都会做全球 CEO Study,今年有一个很重要的反馈。全球 80% 的 CEO 认为,未来在人工智能领域可能会面临的 4 个主要的实施障碍是可解释性、伦理、偏见和信任。所以,数据的准确性以及可解释性是非常重要的。

我们曾经在六大行中的一家银行做过一个基于人工智能的信贷审核项目。这个项目应用可以处理各种各样的生产数据,准确率非常高,但是肯定不能达到 100% 放款无风险,其实即使人工审核也会有坏账的产生。关键问题是,AI 作出的判断,出了坏账谁来负责?所以对AI的使用,配合规章制度的修改、适应也是非常重要的工作。

从数据的角度和人工智能应用的角度,还有很多配套的 governance 需要做,才能解决这些问题。因为目前从 AIGC 到 AGI 中间还有很长的路要走,我们现在针对这些具体的内容、垂直的应用去做,有很多东西还是得要有数据以及所配套的管理方式、方法,才能够达到我们的要求和期望。

高雪峰:谢谢范老师。刚才提到了在整个国际的大视角市场下,数据对于人工智能的创新技术落地时的可解释、可追溯以及安全可控都非常重要,这并不是中国本土特有的需求。

05 To B 领域生成智能与决策智能业务的落地实践经验

高雪峰:我们都知道产业数字金融对当下整个金融科技的发展非常重要,因为它是连接实体经济、数字金融科技的一种行之有效的方法。刚才提到了两个概念,一个是大模型所代表的生成智能,生成非常丰富的文档、小说或者文章;另外一个是真正用于决策的决策智能。在这两个路径当中,很多当下的技术是什么样的状况?在应用过程中我们还需要做哪些额外的工作呢?

宫小奕:从产业的角度出发,并结合我们在产业金融创新领域的探索经验,为大家分享几点。

第一,如果在座各位是科技公司,需要在这个行业里深耕,那么轻易不要进入泛场景,也不要轻易构建泛能力。在 900 多个行业中,你总能找到相对熟悉、有市场规模和潜力的场景,并在这些相对精准的场景里去尝试。否则,所谓的可解释性也无法实现。

第二,刚刚说到 To C 和 To B 完全不一样。如果你想在 To B 领域有所建树,不要有路径依赖,不要过分依赖原来在 To C 领域的经验。不同的行业千差万别,并且在地缘特征上面的表现也不同。对 To B 的企业来说,无论是高精尖产业、金融业,还是其他的产业,客户更关心的是每次投入带来的具体的效果。然而,最近一些生成式人工智能的应用,并没有给真正的 To B 企业在其工艺、流程和发展过程中带来直接的经济价值。如果你的投入想产生经济价值,起码不是在泛场景里,泛场景没有办法解决行业跨度的问题。无论是图还是向量,可解释性背后就是你对它的认知、知识的问题。如果不能把这个问题解决好,最后当你的投入并没有产生回报的时候,你会失去信心。在竞争过程中很有可能就会退出竞争圈层。这是我非常想说的,摒弃路径依赖,选择有效的目标客户和精准的场景。

在科技公司的成长过程当中,一定要关注客户的需求,科技人才应该是复合型的,应当理解业务。开个玩笑说,当你带着一些特别强的技术,与一些特别想要业务产生经济效益的决策者去沟通的时候,他会不会买单?他可能都没有听明白你要讲什么。所以,如何将技术的问题转化成业务的语言,并且深度理解客户的需求也是非常重要的,这也是为什么我们在与 Fabarta 合作。Fabarta 明确选择了一些客户群,并不是在做泛客群。Fabarta 也明确选择了一些场景,并选择了其中一些痛点与我们进行结合。整个团队也非常专业,非常严谨,迭代的效率非常快。大家都是在探索过程当中,在一片蓝海中总能找到自己定位,在找定位过程当中,刚才的方法论还是可以给大家一些经验和借鉴,谢谢。

高雪峰: 谢谢宫总。最早和宫总沟通的时候,就发现我们双方的理念非常契合。比如,我在阿里云期间一直强调的大数据与人工智能的场景化应用。当初与宫总讨论产业数字金融时,我们关注的具体细节是如何通过科技创新来实现具体的场景创新。因为如果科技创新脱离了市场需求和实际场景的应用,那么它就失去了意义。

06 数据工程、数据质量以及泛数据库领域的挑战与机遇

高雪峰:飞飞老师在数据库、数据基础设施领域是非常资深的专家,我们谈一下泛数据库的概念,包括数据工程、数据质量。在当下这一轮 AI 浪潮之下,飞飞老师见过很多不同行业的头部客户的领导和资源,在当数据工程和数据质量的情况下,面临着什么样挑战?在这个领域有哪些巨大的机会?

李飞飞: 非常好的问题,从阿里云数据库接触的各行各业的客户来看,可以总结出来下面几个关键挑战:

第一个挑战,关于如何处理多元异构数据的问题。从传统的数据库、数据平台、数据基础设施来讲,大家更多关注在结构化数据的处理。对于传统数仓,往往都会定义好什么字段进仓,有标准的 ETL 流程。最近这一波 AI 技术的蓬勃发展,让大家看到了处理非结构化、半结构化数据的可能性、效率提升以及带来的新价值,如何将多元异构数据在一个易用、好用的数据平台,或者一个产品里面进行统一处理、归一化处理,这变成了一个迫切的需求。

例如大家看到将向量和大模型结合,在内容生产、游戏行业有非常强的诉求。再举一个简单的例子,将文本数据和结构化数据融合起来去做多模搜索(Fusion search),既有 SQL 结构化搜索,同时又做模糊的多模搜索、文本搜索,能不能在一个很简单的平台上,用一个简单的 SQL 语句去完成这一个任务,这是我看到多元异构数据的统一处理。这与刚才 Fabarta 产品提到多模数据统一处理方向是一致的。

第二个挑战,无论是从事数据库、大数据还是数据平台的建设,大家都希望构建一个"one size fits all"的产品。但这件事客观来讲是非常有挑战,很难做到毕其功于一役。然而,从客户视角来讲,有一个需求是明确的。你可以有多个数据处理引擎,可以有传统的关系型数据库、传统数仓、新型数仓、大数据平台。但是从客户视角来讲,能不能简化数据交互、流转,很好的解决引擎和引擎之间数据打通、流转、数据孤岛问题,是非常重要的。

举例来说,从技术角度来看,可以考虑共享元数据(Meta data sharing),并简化复杂的 ETL 流程。我们越来越多地看到 ETL 过程变为 ELT(Extract,Load,Transform),因为分析端产品的能力正在快速增强。因此,在加载数据后,可能不再需要进行转换(Transform),而是根据需求即时进行转换。在这个过程中,我们需要关注元数据的共享,确保良好的数据访问,并使用标准的数据格式来实现多个引擎之间的数据交流。这是我观察到的第二个趋势,或者用一个更流行的术语来说,就是数据编织(Data Fabric),即数据的统一编织和治理(data governance and data fabric),这是第二个明显的趋势。

第三个趋势可能也是一个挑战。今天基于云原生的平台、云计算平台,云原生的架构已经不是一个讨论项,可能是标配项。无论哪个行业、哪个场景,降本增效永远是客户最关心的问题之一。如何在云原生的架构下持续地提升产品的竞争力,确保稳定性和数据安全前提下,不断去降低成本、提升效率是一个具有挑战性的任务。比如说 Serverless 的技术、自动智能优化能力;除了做好 DB for AI,还可以去做 AI for DB,结合 AI 的能力去做调参、监控等能力,让整个数据基础设施、数据平台、数据产品好用、易用,做好降本增效,这也是很多客户非常关心的问题,尤其是在今天经济大环境下它变得尤为重要。

最后一点是场景化。我与之前两位嘉宾的观点一致,无论产品有多好或多创新,最终都要创造业务价值。在具备强大的通用产品能力基础上,如何结合特定场景实现差异化的场景化能力,对产品团队和技术人员提出了挑战。这涉及到一个微妙而复杂的平衡,我们需要避免过度定制化的场景,因为这可能导致许多初创公司和大公司陷入项目化的泥潭,从做产品变成了做项目。如何在这两者之间把握好一个度,既有标准化、可规模化复制的产品能力,同时又能非常好能解决所选择的行业场景的痛点和诉求,需要产研团队深入思考。举一个简单例子,比如游戏场景,可能关系型数据库和云原生弹性是其刚需,同时在游戏场景又有合服和并服的需求。如果敏锐抓到游戏行业客户诉求,把合服和并服变成数据库的能力的一部分,就是面向行业的定制化能力,而不是面向某一个客户。这对行业内所有客户都是非常有杀伤力的,因为能解决他们非常痛点的问题。

以上四点是我认为面向未来,我们这个行业以及在数据库、大数据、数据基础设施在这个行业里从事的从业人员,从技术角度我们都应该去关心和去突破的关键挑战。谢谢!

**高雪峰:**谢谢飞飞老师的分享。我相信对在座每一个伙伴、线上每一个从事科技创业的团队,都是非常有价值的。在阿里的时候,我对数据库产品将游戏行业一个非常好的场景固化为产品特征的做法印象非常深刻,也就是将游戏行业 HTAP 能力的实时数据游戏排行榜能力变为数据库产品能力,结果一举打穿了所有游戏行业。所以在我们当前的产品设计中,我们也引入了很多这样的理念,将可复制的场景固化到我们的标准产品中,以便在市场中取得突破。

image.png

李飞飞 阿里巴巴集团副总裁、阿里云数据库产品事业部负责人

07 三位嘉宾对 Fabarta 的期待

高雪峰:由于时间有限,最后的一个问题,我想请三位老师回答,从飞飞老师开始,我们这个团队的基因是与阿里云密不可分,我们公司的产品一定将会与阿里云有深度合作。那么飞飞老师,您对刚刚起步的 Fabarta 有什么期待呢?

李飞飞: 我觉得 Fabarta 从 CEO 到 CTO,还有创始团队很多人都有阿里的基因,而且是阿里云的基因。回应一下雪峰的问题。

第一,我明确表达,我们一定会和 Fabarta 开展深度的合作,也欢迎来越多类似 Fabarta 越的创业公司能够在阿里云上找到自己的舞台。阿里云为大家提供的是一个平台,一个计算即服务、算力即服务的计算平台。我们欢迎类似 Fabarta 的创业公司能够在阿里云上找到自己的舞台,我们也期待与 Fabarta 达成深度合作。

第二,  今天实际上我们正处于一个非常关键的转型期,我认为有两个关键的判断。首先,算力即服务已经成为一种势不可挡的趋势。算力不再是孤立的,而是通过聚合看似微小和分散的算力,形成算力即服务的能力,也就是云计算。另外一个大家讲得比较少的关键点是数据即服务。如何将数据在线化,将数据聚合,并且在这个过程中能够挖掘出更深层次的数据价值,这也是当下我们这个时代非常重要的一个方向。

另外一个重要趋势,我认为我们目前正处于一个关键的转型期。这个转型期是从传统的通用算力,也就是基于传统 CPU 架构的通用算力,向面向新时代的异构算力转型的关键时期。异构算力结合了通用 CPU、GPU、FPGA、DPU 等技术,例如英伟达最新推出的 BlueField-3 产品就属于这类产品。在这个转型时期,如何利用异构算力平台及异构数据是非常重要的。我们正处在“通用算力&结构化数据”和“异构算力&异构数据”两个时代交互的关键时期。在这个关键时期,那些能够抓住机会,结合某些关键可复制的行业化场景的产品,将会获得最大的机会。这是我对 Fabarta 及类似 Fabarta 等创业公司的一些建议。

高雪峰: 谢谢飞飞老师。与阿里云整体产品体系的战略合作,也是我们公司在第四季度非常重要的事项之一。非常感谢李飞飞老师的时间。

同样,我们公司也有很多蓝色 IBM 的基因,IBM 一直注重以客户为中心,在 To B 领域注重与客户共同成长的理念。这种理念源自于 IBM GBS 的客户合作伙伴体系。我们之前已经多次讨论过,最懂客户的咨询团队与科技型创业公司如何展开深度合作。所以,范老师,请您谈谈对于 Fabarta 的期待。**

范斌: Fabarta 从上到下确实有 IBM 的基因,流着蓝色的血液,不仅仅是 Fabarta,今天在现场的很多嘉宾,有很多是我们 IBM 以前的同事。从这个角度去看, Fabarta 的生态系统的创建非常完善,生态伙伴包括科技公司、甲方公司、阿里、IBM,多样化的生态伙伴体系是非常好的。我来给 Fabarta 几个期许或祝愿吧。

首先,Fabarta 的产品和技术是图数据库技术、向量数据库技术等多种技术的融合,实际上是一种底层技术,未来大有可为,有着巨大的市场空间和潜力。

二是作为基础设施的初创公司必须能够耐得住寂寞。我以前也做过初创公司,也在帮清华大学 X-Lab 做一些事情,也考察和分析过很多初创公司。我觉得第二点最重要的是,从事基础研究必须要有耐心,只有忍受住寂寞,才能获得成功。

三是在产品方面,Fabarta 的产品在底层方面做得很好。但根据我们在 IBM Consulting过往的经验和对客户的了解,我建议 Fabarta 往上再增加一个公共服务层。在底层数据库之上,还可以构建非常丰富的公共服务。但在公共服务层之上,还要继续再往上做吗?千万不要, 再往上做一层可能就死掉了。当前在底层之上增加一层公共服务可能是更好、更均衡的一个选择。

四是要针对性地选择一些场景。选择这些场景有什么用呢?飞飞总讲得特别好,就是你不要自己去做服务。你的定位是提供产品,做好底层的工作,并且中间层可能还有一个公共服务层,这些特定场景可以帮你更好地占领客户的心智。宫总刚才讲到目前产业领域有 900 多个行业分类,Fabarta 可以与华夏银行、龙盈智达等公司进行产业合作,从中选择一两个行业或场景,共同打造行业标杆项目,这种模式对 Fabarta 未来的发展是一个非常健康的模式,也会有比较高的投入产出比。同时,Fabarta 也可以集中精力去做更重要的事情。因为初创公司很难投入大量精力并行去做很多事情,即使是大型成熟公司也未必有足够的精力。

最后一点,我是开源的倡导者,Fabarta 最后会不会走向开源,或者在某个情况下能够去做开源,希望最后能看到一个开源的 Fabarta,以生态的方式实现最大的价值。

image.png

范斌 IBM 咨询中国区金融行业总经理

高雪峰:谢谢范老师真知灼见的建议,台下在座的很多合作伙伴,在上层服务层跟我们有深度绑定与合作。我们非常有幸已经是华夏银行“雁群行动”稳固的合作伙伴,之前我在华夏银行生态大会上提过,我们双方是真正的命运共同体,龙盈智达作为我们甲方客户,作为我们的需求提供方,请宫总谈一下您对 Fabarta 的期许和期望。

宫小奕: 确实比较有幸,今天很有意思的事情,就是刚才说到雪峰来源于 IBM 和阿里云,其实 IBM 和阿里云本身也是我们的生态伙伴,比较巧我们又凑到一起讨论这个问题。既是对雪峰谈的,也是对我们生态伙伴谈的,也是对未来基于我们的生态能力所服务的一些客群去谈的。

在业务驱动的场景下,我们目前主要扮演的是应用端、平台智能决策的角色。在底层技术方面,我们邀请专业的技术伙伴参与融合并赋能,这也回应了飞飞老师和范老师刚才提到的,大家的定位都非常明确。希望在这样的场景中、在我们已经进行的一些创新探索之中,Fabarta 能够像人工智能一样找到更多发挥和发展的空间。而不仅仅是像数字化一样,我们提出需求,Fabarta 只是敏捷地提供能力上的支持。同时,我们也邀请更多的伙伴参与融合,发挥各自的价值,明确彼此的定位,并相互赋能。通过更深层次的相互理解,为实体经济和产业发展提供赋能,将我们的数字经济推向一个新的高度。

高雪峰: 谢谢宫总。刚才接近一个小时的分享,对现场我们的客户与合作伙伴,也对在线上其他的一些创业者,以及我们科技圈子的同仁都有非常大的帮助和启示,再次感谢我的这些老朋友、我们的客户、我们行业大咖参与我们今天的高端对话,为大家带来的精彩分享。感谢宫总、范老师、飞飞老师,再次感谢大家。