投融资项目·白鲸开源
本项目由白鲸开源投递并参与“数据猿年度金猿策划活动——2024大数据产业年度最具投资价值榜单/奖项”评选。
北京白鲸开源科技有限公司成立于2021年6月,是国家高新技术企业和中关村高新技术企业,由Apache DolphinScheduler及Apache SeaTunnel开源项目核心团队和全球顶尖的数据领域专家组建,核心员工来自于IBM、Teradata、Informatica、阿里、京东等,研发人员占比超过 90%,目前员工20+人。在2021年公司创立之初即获得蓝驰创投千万元种子轮投资,2022年获得凯泰资本数千万元投资,估值2亿元人民币,是全球DataOps开源领域的引领者。
旗下核心产品WhaleStudio是白鲸开源根据全球领先的DataOps理念打造的新一代全栈数据集成调度解决方案,具有分布式、云原生并带有强大可视化界面的特点,将全球领先的调度开发组件(WhaleScheduler)与数据集成组件(WhaleTunnel)集成在一起提供给用户全球领先的完整解决方案。
重要产品及服务能力
WhaleStudio新一代DataOps全栈解决方案
WhaleStudio是白鲸开源根据全球领先的DataOps理念打造的新一代全栈数据集成调度解决方案,具有分布式、云原生并带有强大可视化界面的特点,将全球领先的调度开发组件WhaleScheduler与数据集成组件WhaleTunnel集成在一起提供给用户全球领先的完整解决方案。
WhaleStudio支持公有云、私有云和混合云,已与AWS、阿里云、华为云等国内外头部云厂商达成合作,全面支持云原生,帮助企业解决内部多数据源、跨云、信创环境复杂的数据集成,持续开发、持续部署、数据捕获、数据打通等一系列问题,已在6000多家企业中得到实践和使用,涵盖证券、保险、银行、制造、零售等多个行业,获得行业头部企业客户青睐和认可。
白鲸开源拥有扎实的技术基础和完善的服务体系,形成了坚实的商业壁垒。目前,根据全球最佳实践发布的商业版版本WhaleStudio基于Apache顶级开源项目DolphinScheduler和SeaTunnel,公司员工常年参与项目构建、更新迭代与运营,拥有扎实的数据调度和数据集成同步技术基础,完全胜任帮助企业解决内部多数据源、多数据系统复杂的数据集成,持续开发、持续部署、数据捕获、数据打通等一系列问题,服务已广泛覆盖金融、互联网、电信、零售、云计算、医疗健康、零售、数据处理等领域,经过了IBM、腾讯、科大讯飞、美团、360、联通、顺丰、哔哩哔哩、新浪、唯品会、Shopee等3000+企业生产实践环境的检验,满足了用户的痛点需求。
白鲸开源拥有完善的服务体系,致力于确保客户和合作伙伴无论身在何处都能成功部署和使用WhaleOps产品。WhaleOps全球客户服务提供一系列支持,以满足客户和合作伙伴的不同需求,包括为有需要的人提供24×7全天候服务,以及多种沟通渠道,包括Slack、微信、社区、论坛、电话和网站。全球客户支持内容包括最新版本更新、紧急错误修复(EBF)、GCS材料支持、预测性升级机器学习算法智能监测案例升级提醒、持续响应SLA、目标服务恢复、制定支持团队,以及指派成功客户经理帮助WhaleOps产品与客户技术和业务保持一致。
值得一提的是,白鲸开源产品在信创合规部署支持方面做到了完全的国产化:
1. 支持国产服务器,国产CPU、内存、主板、硬盘等,如鲲鹏服务器。
2. 支持国产操作系统,如中标麒麟、银河麒麟、红旗Linux。
3. 支持国产数据库,如 达梦数据库、GaussDB、TiDB。
4. 支持对系统部署所涉及到的服务器、操作系统、中间件、数据库进行信创化改造,满足信创环境下系统迁移和原有任务调度的需求。
技术能力说明
白鲸开源拥有扎实的技术基础和完善的服务体系,技术开发人员占比80%以上,多个国内信创生态认证,10项国家专利处于公布期,以及19项软著。
白鲸开源根据全球最佳实践发布的商业版版本 WhaleStudio基于已经非常成熟,且已占据市场主流地位的Apache顶级开源项目DolphinScheduler和SeaTunnel,并在开源核心基础上增加了众多企业级特性,也强化了对国内信创环境及数据源的支持,如适配达梦、人大金仓等国产数据库。
公司重度维护的大数据开源社区除了Apache DolphinScheduler和Apache SeaTunnel之外,还有ClickHouse、Apache Armbari以及Trino等开源项目,开源技术基础牢固。
此外,白鲸开源还与阿里云、AWS、Hidi、GreenPlum、Pingcap、Kylin等社区保持密切联系和交流,并与联想、中科金财、宝利信通等ISV/行业集成商合作伙伴密切合作。
白鲸开源商业化版本通过WhaleStudio实现了一站式的开发、测试和运维闭环管理,提供了调度、数据同步、数据质量监控以及影响分析等完整功能。相比开源版本,商业版在CDC和数据源支持方面有显著增强,不仅支持更多数据源,还增加了DDL变更报警和延时告警,提升了数据开发与运维能力。
此外,商业版提供了强大的工作流与血缘分析功能,使得用户可以在长链路数据处理中查看多层次的下游影响,通过自动重跑和故障分析来管理复杂任务的依赖关系。通过智能告警和基线管理,系统能够自动分析上游依赖,对如金融报表等关键任务提供基于依赖的告警,确保按时交付。运维能力方面,商业版通过多种智能运维手段提升了系统在复杂任务链和多任务环境下的稳定性和管理效率,为用户提供了更加智能、全面的运维支持。
近年营收及未来预期
在过去的三年中,我们的公司经历了显著的增长和扩张。2023年,我们实现了数百万的营收,标志着我们业务的坚实起步。随着市场对我们服务的需求不断增长,2024年我们的营收超千万元,这一飞跃不仅反映了我们业务的强劲增长,也证明了我们解决方案的市场竞争力。
展望2025年,我们预计营收将增长超过200%,这一预期基于我们与数百家企业客户的积极接洽和合作。我们的客户群体包括多家头部券商、银行、保险、车企和海外互联网企业,如中信建投证券、中信证券、光大理财、中国联通、中国银行、摩根大通和旺旺等。这些标杆客户的合作不仅为我们带来了显著的营收增长,也为我们的业务发展提供了宝贵的经验和信誉背书。
目前,我们的WhaleStudio一站式DataOps解决方案正在多家大型公司中实施项目交付阶段,这将进一步巩固我们的市场地位,并为我们的营收增长提供强有力的支撑。我们对2025年的营收预期充满信心,相信通过不断的技术创新和客户服务优化,我们能够实现这一宏伟目标,为股东和合作伙伴创造更大的价值。
企业负责人
·郭炜 白鲸开源CEO
郭炜,白鲸开源CEO,师从唐世谓教授(数据仓库开创者),北大研究生。IBM、Teradata多个行业资深专家,万达数据部总经理,联想全球大数据负责人,在中金、易观多家企业负责技术和大数据领域。
融资情况
2021年11月,北京白鲸开源信息科技有限公司获得蓝驰创投种子轮投资。
2022年7月14日,白鲸开源完成天使轮+数千万融资,由凯泰资本领投、天使轮蓝驰创投继续跟投,沧澜担任本轮独家财务顾问。
投资人评价
新一轮科技革命正蓄势待发,大数据既是数字科技革命的结果,也是驱动数字化和智能化发展的手段。因此,挖掘数据价值、提升数据治理效率已经成为数据资产管理的新命题。凯泰资本投资白鲸开源,我们积极拥抱去中心化时代的开源协作理念,高效率整合稀缺的大数据专家资源和科学家资源,构建云原生时代智能大数据治理系统。我们希望积极融入新一轮科技革命的浪潮,发挥中国市场应用场景丰富的大数据资源优势,为数据资产管理和数据治理赋能,在全球大数据产业的发展过程中贡献中国元素。
当下,数据在高速积累,数据源技术非常多样,同时对数据扭转的实时性和可靠性有更高要求,企业在高效、可靠、合规和安全地管理数据方面要应对巨大挑战。白鲸开源能够为企业提供整体DataOps解决方案,帮助企业更好地适应大数据和云原生大时代下的数据处理与治理。团队已成功孵化了多个知名开源项目,目前已经服务了互联网、云计算、金融、运营商、先进制造业等上千家大型企业,是这些企业的核心数据管理底座。我们非常看好白鲸团队,相信白鲸具备成为DataOps领域国际知名企业的实力。
客户评价
中信建投联合白鲸开源基于WhaleScheduler产品基础上打造了全栈信创化的数据开发平台,实现统一数据开发、任务编排、任务调度,更好地完成了离线批处理、实时流处理等任务,有效降低了数据加工处理成本,真正实现精益敏捷的数据运营。
DataOps作为近年来数据管理领域兴起的工程文化和实践,借用了DevOps敏捷交付的基础框架,揉合了DAMA 数据治理理念,强调在如此激烈竞争的商业环境下,最大限度地快速匹配业务部门的需求和资源开展交付,加速业务价值的试验与试错,持续实现数据价值。2021年以来,中信建投结合公司现状,基于白鲸开源的商业化议题解决方案WhaleScheduler,打造了DataOps研发管理创新体系,梳理优化需求、设计、开发、测试、投产的全过程及相关支撑工具的整合,逐步建立了标准化、全线上流水线,支持数据持续集成和交付,为数据供给提供效率和质量的双重保障,支撑公司数字化转型。