估值280亿美元,谷歌、亚马逊、微软等巨头争相投资,这家大数据公司什么来头?
由微软大力支持的“大数据独角兽”Databricks正在飞速发展,在完成2月1日最新的一轮10亿美元的融资后,其估值飙升至280亿美元。
与2019年10月份完成F轮融资时的估值 62 亿美元相比,现在是当时的五倍。
根据一份声明,此次G 轮融资由富兰克林·邓普顿领投,亚马逊网络服务(Amazon Web Services)、谷歌母公司Alphabet旗下的capital Ventures和Salesforce Ventures也进行了参投,此前投资于Databricks的微软继续跟投。
这笔资金将用于加速 Databricks 的创新,并帮助公司继续扩大规模和支持 Lakehouse 的快速应用。
目前Databricks提供四种产品:Spark、 Delta Lake、MLflow和Koalas。
去年10月,彭博社援引知情人士透露,Databricks Inc.的业务与数据和分析软件制造商Snowflake Inc.完成业务整合后正在准备首次公开募股,这一切可能在2021年上半年到来。
与Snowflake业务有重合的Databricks能否上演Snowflake上市后的辉煌表现,也为投资人留下悬念。
01
Databricks 凭什么
由Apache Spark 初始成员创立的大数据初创公司 Databricks成立于2013年,据其官网介绍,该公司拥有5000多家客户,包括Royal Dutch Shell Plc、Conde Nast International Inc和Regeneron制药公司。
作为投资者的微软也是Databricks的合作伙伴,已将这家初创公司的软件版本整合到其云产品 Azure中。
“ Databricks将数据工程,科学和分析功能整合到一个开放的统一平台上,以便数据团队可以更快地进行协作和创新。”
目前Databricks提供四种产品:Spark、 Delta Lake、MLflow和Koalas。
据Databricks 首席执行官Ghodsi透露,Spark 之于 Databricks,就像 Hadoop 之于 Cloudera,或者NoSQL 数据库之于 MongoDB。Spark 确实是 Databricks 公司规划的关键部分,但也只是他们多元化 SaaS 产品的一个组成元素。
在Ghodsi看来,Delta Lake是迄今为止他们所做的最大的创新。目前,有超过 80%的用户在使用它。尽管该产品并没有Spark那么有名,但它是 Databricks 最有价值的项目。
而MLflow为数据科学家构建、测试和部署机器学习模型这个复杂的过程提供了标准化。
Koalas则为Spark和Pandos创建单一的机器框架,将这两种工具的使用简化。Ghodsi 表示,Koalas 可以让数据科学家在笔记本电脑上使用 Pandas 编程,然后调用几个 API 就可以将工作负载部署到大型的分布式 Spark 集群上。
另外,对于SaaS服务,Ghodsi 表示:“我们的业务模式跟其他的不一样,我们是云端托管的 SaaS 服务。在云端托管开源项目并把它们租给用户,这是一种更好的业务模式。这种模式的客户流失率更低,客户会更开心,利润增长更快”。
02
能否重演辉煌
去年10月,彭博社曾报道,Databricks 还处于 IPO 规划的早期阶段,公司正在与投资机构沟通,但尚未选定任何一家股票承销商。
与此同时,知情人士透露,Databricks Inc.的业务与数据和分析软件制造商Snowflake Inc.完成业务整合后正在准备首次公开募股,这一切可能在2021年上半年到来。
Databricks新一轮的融资使其估值达到280亿美元,也表明美国三大云服务提供商认识到,Databricks或可以重演Snowflake的辉煌。
同样,Snowflake的云软件可以帮助企业管理数据,Snowflake和Databricks之间存在业务重叠。
Ghodsi在2019年接受采访时表示:“我们是100%基于云计算的,这同样适用于Snowflake。”
Snowflake是2020年最大的IPO,也是有史以来最大的软件IPO。通常不参与IPO和科技公司的伯克希尔·哈撒韦公司也与Salesforce一起对Snowflake的IPO进行了投资。
SnowFlake 在 2020 年 9 月正式 IPO 时筹资 33.6 亿美元、市值达到 330 亿美元,此后市值更一度攀升至一千亿美元,远远高于其 IPO 前进行最后一轮融资时124亿美元的估值。