对话 Vana 创始人:高中辍学,从美联储到 Y Combinator,辗转 Web3,踏上去中心化数据的追寻之旅
访谈导读
我和Anna是在Flock.io组织的ETHcc分会场活动上认识的。当时我已经在各种热点项目和VC论坛之间疲惫不堪,内容乏味重复,直到Anna出现。她的风格与其他Web3创始人不同,清爽利落,仿佛看到一位对个人项目充满激情的高中女生。她的演讲让我停住脚步,继续听了下去。
有意思的是,我曾采访过Flock的创始人,他们的项目涉及去中心化数据贡献,但Flock偏向于公有数据,而Vana则专注于私有数据。当我在推特上搜索Anna时,才发现她的项目不仅获得Paradigm和Polychain等顶级投资人的青睐,而且她本人也并非高中生,而是早早辍学并进入硅谷YCombinator的创业者。后来,我们约定了一次咖啡店的访谈,深入探讨她的经历。
Anna曾在MIT就读,与Optimism、Blur和Glow的创始人是同窗。那么在信息、教育和资本的前沿,这些才华横溢的创始人如何看待他们的人生与事业?此次访谈为你揭晓。
Vana简介
Vana是一个去中心化平台,致力于在Web3领域革新数据所有权和人工智能开发。平台的核心理念包括:
数据所有权和可移植性:Vana赋能用户控制并管理自己的个人数据,让数据在不同应用之间自由流动,并以类似于加密货币钱包的方式,非托管地存储数据。
去中心化AI开发:用户可以贡献数据来训练AI模型,并获得所贡献模型的所有权份额。开发者则能够利用跨平台数据来构建个性化应用,训练先进的AI模型。
数据流动性和变现:Vana引入了数据流动池(DLP),激励用户提供有价值的数据并进行验证。用户通过向这些池子贡献数据来实现数据变现,数据被视为一种灵活、可模块化的金融资产。
生态系统和应用:Vana正在构建一系列去中心化应用和数据集体,如Reddit数据的r/datadao、Twitter/X数据的Volara市场、以及让用户控制其交友应用数据的Flirtual平台。
技术基础设施:Vana开发了一个专门为数据交易和隐私设计的Layer1区块链,通过多层架构(包括数据可移植层和数据流动层),以及UniversalConnectome,映射生态系统中的数据流动。
Vana致力于为用户带来全新的数据所有权、AI开发和价值创造模式,赋能个人并推动人工智能领域的创新。
访谈总结
从美联储实习到YCombinator:Anna分享了她从高中时期在美联储实习到世界银行的工作经历,如何通过自动化解决重复性任务,并最终辍学加入YCombinator开启创业旅程。
人工智能与数据所有权的发现:在MITBitcoinClub时,Anna发现了人工智能和去中心化数据之间的联系,特别是在数据的质量和所有权方面的挑战。她与联合创始人共同创立了Vana,致力于帮助用户从贡献的数据中受益。
Vana的使命与技术架构:Vana是一个去中心化平台,专注于私有数据所有权,允许用户通过数据流动池和代币机制变现他们的数据。Vana的技术基础设施基于Layer1区块链,确保数据隐私和可扩展性。
量化思维对Anna的影响:Anna从小对数字和概率建模敏感,这种量化思维帮助她形成了对人工智能和数据系统的独特看法,推动她探索如何通过AI模型和去中心化平台实现数据的商业化。
去中心化数据的挑战与机遇:Anna解释了在去中心化数据所有权领域的主要挑战,包括如何让用户理解他们数据的价值,并通过独特的代币经济模型解决这一问题,同时创造一个自给自足的数据驱动生态系统。
Vana的商业模式:通过数据交易模型和去中心化AI开发,Vana将数据视为金融资产,用户可以通过贡献数据获得AI模型的所有权并从中获利。
从美联储实习到YCombinator——Anna的创业旅程如何开始?
深潮TechFlow:你在高中时就曾在美联储实习,随后又在第二年进入了世界银行。这样的经历是如何塑造你后续的创业历程的?
Anna:
是的,这一切都始于明尼苏达州中央高中。我对经济学非常感兴趣,能够在高中期间进入美联储实习,对我这个年纪的人来说非常不寻常,但我非常坚定。我记得我的房间里还挂着一张珍妮特·耶伦的照片!后来我进入世界银行时,发现许多实习生都在做重复性的工作,而我希望通过自动化来简化这些工作。我编写了机器学习软件来帮助分类文件,结果比我预期的还要有影响力。正是在那时,我意识到数据和自动化可以真正改变我们处理大型组织任务的方式。于是,我从高中辍学加入了YCombinator,就是这样,我接触到了硅谷。
深潮TechFlow:是什么促使你高中就辍学并全职创业的?
Anna:
这在当时对我是一个重大的决定,但我意识到创业是一项巨大的承诺,几乎是一段长达5到10年的旅程。我喜欢解决问题的想法,但不仅仅是永远做自动化文档这件事。我的真正激情来自于看到人工智能如何发展,数据质量又是其中的核心。我开始思考如何将像加密货币这样的去中心化系统应用于数据所有权。这推动我和我的联合创始人ArtAbal一起创立了Vana,他当时在哈佛读研究生。
人工智能与区块链的交汇——Anna在MITBitcoinClub发现的灵感
深潮TechFlow:说到人工智能,你是什么时候首次看到它与去中心化数据和加密技术的联系的?
Anna:
我对人工智能的迷恋始于我在MITBitcoinClub的时候。我对经济计量学和数据建模非常感兴趣。在2017年,我看到了AttentionisAllYouNeed论文的发布,这篇论文后来成为ChatGPT的基础。我突然意识到,人工智能的一切都围绕数据展开——尤其是数据的质量和所有权。我想找到一种方式,让人们真正拥有他们贡献给人工智能系统的数据。从2018年开始,我和我的联合创始人就开始探索如何让用户从他们的数据所帮助构建的人工智能模型中受益。
为何选择Layer1?——Vana如何聚焦于私有数据所有权
深潮TechFlow:我了解到Vana的底层是一条EVMLayer1区块链。你能解释一下你为什么选择建立自己的Layer1吗?
Anna:
Vana被架构为一个专为私人数据设计的Layer1区块链。这是一个至关重要的决定,因为它允许我们拥有特定数据集的代币和特定模型的代币,这些代币是完全可编程的,并且与EVM以太坊虚拟机兼容。这使我们能够灵活地支持任何人工智能模型或数据集,同时确保用户能够控制自己的数据。Layer1的架构也有助于解决可扩展性和隐私问题,这对创建可持续的去中心化数据所有权生态系统至关重要。由于私人数据非常有价值,但在传统系统中难以变现,构建Vana作为Layer1使我们能够解决数据授权挑战,同时为大规模人工智能应用提供基础设施。
量化思维驱动下的AI愿景与去中心化数据的商业模式
在访谈中,Anna也分享了自己的成长经历。父亲是一位生物化学教授,母亲是作家,而自己从小就对数字非常敏感。
深潮TechFlow:听起来你从小就用量化的方式看待世界?
Anna:
完全正确!我一直对量化思维很感兴趣。这并不在于创造一个完美的模型,而在于让模型变得有用——理解改变一个元素会导致哪些不同的结果。这正是让我今天对人工智能和数据有独特看法的原因。例如,我非常喜欢概率建模,这在棒球分析中常常被使用。与其预测某个确定的结果,不如去建模各种概率——比如,如果球落在这里,那么击出全垒打的概率是多少?这种思维方式帮助我形成了对人工智能和数据系统的思考。
深潮TechFlow:鉴于你的量化思维优势,你对Vana什么时候能够实现收支平衡有什么预测吗?
Anna:
这是个好问题!鉴于我们的商业模式,收支平衡取决于数据贡献的规模和我们构建的人工智能模型的价值。从量化的角度来看,我们估计当我们拥有大约一亿用户贡献数据,并且有多个高价值的人工智能模型产生收入时,我们将处于实现收支平衡的有利位置。真正的挑战在于确保数据流的稳定和开发具有商业价值的AI模型。我认为具体时间取决于用户增长、AI模型的采用情况以及AI驱动解决方案的整体市场需求等各种因素。
深潮TechFlow:在建立公司方面,尤其是像去中心化数据所有权这样复杂的领域,主要的挑战是什么?
Anna:
最大的挑战之一是让人们理解他们私人数据的价值。早期我们尝试以现金或稳定币的方式支付用户的数据,但他们并不认同这种方式。这几乎让他们的贡献感觉贬值了。现在我们已经转向提供数据帮助创建的AI模型的所有权,这引起了更多的共鸣。人们希望感觉自己是更大事物的一部分,拥有AI模型的一部分的想法更具吸引力。我们在RedditDataDAO上看到了这一点——将近一百万个钱包注册了,其中约14万人通过了贡献证明,这意味着他们提供了有价值的Reddit数据。这比仅仅提供现金要有吸引力得多。
深潮TechFlow:你能解释一下Vana的商业模式以及它是如何产生收入的吗?
Anna:
Vana采用的是数据交易模型。每当数据通过我们的网络时,都会产生一笔小额费用——类似于Ethereum中的gas费用,用于覆盖运行网络的成本。随着越来越多的用户贡献他们的数据,并且越来越多的人工智能模型利用这些数据构建,系统就会变得自给自足。我们还为我们的非托管数据钱包申请了专利,并设计了数据流动池和特定模型的代币。这些代币允许用户同时拥有数据集和从这些数据集派生出来的AI模型,从而创建一个用户能够从他们数据的价值中获利的系统。例如,通过我们的Reddit数据集代币,用户可以集体拥有该数据集以及任何基于它构建的AI模型。随着这些模型变得越来越有价值,贡献数据的用户将能够从中受益。
深潮TechFlow:在如此复杂的系统中,你如何确保人们有动力贡献他们的数据?
Anna:
我们通过数据流动池和特定模型的代币系统取得了成功。例如,通过我们的RedditDataDAO,用户可以贡献他们的Reddit数据,并作为回报获得代表他们在数据集和任何生成的AI模型中所有权的代币。关键是让这对人们来说变得具体可感——他们不仅仅是交出数据,而是获得了更大事物的一部分所有权。我们已经从现金奖励转向更有意义的东西:用户贡献的数据帮助创建的AI模型的所有权。这对用户的吸引力大大增加。