Ripple协议共识算法
Abstract
虽然存在多种针对Byzantine Generals Problem的共识算法,特别是与分布式支付系统相关的算法,但其中许多都因网络中所有节点需要同步通信的要求而导致高延迟问题。在本研究中,我们提出了一种新颖的共识算法,通过利用更大网络内的集体信任子网络来规避这一要求。我们证明,防止Sybil攻击所需的"信任"实际上不是全局性的,而是网络中每个节点的局部性的。
Ripple协议共识算法(RPCA)由所有节点每隔几秒应用一次,以维护网络的正确性和一致性。一旦达成共识,当前账本被视为"关闭",成为最后关闭的账本(last-closed ledger)。该算法的独特之处在于,它在维持对Byzantine故障的强大保障的同时实现了低延迟共识,使其适用于实时金融结算系统。
Introduction
分布式支付系统必须实现共识算法,以便在存在故障或恶意行为者的情况下及时正确地处理支付。比特币通过工作量证明(proof-of-work)来达成共识,这要求所有节点消耗计算资源来解决密码学难题。虽然这种方法提供了强大的安全保障,但它存在显著的缺点,包括高能耗、低交易吞吐量以及对于高价值交易可能延长至一小时或更长时间的确认延迟。
Ripple协议共识算法提供了一种不需要工作量证明的分布式共识新方法。取而代之的是,网络中的节点通过在几秒内达成共识的投票过程来集体同意交易集合。这种共识机制专门为全球支付网络的需求而设计,在这些网络中,低延迟和高吞吐量对于实际部署至关重要。
RPCA的关键创新在于它不要求网络中的所有节点彼此达成一致。相反,每个节点维护一个唯一节点列表(Unique Node List, UNL),其中包含它信任不会串通的其他节点。只要节点选择的UNL具有足够的重叠,且故障节点低于阈值百分比,网络就会达成共识。这种方法在以秒而非分钟或小时来衡量共识延迟的同时,提供了支付系统所需的安全保障。
Definition of Consensus
在分布式系统中,共识是指即使存在故障或恶意参与者,节点网络也能就共享状态达成一致的过程。共识算法必须满足三个基本属性:正确性(没有两个正确的节点做出不同的决定)、一致性(所有正确的节点达成相同的决定)和终止性(所有正确的节点最终都会做出决定)。这些属性确保分布式系统表现得如同一个单一的、可靠的节点。
达成共识的挑战源于分布式系统固有的不可靠性。节点可能崩溃,消息可能延迟或丢失,Byzantine节点可能任意或恶意地行为。Lamport、Shostak和Pease形式化的Byzantine Generals Problem捕捉了这一挑战:当一部分进程可能存在故障且通信不可靠时,一组进程如何能够达成一致?
分布式计算的经典结果确立了共识算法所能达到的基本限制。FLP不可能性结果表明,如果即使一个节点可能失败,在异步系统中没有确定性算法可以保证达成共识。因此,实用的共识算法必须在安全性(永远不会达成错误的共识)和活性(始终保持进展)之间做出权衡。比特币的工作量证明优先考虑安全性而非活性,而RPCA通过在有限时间内完成共识轮次,同时在现实的故障假设下维持强大的安全性保障,从而实现了更适合支付系统的平衡。
Existing Consensus Algorithms
已经有多种共识算法被提出来解决分布式系统中的Byzantine Generals Problem。由Castro和Liskov引入的Practical Byzantine Fault Tolerance(PBFT)算法可以在3f+1个节点的系统中容忍最多f个Byzantine故障。PBFT通过所有节点之间的多轮消息交换来达成共识,通信复杂度为O(n^2),其中n为节点数量。虽然PBFT提供了强大的安全性保障和小型网络中相对较低的延迟,但由于二次通信开销,它无法良好地扩展到大型网络。
由Lamport开发的Paxos及其变体在异步系统中提供共识,但假设的是崩溃故障而非Byzantine故障。Paxos通过一系列轮次达成共识,其中提议者建议值,接受者进行投票。虽然Paxos可以容忍任意消息延迟和进程崩溃,但处理Byzantine故障需要精心的工程设计,并且在某些场景中可能发生活锁(livelock)。
比特币的工作量证明共识算法采取了根本不同的方法,使Byzantine攻击在经济上不可行。节点竞争解决密码学难题,获胜者提议下一个交易区块。虽然这种方法可以扩展到任意网络规模并处理Byzantine故障,但它有严重的缺点:大量的能源消耗(比特币网络估计每年超过1.5亿美元)、长确认延迟(高价值交易通常为40-60分钟)以及有限的吞吐量(大约每秒7笔交易)。这些限制使得工作量证明不适合许多需要快速结算和高交易量的支付系统应用。
Ripple Protocol Consensus Algorithm
共识算法">Ripple协议共识算法(RPCA)从每个服务器收集所有尚未应用的有效交易作为候选交易开始。然后服务器遵循多轮协议,迭代地就当前账本应用的交易集达成一致。在每一轮中,服务器提出它们认为应该包含在下一个账本中的交易提案。
在每个共识轮次中,服务器将其提案传达给唯一节点列表(UNL)中的其他服务器。然后服务器计算哪些交易出现在阈值百分比以上的提案中。最初,该阈值设置为50%,意味着交易必须出现在服务器UNL中至少一半的提案中才能被考虑进入下一轮。随着共识通过连续轮次的推进,该阈值逐步提高(通常到60%、70%,最终到80%)。
当一笔交易在服务器的UNL中达到80%的绝对多数支持阈值时,它将被包含在该服务器最终共识轮次的提案中。网络中所有达到该阈值的交易被应用到账本上,账本随后被加密哈希和签名。这个新验证的账本成为最后关闭的账本,流程以下一组候选交易重新开始。
共识过程通常在5秒或更短时间内完成,大多数交易只需要一个共识轮次即可达到绝对多数阈值。在一轮中未达成共识的交易仍作为后续轮次的候选。这种设计确保网络持续推进,同时维持强大的安全性保障,因为没有任何交易可以在没有受信任验证者绝对多数支持的情况下被应用到账本上。
Formal Analysis of Convergence
RPCA的正确性关键取决于网络中不同节点选择的UNL之间的重叠。令UNL_i表示节点i的唯一节点列表,UNL_i ∩ UNL_j表示同时出现在UNL_i和UNL_j中的节点集合。为使网络维持共识,我们要求对于任意两个节点i和j,其UNL的交集相对于任一UNL的最大规模必须足够大。

具体而言,当对所有节点对i和j满足|UNL_i ∩ UNL_j| / max(|UNL_i|, |UNL_j|) 1/5时,协议保证安全性。该条件确保即使Byzantine节点试图使网络的不同部分达成不同的共识决定,受信任节点的重叠也能防止分叉。如果该条件成立且任何UNL中Byzantine节点少于1/5,则所有正确节点将达成相同的共识决定。
形式化证明通过证明如果两个节点可以达成不同的共识决定,则必定存在某笔交易T出现在一个节点的最终账本中但不在另一个节点的账本中来进行。要发生这种情况,T必须在第一个节点的UNL中获得80%的支持,但在第二个节点的UNL中获得不到80%的支持。然而,考虑到重叠要求和对Byzantine节点的约束,可以证明这种情况是不可能的:如果T在UNL_i中获得80%的支持,它必须在满足重叠条件的任何UNL_j中至少获得60%的支持,经过足够的共识轮次,这将收敛到80%或被两个节点都拒绝。
活性属性——共识最终会达成——来自于包含阈值通过共识轮次确定性地增加这一观察。即使在存在Byzantine节点和网络延迟的情况下,协议也确保由诚实节点绝对多数支持的交易最终会被包含,而缺乏此类支持的交易将被排除。共识的有限时间(通常5秒)为支付系统应用提供了实用的活性保障。
Unique Node Lists
节点列表">唯一节点列表(UNL)是RPCA区别于其他共识算法的基本组件。Ripple网络中的每个节点维护一个UNL,包含它信任不会串通欺骗网络的其他节点。关键的是,这种信任是局部的而非全局的:不同的节点可以有不同的UNL,不需要全局统一的验证者集合。这种设计允许网络在保持去中心化的同时有机地扩展。

UNL作为一种无需工作量证明的Sybil攻击防御机制。在简单的投票系统中,攻击者可以创建许多假名节点以获得不成比例的影响力。通过要求每个节点明确选择它信任的其他节点,RPCA确保创建额外的身份不会带来任何优势,除非这些身份能够说服现有节点将其添加到UNL中。这将Sybil抵抗的问题从计算支出转移到了声誉和信任关系上。
为使网络正确运行,UNL必须按照形式化分析中所述选择具有足够重叠的列表。在实践中,这意味着虽然每个节点运营者在选择UNL方面拥有自主权,但必须确保其列表中包含网络其他部分也信任的验证者。Ripple提供了一个由多元化实体运营的验证者组成的默认UNL,但节点运营者可以根据自己的信任评估自由修改此列表。
UNL机制还提供了一条通向渐进式去中心化的自然路径。在网络的早期阶段,更集中的验证者集合可能更适合确保稳定性和可靠性。随着网络的成熟和更多多元化运营者证明其可信度,UNL可以演变为包含更广泛的验证者集合,在不损害安全属性的情况下增强网络的韧性和去中心化程度。
Simulation Code
为验证RPCA的理论分析并评估其在各种条件下的性能,使用定制的仿真软件进行了大量模拟。仿真框架对节点网络进行建模,每个节点维护自己的UNL并参与共识协议。代码实现了完整的RPCA算法,包括交易提案、阈值递增的投票轮次和账本验证。
模拟中变化的关键参数包括网络规模(从10到1,000个节点)、Byzantine节点的百分比(从0%到20%)、UNL大小(通常在5到50个节点之间)和网络拓扑配置。对于每种参数配置,使用不同的随机种子进行了多次模拟运行,以确保结果的统计有效性。模拟跟踪了包括共识延迟、分叉概率和交易吞吐量在内的指标。
模拟结果证实了关于收敛和安全性的理论预测。在UNL重叠条件满足且Byzantine节点占每个UNL不到20%的所有配置中,网络成功达成共识且未出现分叉。共识延迟始终保持较低水平(通常在3-5秒的模拟时间内完成),与网络规模无关,证明了算法的可扩展性。即使有15%的Byzantine节点积极尝试破坏共识,只要满足UNL重叠要求,网络仍保持正确性。
额外的模拟探索了边缘情况和故障场景,包括网络分区、UNL组成的突然变化和Byzantine节点的协调攻击。这些模拟提供了关于协议鲁棒性的洞察,并为UNL选择和网络运营的推荐最佳实践提供了参考。完整的模拟代码已公开发布,以便进行独立验证和进一步研究。
Discussion
与比特币的工作量证明共识相比,RPCA为支付系统应用提供了几个显著优势。最值得注意的是,共识延迟从40-60分钟(高价值比特币交易通常建议的时间)减少到约5秒。这一改进使RPCA适用于需要近乎即时结算的销售点和其他应用。此外,RPCA与工作量证明相比所需的计算资源极少,消除了与比特币挖矿相关的大量能源消耗。
然而,这些优势伴随着不同的信任假设。比特币的安全性仅依赖于没有攻击者控制网络计算能力50%以上的假设,而RPCA要求节点选择具有足够重叠的UNL,并且Byzantine节点不超过这些UNL内的阈值。这将部分做出审慎信任决策的责任转移给了节点运营者。在实践中,对于参与机构拥有现有信任关系的许多支付系统用例,这种权衡是可以接受的。
网络拓扑和UNL选择策略显著影响共识系统的属性。所有节点在UNL中包含相同验证者的高度集中化拓扑最大化了安全性,但如果这些验证者不可用,可能会降低活性。相反,UNL重叠最小的高度去中心化拓扑可能改善活性,但如果重叠变得过于稀疏,则存在共识失败的风险。找到最佳平衡需要仔细考虑特定的部署场景和风险承受能力。
未来的研究可以探索在最大化去中心化的同时自动维护重叠要求的自适应UNL选择算法、节点根据观察到的验证者行为动态调整UNL的机制,以及可以容忍更高比例Byzantine节点的共识算法扩展。这些增强可以进一步提高RPCA在大规模分布式支付系统中的鲁棒性和适用性。
Conclusion
共识算法">Ripple协议共识算法代表了支付系统分布式共识的重要进步。通过利用集体信任的子网络而非要求所有节点之间的全局一致,RPCA在维持对Byzantine故障的强大保障的同时,在几秒内达成共识。形式化分析表明,只要UNL以足够的重叠选择且Byzantine节点保持在阈值以下,网络将达成正确的共识而不会出现分叉。
本研究的实际意义超越了Ripple支付网络。RPCA表明,共识延迟与安全保障之间的传统权衡可以通过精心的协议设计和局部信任关系的使用来克服。这种方法可能适用于其他低延迟至关重要且参与者拥有现有信任关系的分布式系统,如银行间结算系统、供应链跟踪以及其他金融基础设施应用。
RPCA在生产系统中的部署验证了算法的性能特征和鲁棒性。Ripple网络以一致的3-5秒共识延迟处理每秒数千笔交易,证明了理论属性有效地转化为实际运营。随着网络继续演进并纳入来自多元化运营者的额外验证者,它提供了一个去中心化共识系统如何在规模上同时维持安全性和性能的实际案例。
References
Lamport, L., Shostak, R., and Pease, M. (1982). "The Byzantine Generals Problem." ACM Transactions on Programming Languages and Systems, 4(3):382-401. 这篇开创性论文形式化了在具有故障组件的分布式系统中达成共识的问题,并建立了Byzantine fault-tolerant系统的理论基础。
Castro, M., and Liskov, B. (1999). "Practical Byzantine Fault Tolerance." Proceedings of the Third Symposium on Operating Systems Design and Implementation (OSDI). 该研究引入了PBFT,表明Byzantine fault tolerance可以以实用的性能实现,尽管O(n^2)的通信复杂度限制了可扩展性。
Nakamoto, S. (2008). "Bitcoin: A Peer-to-Peer Electronic Cash System." 该白皮书引入了工作量证明共识作为数字货币中双重支付问题的解决方案,以高延迟和能源消耗为代价实现了无需可信方的去中心化共识。
Lamport, L. (1998). "The Part-Time Parliament." ACM Transactions on Computer Systems, 16(2):133-169. 该论文提出了Paxos算法,在崩溃故障下的异步系统中达成共识,影响了后续共识协议的设计。
Fischer, M. J., Lynch, N. A., and Paterson, M. S. (1985). "Impossibility of Distributed Consensus with One Faulty Process." Journal of the ACM, 32(2):374-382. FLP不可能性结果确立了异步系统中共识算法所能达到的基本限制,塑造了实用共识协议的设计空间。
Related Whitepapers
Solana
Solana: A new architecture for a high performance blockchain
19 shared concepts · 2017
Dogecoin
Dogecoin: A Community-Driven Cryptocurrency
20 shared concepts · 2013
Bitcoin Cash
Bitcoin Cash: Peer-to-Peer Electronic Cash for the World
21 shared concepts · 2017
Tether
Tether: Fiat currencies on the Bitcoin blockchain
16 shared concepts · 2016
USD Coin
USD Coin (USDC): A Stablecoin by Circle and Coinbase
9 shared concepts · 2018
常见问题
- 什么是XRP Ledger白皮书?
- XRP Ledger白皮书描述了Ripple协议共识算法(RPCA),这是一种拜占庭容错共识机制,能够在无需挖矿的情况下实现快速、低成本的跨境支付。
- XRP的共识机制是如何运作的?
- XRP采用联邦共识模型,由可信验证节点(唯一节点列表,UNL)对交易有效性进行投票。共识在3至5秒内达成,无需工作量证明挖矿。
- XRP Ledger白皮书由谁撰写,是何时发布的?
- XRP Ledger共识白皮书由David Schwartz、Noah Youngs和Arthur Britto共同撰写,于2014年发布,而XRP Ledger本身于2012年上线。
- XRP的核心技术创新是什么?
- XRP的核心创新是Ripple协议共识算法(RPCA),它通过可信验证者之间的迭代投票轮次来达成共识,而非依赖挖矿。这使得结算可在3至5秒内完成,且能耗极低。
- XRP与Bitcoin有何不同?
- XRP不使用挖矿——它通过可信验证者的联邦模型达成共识,结算时间为3至5秒,而Bitcoin约需10分钟。XRP为预挖模式,总供应量固定为1,000亿枚。
- XRP的供应模型是什么?
- XRP总供应量为1,000亿枚,均在创世时创建。Ripple Labs持有相当大的份额并锁仓,每月最多释放10亿枚XRP。少量交易手续费会被销毁,使XRP略呈通缩态势。
- XRP的主要用途是什么?
- XRP主要用于跨境支付和汇款。金融机构通过RippleNet实现实时全额结算、货币兑换,并管理国际走廊中的流动性。
- XRP解决了什么问题?
- XRP解决了国际汇款效率低下的问题。传统上,通过代理行(SWIFT)的跨境汇款需要3至5个工作日。XRP Ledger能够以极低的成本实现近乎即时的结算。
- XRP的安全模型是如何运作的?
- XRP的安全性依赖于唯一节点列表(UNL)——每个节点运营者自行配置的一组可信验证者。只要任何UNL中存在故障的验证者不超过20%,网络就能保持安全性和活性。
- XRP生态系统的现状如何?
- XRP生态系统包括用于机构支付的RippleNet、不断扩展的DeFi生态(原生集成了AMM自动做市商)、通过XLS-20标准实现的NFT支持、侧链,以及在Ripple与SEC诉讼结束后日益增长的机构采用率。