分布式系统基础论文 - muratbuffalo


这是我在分布式系统领域的基础论文汇编。(我专注于核心分布式系统领域,不涉及网络,安全性,分布式分类帐,验证工作等。我甚至没有涉及分布式事务,希望以后再讨论它们。) 
我按主题对论文进行了分类,并按时间顺序列出了它们。在每个部分的末尾,我还列出了说明文和博客文章。
 
分布式系统中的时间和状态
分布式系统中的时间,时钟和事件顺序。莱斯利·兰普特(Leslie Lamport)1978年ACM的报告。
分布式快照:确定分布式系统的全局状态。K. Mani Chandy Leslie Lamport,ACM Transactions on Computer Systems,1985年。
虚拟时间和分布式系统的全局状态。 Mattern,F.,1988年。
说明文和博客文章:
现在没有了。Justin Sheehy,《 2015年ACM队列》
为什么逻辑时钟很容易。Carlos Baquero和NunoPreguiça,ACM Queue 2016。
混合逻辑时钟
TLA + / PlusCal中的逻辑时钟和矢量时钟建模
 
不可能结果 
协同攻击或“两个将军”问题在分布式系统中是根本不可能的。它开始了更多的人定理,因此,我没有指向论文,而是提供了到维基百科页面的链接。 
带有一个错误过程的分布式共识的可能性,Fischer,Lynch和Patterson,JACM,1985年
《可靠的分布式系统的不可靠故障检测器》,Tushar Deepak Chandra和Sam Toueg,ACM杂志,1996年。
收获,产量和可扩展的耐性系统,阿曼多·福克斯(Armando Fox),埃里克·A·布鲁尔(Eric A. Brewer),1999年
CAP十二年后:规则如何更改,埃里克·布鲁尔(Eric Brewer),2012年。
说明文和博客文章:
FLP不可能简介
论文摘要:CAP定理的观点
 
共识和状态机复制
带有时间戳的复制:一种新的主​​副本方法,用于支持高度可用的分布式系统。B. Oki和B. Liskov。1988年
使用状态机方法实现容错服务:教程,Fred Schneider,1990年
如何建立一个具有高度共识的高可用性系统, Butler Lampson,1996年
兼职议会(Paxos) Leslie Lamport,1998年。(请参阅上下文) 
实用的拜占庭式容错。米格尔·卡斯特罗(Miguel Castro),芭芭拉·里斯科夫(Barbara Liskov)。OSDI 1999。
支持高吞吐量和可用性的链复制。Robbert van Renesse和Fred B.Schneider,OSDI,2004年。 
ZooKeeper:Internet级系统的无等待协调。帕特里克·亨特(Patrick Hunt),马哈德夫·科纳尔(Mahadev Konar),弗拉维奥·P·琼奎拉(Flavio P.
Tango:共享日志上的分布式数据结构,Mahesh Balakrishnan,Dahlia Malkhi,Ted Wobber,Ming Wu,Vijayan Prabhakaran,Michael Wei,John D.Davis,Sriram Rao,Tao Zou,Aviad Zuckk。SOSP 2013年。
在平均议会中达成了更多共识。尤利安·莫拉鲁(Iulian Moraru),大卫·安德森(David G.Andersen),迈克尔·卡明斯基(Michael Kaminsky),SOSP 2013。
灵活的Paxos:重新讨论了Quorum交集。海蒂·霍华德(Heidi Howard),大丽花·马基(Dahlia Malkhi)和亚历山大·斯皮格曼(Alexander Spiegelman)。2016年。
WormSpace:简单,可验证的分布式系统的模块化基础。Shin Ji-Yong Shin,Jiung Kim,Wolf Honore,HernánVanzetto,Srihari Radhakrishnan,Mahesh Balakrishnan,Zhong Shao,SOCC'19。 
说明文和博客文章:
寻找一种可以理解的共识算法。Diego Ongaro,John Ousterhout,Usenix ATC,2014年。 
Paxos会中度复杂。Robbert Van Renesse和Deniz Altinbuken,ACM计算调查,2015年。
云中的共识:Paxos Systems神秘化。艾丽丹妮·艾丽江(Ailidani Ailijiang),阿莱克西·夏拉普科(Aleksey Charapko),穆拉特·德米尔巴斯(Murat Demirbas),2016年。
在Pluscal和TLA +中建模Paxos和Flexible Paxos
剖析Paxos协议的性能瓶颈。
 
分布式算法
尽管有分布式控制但自稳定系统,Edsgar W. Dijkstra,CACM 1974年。
《饮酒者问题》,KM Chandy,J。Misra,ACM TOPLAS 1984
稀疏分区,Baruch Awerbuch,David Peleg,FOCS 1990。 
分布式重置,Anish Arora,穆罕默德·古达(Mohamed Gouda),1994年
《箭式分布式目录协议》,Michael J. Demmer,M。Herlihy,DISC,1998年。 
说明文和博客文章:
Dijkstra的稳定令牌环算法
在TLA +中建模卫生餐饮哲学家算法
 
其他各种各样
有关计算机系统设计的提示,巴特勒·兰普森(Butler Lampson),1983年
分布式状态的作用,约翰·奥斯特豪特(John Ousterhout),1990年
SEDA:一种条件良好的可扩展Internet服务的体系结构。Matt Welsh,David Culler和Eric Brewer,SOSP 2001
只会崩溃的软件,George Candea,Armando Fox,HotOS 2003
说明文和博客文章:
了解分布式系统:从哪里开始?
 
云计算,大数据存储/处理 
大规模服务的经验教训。埃里克·布鲁尔(Eric A.Brewer),IEEE互联网计算,2001年。
MapReduce:大型集群上的简化数据处理。Jeffrey Dean和Sanjay Ghemawat,OSDI,2004年。
乐观复制,Saito Yasushi和Marc Shapiro,2005。
Dynamo:亚马逊的高可用键值存储。Giuseppe DeCandia,Deniz Hastorun,Madan Jampani,Gunavardhan Kakulapati,Avinash Lakshman,Alex Pilchin,Swaminathan Sivasubramanian,Peter Vosshall和Werner Vogels,ACM SIGOPS 2007。
关于设计和部署Internet规模服务,James Hamilton,LISA 2007 
分布式事务之外的生活:叛教者的观点,Pat Helland,CIDR 2007。
无冲突的复制数据类型。Marc Shapiro,NunoPreguiça,Carlos Baquero,Marek Zawirski,2011年。
《 Bloom中的一致性分析:一种CALM和汇总方法》,Peter Alvaro,Neil Conway,Joseph M. Hellerstein,William R. Marczak,CIDR 2011。 
弹性分布式数据集:用于内存中群集计算的容错抽象。Matei Zaharia,Mosharaf Chowdhury,Tathagata Das,Ankur Dave,Justin Ma,Murphy McCauley,Michael J.Franklin,Scott Shenker,Ion Stoica。NSDI 2012。 
尾巴规模大。杰夫·迪恩(Jeff Dean),路易斯·安德烈·巴罗佐(Luiz Andre Barroso),美国ACM协会成员,2013年。 
Spanner:Google的全球分布式数据库,ACM,2013年。
TensorFlow:大规模机器学习系统,OSDI 2016。
说明性论文:
云之上:伯克利对云计算的看法。Michael Armbrust,Armando Fox,Rean Griffith,Anthony D.Joseph,Randy H.Katz,Andrew Konwinski,Gunho Lee,David A.Patterson,Ariel Rabkin,Ion Stoica,Matei Zaharia,2009年。
简化的云编程:无服务器计算的Berkeley观点,2019年。