分布式系统基础论文 - muratbuffalo

21-03-02 banq

这是我在分布式系统领域的基础论文汇编。(我专注于核心分布式系统领域,不涉及网络,安全性,分布式分类帐,验证工作等。我甚至没有涉及分布式事务,希望以后再讨论它们。) 

我按主题对论文进行了分类,并按时间顺序列出了它们。在每个部分的末尾,我还列出了说明文和博客文章。

 

分布式系统中的时间和状态

分布式系统中的时间,时钟和事件顺序。莱斯利·兰普特(Leslie Lamport)1978年ACM的报告。

分布式快照:确定分布式系统的全局状态。K. Mani Chandy Leslie Lamport,ACM Transactions on Computer Systems,1985年。

虚拟时间和分布式系统的全局状态。 Mattern,F.,1988年。

说明文和博客文章:

现在没有了。Justin Sheehy,《 2015年ACM队列》

为什么逻辑时钟很容易。Carlos Baquero和NunoPreguiça,ACM Queue 2016。

混合逻辑时钟

TLA + / PlusCal中的逻辑时钟和矢量时钟建模

 

不可能结果 

协同攻击或“两个将军”问题在分布式系统中是根本不可能的。它开始了更多的人定理,因此,我没有指向论文,而是提供了到维基百科页面的链接。 

带有一个错误过程的分布式共识的可能性,Fischer,Lynch和Patterson,JACM,1985年

《可靠的分布式系统的不可靠故障检测器》,Tushar Deepak Chandra和Sam Toueg,ACM杂志,1996年。

收获,产量和可扩展的耐性系统,阿曼多·福克斯(Armando Fox),埃里克·A·布鲁尔(Eric A. Brewer),1999年

CAP十二年后:规则如何更改,埃里克·布鲁尔(Eric Brewer),2012年。

说明文和博客文章:

FLP不可能简介

论文摘要:CAP定理的观点

 

共识和状态机复制

带有时间戳的复制:一种新的主​​副本方法,用于支持高度可用的分布式系统。B. Oki和B. Liskov。1988年

使用状态机方法实现容错服务:教程,Fred Schneider,1990年

如何建立一个具有高度共识的高可用性系统, Butler Lampson,1996年

兼职议会(Paxos) Leslie Lamport,1998年。(请参阅上下文) 

实用的拜占庭式容错。米格尔·卡斯特罗(Miguel Castro),芭芭拉·里斯科夫(Barbara Liskov)。OSDI 1999。

支持高吞吐量和可用性的链复制。Robbert van Renesse和Fred B.Schneider,OSDI,2004年。 

ZooKeeper:Internet级系统的无等待协调。帕特里克·亨特(Patrick Hunt),马哈德夫·科纳尔(Mahadev Konar),弗拉维奥·P·琼奎拉(Flavio P.

Tango:共享日志上的分布式数据结构,Mahesh Balakrishnan,Dahlia Malkhi,Ted Wobber,Ming Wu,Vijayan Prabhakaran,Michael Wei,John D.Davis,Sriram Rao,Tao Zou,Aviad Zuckk。SOSP 2013年。

在平均议会中达成了更多共识。尤利安·莫拉鲁(Iulian Moraru),大卫·安德森(David G.Andersen),迈克尔·卡明斯基(Michael Kaminsky),SOSP 2013。

灵活的Paxos:重新讨论了Quorum交集。海蒂·霍华德(Heidi Howard),大丽花·马基(Dahlia Malkhi)和亚历山大·斯皮格曼(Alexander Spiegelman)。2016年。

WormSpace:简单,可验证的分布式系统的模块化基础。Shin Ji-Yong Shin,Jiung Kim,Wolf Honore,HernánVanzetto,Srihari Radhakrishnan,Mahesh Balakrishnan,Zhong Shao,SOCC'19。 

说明文和博客文章:

寻找一种可以理解的共识算法。Diego Ongaro,John Ousterhout,Usenix ATC,2014年。 

Paxos会中度复杂。Robbert Van Renesse和Deniz Altinbuken,ACM计算调查,2015年。

云中的共识:Paxos Systems神秘化。艾丽丹妮·艾丽江(Ailidani Ailijiang),阿莱克西·夏拉普科(Aleksey Charapko),穆拉特·德米尔巴斯(Murat Demirbas),2016年。

在Pluscal和TLA +中建模Paxos和Flexible Paxos

剖析Paxos协议的性能瓶颈。

 

分布式算法

尽管有分布式控制但自稳定系统,Edsgar W. Dijkstra,CACM 1974年。

《饮酒者问题》,KM Chandy,J。Misra,ACM TOPLAS 1984

稀疏分区,Baruch Awerbuch,David Peleg,FOCS 1990。 

分布式重置,Anish Arora,穆罕默德·古达(Mohamed Gouda),1994年

《箭式分布式目录协议》,Michael J. Demmer,M。Herlihy,DISC,1998年。 

说明文和博客文章:

Dijkstra的稳定令牌环算法

在TLA +中建模卫生餐饮哲学家算法

 

其他各种各样

有关计算机系统设计的提示,巴特勒·兰普森(Butler Lampson),1983年

分布式状态的作用,约翰·奥斯特豪特(John Ousterhout),1990年

SEDA:一种条件良好的可扩展Internet服务的体系结构。Matt Welsh,David Culler和Eric Brewer,SOSP 2001

只会崩溃的软件,George Candea,Armando Fox,HotOS 2003

说明文和博客文章:

了解分布式系统:从哪里开始?

 

云计算,大数据存储/处理 

大规模服务的经验教训。埃里克·布鲁尔(Eric A.Brewer),IEEE互联网计算,2001年。

MapReduce:大型集群上的简化数据处理。Jeffrey Dean和Sanjay Ghemawat,OSDI,2004年。

乐观复制,Saito Yasushi和Marc Shapiro,2005。

Dynamo:亚马逊的高可用键值存储。Giuseppe DeCandia,Deniz Hastorun,Madan Jampani,Gunavardhan Kakulapati,Avinash Lakshman,Alex Pilchin,Swaminathan Sivasubramanian,Peter Vosshall和Werner Vogels,ACM SIGOPS 2007。

关于设计和部署Internet规模服务,James Hamilton,LISA 2007 

分布式事务之外的生活:叛教者的观点,Pat Helland,CIDR 2007。

无冲突的复制数据类型。Marc Shapiro,NunoPreguiça,Carlos Baquero,Marek Zawirski,2011年。

《 Bloom中的一致性分析:一种CALM和汇总方法》,Peter Alvaro,Neil Conway,Joseph M. Hellerstein,William R. Marczak,CIDR 2011。 

弹性分布式数据集:用于内存中群集计算的容错抽象。Matei Zaharia,Mosharaf Chowdhury,Tathagata Das,Ankur Dave,Justin Ma,Murphy McCauley,Michael J.Franklin,Scott Shenker,Ion Stoica。NSDI 2012。 

尾巴规模大。杰夫·迪恩(Jeff Dean),路易斯·安德烈·巴罗佐(Luiz Andre Barroso),美国ACM协会成员,2013年。 

Spanner:Google的全球分布式数据库,ACM,2013年。

TensorFlow:大规模机器学习系统,OSDI 2016。

说明性论文:

云之上:伯克利对云计算的看法。Michael Armbrust,Armando Fox,Rean Griffith,Anthony D.Joseph,Randy H.Katz,Andrew Konwinski,Gunho Lee,David A.Patterson,Ariel Rabkin,Ion Stoica,Matei Zaharia,2009年。

简化的云编程:无服务器计算的Berkeley观点,2019年。 

猜你喜欢