yarn||沉潜飞动|君子藏器于身，待时而动。

yarn

2016-03-31 hadoop集群部署(yarn)

伴随着各大互联网公司开源自己的大数据框架，大数据处理领域的框架已经比较完善。到现在所谓大数据的框架已经用过habase（后来换成了elasticsearch）、zookeeper、kafka、storm，根据项目计划，接下来还要使用spark。虽然在众多框架中仅仅几个，但是也是已经涉及多个方面：数据存储、分布式协调、消息、实时计算等。没有找到任何一个框架能够完美解决所有问题，也就应了那句话，开发领域根本就没有银色子弹。所以即使是比较年长的hadoop（2004年到现在已经12年了，年纪也比较大了），也有能够体现其价值的地方。

最近用了storm，部署topology的时候总是感觉资源使用不平衡，于是想到了yarn能够对hadoop实现资源的协调，那是不是可以扩展一下，对storm也提供资源协调呢。google一下，果然yahho!已经开源了一个storm-yarn组件，于是学习一下，同时也把hadoop的部署复习了一遍。（关于hadoop的单机部署、伪分布式部署可以查看Hadoop环境部署）
2017-07-11 YARN架构

对Hadoop有过了解的都知道，Hadoop经历过很长一段时间的版本号混乱和架构调整，YARN是Hadoop 2.0（或者早期的0.23.x）提出的资源管理、任务调度框架。解决了很多Hadoop 1.0（或者0.21.x、0.22.x）时代的痛点。

随着发展，YARN不仅仅是Hadoop的资源调度框架，还成为一个通用的资源调度管理器，可以将各种各样的计算框架通过YARN管理起来，比如Strom、Spark等。

YARN的基本思想是将资源管理和作业调度/监控的功能分为独立的守护进程。分别是一个全局的 ResourceManager（RM）和每个应用程序的 ApplicationMaster（AM）。应用程序可以是一个job作业或者一组job作业的有向无环图（DAG）。

ResourceManager负责系统中的所有应用程序的资源分配。NodeManager负责每台机器中容器代理、资源监控（cpu，内存，磁盘，网络），并将这些情况报告给ResourceManager或Scheduler。

每个应用的ApplicationMaster是一个框架特定的库，从ResourceManager协商资源，并与NodeManager共同执行监听任务。

从结构上看，YARN是主/从架构，一个ResourceManager，多个NodeManager，共同构成了数据计算框架。

yarn

标签云

最新文章

归档