云原生kubernetes服务发现原理图解
概述
上节分析了Prometheus
服务发现核心流程(如下图),Discoverer
基于不同协议发现采集点,通过channel
通知到updater
协程,然后更新到discoveryManager
结构体trargets
字段中,最终由sender
协程将discoveryManager
的targets
字段数据发送给scrape
采集模块。
(资料图)
Discoverer
定义的接口类型,不同的服务发现协议基于该接口进行实现:
type Discoverer interface { // Run hands a channel to the discovery provider (Consul, DNS, etc.) through which // it can send updated target groups. It must return when the context is canceled. // It should not close the update channel on returning. Run(ctx context.Context, up chan<- []*targetgroup.Group)}
k8s协议配置
Prometheus
本身就是作为云原生监控出现的,所以对云原生服务发现支持具有天然优势。kubernetes_sd_configs
服务发现协议核心原理就是利用API Server
提供的Rest接口
获取到云原生集群中的POD
、Service
、Node
、Endpoints
、Endpointslice
、Ingress
等对象的元数据,并基于这些信息生成Prometheus
采集点,并且可以随着云原生集群状态变更进行动态实时刷新。
❝
kubernetes
云原生集群的POD
、Service
、Node
、Ingress
等对象元数据信息都被存储到etcd
数据库中,并通过API Server
组件暴露的Rest
接口方式提供访问或操作这些对象数据信息。 ❞
「kubernetes_sd_configs
配置示例:」
- job_name: kubernetes-pod kubernetes_sd_configs: - role: pod namespaces: names: - "test01" api_server: https://apiserver.simon:6443 bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token tls_config: ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
配置说明:
api_server
指定API Server
地址,出于安全考虑,这些接口是带有安全认证的,bearer_token_file
和ca_file
则指定访问API Server
使用到的认证信息;role
指定基于云原生集群中哪种对象类型做服务发现,支持POD
、Service
、Node
、Endpoints
、Endpointslice
、Ingress
六种类型;namespaces
指定作用于哪个云原生命名空间下的对象,不配置则对所有的云原生命名空间生效;「为什么没有配置api server信息也可以正常进行服务发现?」
很多时候我们并不需要配置api server
相关信息也可以进行服务发现,如我们将上面示例简化如下写法:
- job_name: kubernetes-pod kubernetes_sd_configs: - role: pod namespaces: names: - "test01"
一般Prometheus
部署在监控云原生集群上,从 Pod
使用 Kubernetes API
官方客户端库(client-go
)提供了更为简便的方法:rest.InClusterConfig()
。 API Server
地址是从POD
的环境变量KUBERNETES_SERVICE_HOST
和KUBERNETES_SERVICE_PORT
构建出来, token
以及 ca
信息从POD
固定的文件中获取,因此这种场景下kubernetes_sd_configs
中api_server
和ca_file
是不需要配置的。
❝
client-go
是kubernetes
官方提供的go
语言的客户端库,go
应用使用该库可以访问kubernetes
的API Server
,这样我们就能通过编程来对kubernetes
资源进行增删改查操作。 ❞
Informer机制
从之前分析的服务发现协议接口设计得知,了解k8s
服务发现协议入口在discovery/kubernetes.go
的Run
方法:
Run
方法中switch
罗列出不同role
的处理逻辑,刚好和配置示例中role
支持的六种云原生对象类型对应,只是基于不同的对象进行服务发现,基本原理都是一致的。
云原生服务发现基本原理是访问API Server
获取到云原生集群资源对象,Prometheus
与API Server
进行交互这里使用到的是client-go
官方客户端里的Informer
核心工具包。Informer
底层使用ListWatch
机制,在Informer
首次启动时,会调用List API
获取所有最新版本的资源对象,缓存在内存中,然后再通过Watch API
来监听这些对象的变化,去维护这份缓存,降低API Server
的负载。除了ListWatch
,Informer
还可以注册自定义事件处理逻辑,之后如果监听到事件变化就会调用对应的用户自定义事件处理逻辑,这样就实现了用户业务逻辑扩展。
Informer
机制工作流程如下图:
Informer
机制本身比较复杂,这里先暂时不太具体说明,只需要理解Prometheus
使用Informer
机制获取和监听云原生资源对象,即上图中只有「绿色框部分是自定义业务逻辑」,其它都是client-go
框架informer
工具包提供的功能。
这其中的关键就是注册自定义AddFunc
、DeleteFunc
和UpdateFunc
三种事件处理器,分别对应增、删、改操作,当触发对应操作后,事件处理器就会被回调感知到。比如云原生集群新增一个POD
资源对象,则会触发AddFunc
处理器,该处理器并不做复杂的业务处理,只是将该对象的key
放入到Workqueue
队列中,然后Process Item
组件作为消费端,不停从Workqueue
中提取数据获取到新增POD
的key
,然后交由Handle Object
组件,该组件通过Indexer
组件提供的GetByKey()
查询到该新增POD
的所有元数据信息,然后基于该POD
元数据就可以构建采集点信息,这样就实现kubernetes
服务发现。
「为什么需要Workqueue队列?」
Resource Event Handlers
组件注册自定义事件处理器,获取到事件时只是把对象key
放入到Workerqueue
中这种简单操作,而没有直接调用Handle Object
进行事件处理,这里主要是避免阻塞影响整个informer
框架运行。如果Handle Object
比较耗时放到Resource Event Handlers
组件中直接处理,可能就会影响到④⑤功能,所以这里引入Workqueue
类似于MQ
功能实现解耦。
源码分析
熟悉了上面Informer机制
,下面以role=POD
为例结合Prometheus
源码梳理下上面流程。
1、创建和API Server
交互底层使用的ListWatch
工具;
2、基于ListWatch
创建Informer
;
3、注册资源事件,分别对应资源创建、资源删除和资源更新事件处理;
❝ 这里的
podAddCount
、podDeleteCount
和podUpdateCount
分别对应下面三个指标序列,指标含义也比较明显:prometheus_sd_kubernetes_events_total(role="pod", event="add")
prometheus_sd_kubernetes_events_total(role="pod", event="delete")
prometheus_sd_kubernetes_events_total(role="pod", event="update")
role
标识资源类型,包括:"endpointslice", "endpoints", "node", "pod", "service", "ingress"
五种类型;event
标识事件类型,包括:"add", "delete", "update"
三种类型。 ❞
4、事件处理,AddFunc
、DeleteFunc
和UpdateFunc
注册的事件处理逻辑一样,处理逻辑也比较简单:就是获取资源对象key
,并将其写入到Workqueue
中;
❝ 对于
POD
资源,这里的key
就是:namespace/pod_name
格式,比如key=test01/nginx-deployment-5ffc5bf56c-n2pl8
。 ❞
5、给Workqueue
注册一个无限循环处理逻辑,就能持续从Workqueue
中取出key
进行处理;
❝ 针对
Pod
里的每个Container
上的每个port
,都会生成一个对应采集点target
,其中__address__
就是PodIP
+port
组合。 ❞
6、最后启动Informer
,让整个流程运转起来;
关键词:
上节分析了Prometheus服务发现核心流程(如下图),Discoverer基于不同协议发现采集点,通过channel通知到updater协程,然后更新到di2023-03-20
中公教育:子公司以自有资产抵押向银行申请贷款,贷款,房地产,中公教育,商业银行,自有资产抵押2023-03-20
2023年03月20日临近09时25分,汉得信息(300170)出现异动,股价大幅拉升7 48%。截至发稿,该股报14 22元 股,成交量4 153万手,换手率2023-03-20
1、你好!看了你的描述,居民户口非农业户口有什么区别?这个问题的回答是,居民户口与非农业户口的性质一样。2、概念一样,没2023-03-20
苏州女子疑杀夫藏尸冰柜报道追踪:女子曾在酷狗直播为男主播打赏,要花多少钱才能成为”郡王“?2023-03-20
1、见笑了,在不同情况下表达的意思是不一样的,因此对其的回答也不一样,需要根据实际情况,进行回答。2、通常情况下,说让您2023-03-19
如果这部动漫不叫三体,没有原著,单独出现,想来得分不低,讨论度也极高。其实三体被骂核心点就在于科幻是要靠着对世界的认知的改变来震撼人2023-03-19
由刘涛、杜淳、李念、王媛可等人领衔主演的都市、职场情感剧《我是真的爱你》正在火热播出,该剧的剧情生动曲折,情节跌宕起伏,深受一票观众2023-03-19
都不买房了,贝壳要“碎”?2022年净亏14亿,门店数量缩水20%!,贝壳,左晖,裁员,家装,彭永东2023-03-19
瑞银和瑞信周末期间的历史性收购谈判在加速进行,各方都在推动快速解决方案。当前一种可能的情景是,瑞银收购瑞信的财富和资产管理部门,同时2023-03-19
同一时段出现在莲湖酒店的人都有可能是凶手,在监控视频中,竟然看到了夏冰清的丈夫慕达夫,而且他的座位和夏冰清离得很近。在夏冰清租的公寓2023-03-19
1、疾病分析:肝脏位于上腹部,大部分位于右上腹。2、所以肝区疼痛主要表现为右上腹疼痛,主要表现为钝痛、痛、针刺样痛或隐痛2023-03-18
“看似“激进”,实际保守。”作者|郭瑞婵编辑|李雨晨继德、美两国,奔驰L3级自动驾驶系统DrivePilot不久后也将进入中国市场。最新消息称,为2023-03-18
1、,带火驼的性格的话,你可以整一个勇敢的那个性格,因为它这个带我图。2、而攻击力比较高,所以一个人写了一个有感点的性格2023-03-18
男子超市连吃十多个耙耙柑不买,律师:属盗窃行为2023-03-18
烟火气回归,服务消费回暖,对零售连锁行业来说是一大利好。但“降本增效”仍然是零售连锁企业面临的关键课题,在这种背景下,人力资源部门该2023-03-18
3月17日,汇添富医疗服务混合A最新单位净值为1 362元,累计净值为1 362元,较前一交易日下跌2 71%。历史数据显示该基金近1个月下跌6 97%,近32023-03-18
【本文来自《李家超应网友推荐初尝北京豆汁儿,“味道可以!没那么恐怖”》评论区,标题为小编添加】豆汁是老北京独具特色的传统2023-03-17
北京住房公积金管理中心网站发布消息,2023年3月18日0时至19日24时将进行系统优化调整。调整期间,北京住房公积金管理中心各服务网点、个人网2023-03-17
互联网内容的尽头是真诚。2023-03-17
未经许可做配图葛优因网络侵权已发起数千起诉讼2023-03-17
3月16日,证券时报刊发深度报道《四问如意系资产置换交易:估值38亿标的虚实几何》(下称《四问如意》),质疑如意集团(002193 SZ,下称“如2023-03-17
实时行情截至:2023-03-1710:29:34资金流入流出统计股票名称股票代码收盘价涨跌幅大单(万股)买入净量占流通盘比列买入卖出买卖差当日T-1T-22023-03-17
维亚生物(01873)发布公告,集团预期截至2022年12月31日止年度,收益将较截至2021年12月31日止年度增加逾13%,其中CRO业务收益预期将增加逾22023-03-17
夏弥来为大家解答以下的问题,中位数,说一说中位数的简介,现在让我们一起来看看吧!1、中位数(又称中值,英语:Median2023-03-17