OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。 性能监控
; d4 ]% x! ^1 v; \& O( D8 [3 P0 V" K. r( l, q1 B; H& k; n
对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。 [) A& @, |3 [% h
( q$ T9 ]5 x8 S2 Y7 n$ iGanglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。
8 B6 J! o$ z# C, X
" v% Q# T- v- v% p7 u9 t2 \9 g2 i/ s: i图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。8 ~4 @; ?. C' P9 P0 h
! u% I5 i# C) ?1 T0 q6 m3 O% D
2 b" y+ j( {. ^- L0 o! D/ N
# @+ f. ]( L$ Y) i1 b# A; z' ]图1 Ganglia的Overview界面" M+ K) \, ], `. s7 z
: P: R* h& `% M- y% L' R图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。
2 V; N: q: a4 Y
; u k$ z9 P" C# }4 I
2 j1 C, b7 [/ y1 ]# X$ C0 U% l
. Q6 \; _6 [& c: k图2 Ganglia的聚合视图和节点视图
. ^) A8 h0 ]- y! `- @- ~4 h9 L0 Q$ {) y4 Y, L# W% g
图3是CPU详细监控项目。4 S3 e6 U$ l/ G. G6 ~
" o# \2 E. t; K, c4 P/ k
! \- K& ]* p6 H& T
5 B! F* @% j' C6 {/ b6 b5 r9 R/ c
图3 Ganglia的CPU监控
+ _ c7 y5 Z; k \/ q! B
) ?, L. T3 L: r" |# _8 m2 ?图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。
, g+ r. ~0 i* ^8 p) }' ] _! j7 l; \
( E. w8 P* P6 D! v0 {
图4 Ganglia监控虚拟机内存
4 N+ E s7 X7 M; \( b
8 [6 T6 S" R# [; P {& ?' E服务与资源监控
% E+ y. O% E- O( F z
6 Y: E1 u, o, x7 j/ lNagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。& z" B) o5 o" L% \) m: M% i& T
, Q5 R% a$ I" R9 u
图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。7 M3 c: H3 l& n, D5 D$ K
" y/ ^. L+ V+ Z6 x
& o" j% U' p# [. V- s
* E" N4 C- ^0 Z& q" [+ I
图5 Nagios的连接视图
. e' |* s# |( r7 R) d
5 R R- ^2 ?+ b) Y( P另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。/ N1 w9 |, r% R
! r7 ~4 b/ O+ y; M. z3 A5 x另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。+ j, C2 T" Y% U Q' p
9 H, {5 y! j3 Y5 A图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。* \) t$ d& e$ M( D6 C! z
8 z" B0 b/ b0 ^8 I3 i) P
& P7 ]2 P/ {$ G: m5 i+ f
! A" B5 h/ i6 ` |图6 Nagios的主机视图
+ l% j& W7 P2 f( f7 a* L
; @9 \1 T7 H# b% x8 `) h( B; X图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。& _9 ?1 G* t, g& S; k% b; T! q
7 b. ]2 `! a- Z8 A
5 m ]! ?- F1 h3 t8 L9 @$ j
1 v1 y1 |/ _4 i# x% @8 [$ p图7 Nagois的服务监控视图
4 _; t! E4 } K2 a% W% @- n. s6 a6 H3 u+ W
对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。
& B7 l8 |& @$ p9 L8 f2 b; n7 l6 l* T1 E s4 e6 i
( X2 Z( h. U0 h& R4 F0 [' ^8 O消息中间件监控% o, t; h; c+ i$ B: e: n P
! q. Z! N, _( S S z3 t
消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。- C9 g9 E* d: V! O4 r, F# q
! H8 h" c% S6 _7 c- s
图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。
6 P4 _; }- o7 h3 k5 [& V8 ~3 V( U% c( F/ i) d" L$ C1 v. C
+ K' w; {4 V$ ^1 ~
( u7 l B M. l* ]图8 RabbitMQ的Overview视图. f% T h% R2 I E* k4 g
0 E! z% c: ~6 J# S1 p1 C& t. q4 ~
图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。
% W) p O K5 q; ^9 f7 N, u1 F* a" h9 M- o! v
* a2 c8 N- j* H! B
1 V- t. U, ]) T: t
图9 RabbitMQ的连接视图( B5 D3 q' x% |# o v8 Q$ i6 C B
* v+ f5 |/ @# ]/ i) o
图10展示了消息中间件的通道视图。) I8 l% S F" |% A- E
! C! {' J- m5 h; b3 \# h' E; o/ h
! U8 T' U3 L) G6 U v
7 y. N) \6 `! A) I( a5 B+ _图10 RabbitMQ的通道视图
5 Q0 P ^* a- ?% z$ e2 Z3 `: p# ] S `! M9 y/ J2 j: O/ ^4 T
图11展示了消息中间件的交换(Exchange)视图。
# h6 F' n8 G& s5 v
2 h$ a3 ]9 v( M+ w( T
3 |: w- r* K, T1 p: D9 T
' U3 ]9 L. @5 [/ _2 v$ \图11 RabbitMQ的交换视图
6 Q! ]- g+ w8 }. Q1 s8 {) {! v( K9 H( p( a: y7 n4 a! @
图12展示了消息中间件的队列视图,并包括了统计信息。
) |7 ~ s4 \2 d- j! s# n* ]9 ~4 t) S* p0 i( x
& N( T5 |) ^$ p' F+ B# z, K' Y! e" M2 y) |$ e& m$ ^" G
图12 RabbitMQ的队列视图" W" o' |( q; G+ k: J
0 [2 ^3 {# b4 j6 U, [. g1 [" ]$ }图13是管理员视图,可以修改密码、增加用户等。
/ s9 q7 M: o, L# G/ a% ]4 E
) g) R/ @+ D8 H$ K% y3 V; E ]
3 ~ [. H2 a) Z6 o) r) V3 q& l) W
1 j3 }: B( \5 u% l% ^) t图13 RabbitMQ的管理员视图! T! l* O9 |1 E- x/ ?$ K% d) G
* K5 K; z& T* a: z! L' M日志分析% u' }, O! C% {1 J, Y
7 _- k+ w* _7 \) j4 N
OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。
8 U B# d1 }& h! y: t- ~8 t0 ?3 L* N q+ z* @6 R' R
LogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。* A1 Q+ b' Y, |& b& O
+ ^$ h# F* n5 g6 ?. f0 e3 C; R2 Q* _
图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。' t! g* H& K8 b2 V
3 y7 F, {) x: |+ V
( w B$ `& W0 ^ b7 s
+ D& G; o( t- k4 i0 X图14 LogStash的Overview视图6 R/ H/ C5 s- W) Z
3 P* u$ h% D, M: w; `1 e5 g
图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。1 w! m6 f4 \4 O" I: ~ _
4 z0 F; y+ J3 ?9 S/ P: G W# S+ K
/ w0 M+ ?% P+ d ?6 u
( v+ F3 `/ u# _+ u' p图15 LogStash的消息视图. N0 @: e7 X6 i3 w2 l ?5 C
" ^% O0 F! G8 F% X7 K* g
图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。4 o& [; \5 p/ @4 y5 f+ U
* a0 Q" Z5 T* I: |0 P/ F% B
7 Z' I# d# O( `, b0 z- E& S+ H2 a) w% j4 ]! W
图16 LogStash的消息过滤视图: i6 u2 _. K0 a* G
以上是“OpenStack企业云平台监控的示例分析 8 W( O+ c7 x) \; s2 r7 Q- h% |
8 z. q v( `* e* e& R( L/ r) I0 k
( I, u4 o0 O% C0 `2 ?) m6 w" q; ]1 m& h" x5 T; c4 o
\4 }( j9 Z9 Y' T5 X& C1 K' x3 DOpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。 性能监控$ w- b! S. [6 q5 C4 o# m
. `$ I, i( l8 T) P6 b
对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。
) Y1 ]7 ]* \5 t' u) |3 |1 \ ]) |- l, a8 Y3 @, z: S7 I5 n8 s& e
Ganglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。- Z" E4 M2 R5 |% n8 [/ `
8 d$ ~. v h. l# O+ J图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。
3 Z5 n' C! e" E8 B& | u
$ }9 ?7 [4 y) f$ m0 e
P% W; @: M! q& Q8 m) q) _& H& r+ O! w1 H( [
图1 Ganglia的Overview界面
. W; L" d$ U! ?- h# j+ `2 I7 _2 i; G# d9 N9 o
图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。
) z3 v& [2 g8 c. j+ w* E2 s7 i' w7 }
, A/ G8 |1 o9 m0 Z, T4 {
( C; s% A- ^. r图2 Ganglia的聚合视图和节点视图
# L6 I; F% n& h% \
. x9 M5 L' P n0 @. M) t图3是CPU详细监控项目。
+ y2 V( q7 P9 j2 C
% [" m% } V1 A* m# G
' E! Y; {- Y9 C" }0 X
+ s2 F3 K6 j5 z. a( m图3 Ganglia的CPU监控
" R" w+ k5 A- D6 D' b/ N: \" i: }
% A# _5 f7 d* j# }/ I图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。0 g: I# O8 C$ z4 M+ k3 a
) y+ b- }4 x' B; F6 g M5 c
: n% K" ~$ l2 D7 R" T+ {% l) z图4 Ganglia监控虚拟机内存
6 m7 d. @5 v" P0 F( w7 @
$ V+ j; s5 |, Y- F' n! T服务与资源监控6 p& ?' ]3 V+ i3 [* W
8 y" G9 N; B* I$ rNagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。
4 E' {- V+ g( N$ {" q; E. R' U4 w5 J' S y
图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。% F, u+ o/ P: D
" ?/ k/ Q6 E# w9 d" Y. @/ N% Z
1 U) r& e* |0 U) ^% o& Q8 Z: p( p' m
4 B( N8 D: l( _, s0 L6 K图5 Nagios的连接视图
# a* ~/ Y+ q& o+ E4 ^# Y& ^/ I+ o: L* J, A( K' O9 l6 N+ D" {
另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。" L0 e( `4 V' q- a! W8 j
0 L9 S# A H, T/ ^# o另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。
6 o8 \ v: F/ p: }, j& J3 j" @) R! f/ K' M( D
图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。/ U M: j2 ^( I8 E
5 L) q1 t9 z( E5 f# ?7 Z* I8 z
$ [( m' ~/ T6 U& Y. Q, `8 G/ t5 u5 O
图6 Nagios的主机视图5 }2 D4 {: t" g
# J" i. L( j) w/ h3 h
图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。1 F* k1 Z: Q6 ?: ]. c. R) V
; Y! @+ ?6 q& Y$ x W$ C* w1 ]8 f/ n/ H8 h5 L
& C% W: ^. m* ?& z2 a& @. B" @5 m图7 Nagois的服务监控视图
8 G- G( v8 R+ N, ]3 h0 W" ]& l7 H- }6 H
. [! l9 J; {- [# T# h. t对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。6 a5 M& C% H0 P0 X
, H( V1 h/ {- {( ?2 L* ~- A
$ N0 e1 F; p+ Y( u消息中间件监控
6 v9 P; ? v# g9 F9 w
0 ^4 e. k) N. X! Y: W; G* T消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。
1 f; z! J3 `$ U& `; D+ t0 H
+ W5 ]4 S: M9 t, _7 w图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。% Z5 t, O/ {# l# l% M
9 y$ p: V" K! s4 }4 m5 M6 v' R
; l% V8 d2 j! z) R# t9 B2 L
3 I; v; S, [ n, g图8 RabbitMQ的Overview视图
; m; \+ ~9 ]/ c2 T! |/ P
5 y0 R9 A. h' x8 _2 w5 j2 A图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。! W/ U1 `4 m3 v' Y
" J; X. i" c4 m8 e3 h* P
9 A7 K5 o% }9 j* B6 u" y
4 z8 P8 S- W3 k2 v2 p图9 RabbitMQ的连接视图
1 g9 G8 h9 R! @4 U6 D. c' K
$ D6 X3 j/ y2 a) b图10展示了消息中间件的通道视图。
) T& v: S. r+ l8 X/ p3 h n! G) q% \' n; k% x% s# o" W2 ^8 c7 [
4 ^$ S' f7 I& M
' G% x/ L8 A. N+ e* ~8 i' Z
图10 RabbitMQ的通道视图
" v2 o6 g' ^' w( U$ z5 M
" n* z; [& K* | M6 j2 H图11展示了消息中间件的交换(Exchange)视图。8 X: i; S! _$ ?6 g
6 V) Q t" g, j6 E" m: v
" g' V7 q; L' l8 F6 H
7 v/ G/ e! }# H1 g4 p% q$ T图11 RabbitMQ的交换视图
# X% O! F% q6 S5 p- A" y
! L+ ^: [3 m F图12展示了消息中间件的队列视图,并包括了统计信息。
F1 g( b5 s) Z k& o2 s, l( |5 p H) O, n1 f9 O
' X5 M/ o- x _& @9 e
8 A* s& \8 `$ U2 m r* l# h
图12 RabbitMQ的队列视图
9 i& p s) y' G2 Z* m
3 o( y6 d9 e3 m. K' j' P* P/ x图13是管理员视图,可以修改密码、增加用户等。/ `; D3 q! Z" \
" U& A1 S9 d- [* i! T: N7 F: C$ H G; ~$ M1 } F
" l$ U$ Q0 g9 f* t, d6 u图13 RabbitMQ的管理员视图$ l' B* f8 x* U5 g
) S2 W1 V+ Z, v6 C& Q _
日志分析
/ Z/ V: Q; g# J9 m' p5 C- e3 ?. p2 z' ~: R& S
OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。8 }0 G c: `/ u; T+ z
' r/ Z0 s! p8 U
LogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。$ Y- v* j9 ~8 b' T/ s9 j1 Z
" x, x* i. s2 L8 O7 E
图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。+ K0 A, S/ c1 E" J/ A! _
7 r1 J- A s. F0 m Z
& y6 g0 S3 ^# @, c% l/ Y$ a$ O4 l+ \- P/ A" r' Q; ]
图14 LogStash的Overview视图
1 q) E; G3 f) Z% K) u- g7 c! z
$ q5 s/ Y: R+ {- J4 A' A图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。
; F& i2 l e* g) D+ `1 h. ~, F6 l, j+ x1 ~- Y3 H
2 R/ |; o2 s' Q' {
* y5 }! N$ Q6 t
图15 LogStash的消息视图
: ~, K% J4 V0 P, J0 M( ]' n+ M, H3 V3 V* B* L% F
图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。( O5 P* Y) r( k$ W6 m+ O6 ^- V
3 i! T- g7 D5 n
- @0 T* e+ o# F; Y9 w* V( }
& {, d( l) S+ H$ F图16 LogStash的消息过滤视图; C. o* B9 H: ?3 o
以上是“OpenStack企业云平台监控的示例分析
4 j- G7 ?: l! U! O; ^ G8 ^( C+ U
$ D5 ~1 N3 t0 S' o5 q |