将设为首页浏览此站
开启辅助访问 天气与日历 收藏本站联系我们切换到窄版

易陆发现论坛

 找回密码
 开始注册
查看: 68|回复: 2
收起左侧

OpenStack 高性能监控工具

[复制链接]
发表于 2022-12-15 09:55:23 | 显示全部楼层 |阅读模式
购买主题 本主题需向作者支付 2 金钱 才能浏览
 楼主| 发表于 2022-12-15 10:26:07 | 显示全部楼层
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。
性能监控
; d4 ]% x! ^1 v; \& O( D8 [3 P0 V" K. r( l, q1 B; H& k; n
对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。  [) A& @, |3 [% h

( q$ T9 ]5 x8 S2 Y7 n$ iGanglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。
8 B6 J! o$ z# C, X
" v% Q# T- v- v% p7 u9 t2 \9 g2 i/ s: i图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。8 ~4 @; ?. C' P9 P0 h
! u% I5 i# C) ?1 T0 q6 m3 O% D
2 b" y+ j( {. ^- L0 o! D/ N

# @+ f. ]( L$ Y) i1 b# A; z' ]图1  Ganglia的Overview界面" M+ K) \, ], `. s7 z

: P: R* h& `% M- y% L' R图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。
2 V; N: q: a4 Y
; u  k$ z9 P" C# }4 I
2 j1 C, b7 [/ y1 ]# X$ C0 U% l
. Q6 \; _6 [& c: k图2  Ganglia的聚合视图和节点视图
. ^) A8 h0 ]- y! `- @- ~4 h9 L0 Q$ {) y4 Y, L# W% g
图3是CPU详细监控项目。4 S3 e6 U$ l/ G. G6 ~
" o# \2 E. t; K, c4 P/ k
! \- K& ]* p6 H& T
5 B! F* @% j' C6 {/ b6 b5 r9 R/ c
图3  Ganglia的CPU监控
+ _  c7 y5 Z; k  \/ q! B
) ?, L. T3 L: r" |# _8 m2 ?图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。
, g+ r. ~0 i* ^8 p) }' ]  _! j7 l; \
( E. w8 P* P6 D! v0 {
图4  Ganglia监控虚拟机内存
4 N+ E  s7 X7 M; \( b
8 [6 T6 S" R# [; P  {& ?' E服务与资源监控
% E+ y. O% E- O( F  z
6 Y: E1 u, o, x7 j/ lNagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。& z" B) o5 o" L% \) m: M% i& T
, Q5 R% a$ I" R9 u
图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。7 M3 c: H3 l& n, D5 D$ K
" y/ ^. L+ V+ Z6 x
& o" j% U' p# [. V- s
* E" N4 C- ^0 Z& q" [+ I
图5  Nagios的连接视图
. e' |* s# |( r7 R) d
5 R  R- ^2 ?+ b) Y( P另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。/ N1 w9 |, r% R

! r7 ~4 b/ O+ y; M. z3 A5 x另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。+ j, C2 T" Y% U  Q' p

9 H, {5 y! j3 Y5 A图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。* \) t$ d& e$ M( D6 C! z

8 z" B0 b/ b0 ^8 I3 i) P
& P7 ]2 P/ {$ G: m5 i+ f
! A" B5 h/ i6 `  |图6  Nagios的主机视图
+ l% j& W7 P2 f( f7 a* L
; @9 \1 T7 H# b% x8 `) h( B; X图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。& _9 ?1 G* t, g& S; k% b; T! q

7 b. ]2 `! a- Z8 A
5 m  ]! ?- F1 h3 t8 L9 @$ j
1 v1 y1 |/ _4 i# x% @8 [$ p图7  Nagois的服务监控视图
4 _; t! E4 }  K2 a% W% @- n. s6 a6 H3 u+ W
对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。
& B7 l8 |& @$ p9 L8 f2 b; n7 l6 l* T1 E  s4 e6 i

( X2 Z( h. U0 h& R4 F0 [' ^8 O消息中间件监控% o, t; h; c+ i$ B: e: n  P
! q. Z! N, _( S  S  z3 t
消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。- C9 g9 E* d: V! O4 r, F# q
! H8 h" c% S6 _7 c- s
图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。
6 P4 _; }- o7 h3 k5 [& V8 ~3 V( U% c( F/ i) d" L$ C1 v. C

+ K' w; {4 V$ ^1 ~
( u7 l  B  M. l* ]图8  RabbitMQ的Overview视图. f% T  h% R2 I  E* k4 g
0 E! z% c: ~6 J# S1 p1 C& t. q4 ~
图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。
% W) p  O  K5 q; ^9 f7 N, u1 F* a" h9 M- o! v
* a2 c8 N- j* H! B
1 V- t. U, ]) T: t
图9  RabbitMQ的连接视图( B5 D3 q' x% |# o  v8 Q$ i6 C  B
* v+ f5 |/ @# ]/ i) o
图10展示了消息中间件的通道视图。) I8 l% S  F" |% A- E
! C! {' J- m5 h; b3 \# h' E; o/ h
! U8 T' U3 L) G6 U  v

7 y. N) \6 `! A) I( a5 B+ _图10  RabbitMQ的通道视图
5 Q0 P  ^* a- ?% z$ e2 Z3 `: p# ]  S  `! M9 y/ J2 j: O/ ^4 T
图11展示了消息中间件的交换(Exchange)视图。
# h6 F' n8 G& s5 v
2 h$ a3 ]9 v( M+ w( T
3 |: w- r* K, T1 p: D9 T
' U3 ]9 L. @5 [/ _2 v$ \图11  RabbitMQ的交换视图
6 Q! ]- g+ w8 }. Q1 s8 {) {! v( K9 H( p( a: y7 n4 a! @
图12展示了消息中间件的队列视图,并包括了统计信息。
) |7 ~  s4 \2 d- j! s# n* ]9 ~4 t) S* p0 i( x

& N( T5 |) ^$ p' F+ B# z, K' Y! e" M2 y) |$ e& m$ ^" G
图12  RabbitMQ的队列视图" W" o' |( q; G+ k: J

0 [2 ^3 {# b4 j6 U, [. g1 [" ]$ }图13是管理员视图,可以修改密码、增加用户等。
/ s9 q7 M: o, L# G/ a% ]4 E
) g) R/ @+ D8 H$ K% y3 V; E  ]
3 ~  [. H2 a) Z6 o) r) V3 q& l) W
1 j3 }: B( \5 u% l% ^) t图13  RabbitMQ的管理员视图! T! l* O9 |1 E- x/ ?$ K% d) G

* K5 K; z& T* a: z! L' M日志分析% u' }, O! C% {1 J, Y
7 _- k+ w* _7 \) j4 N
OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。
8 U  B# d1 }& h! y: t- ~8 t0 ?3 L* N  q+ z* @6 R' R
LogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。* A1 Q+ b' Y, |& b& O
+ ^$ h# F* n5 g6 ?. f0 e3 C; R2 Q* _
图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。' t! g* H& K8 b2 V
3 y7 F, {) x: |+ V

( w  B$ `& W0 ^  b7 s
+ D& G; o( t- k4 i0 X图14  LogStash的Overview视图6 R/ H/ C5 s- W) Z
3 P* u$ h% D, M: w; `1 e5 g
图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。1 w! m6 f4 \4 O" I: ~  _
4 z0 F; y+ J3 ?9 S/ P: G  W# S+ K

/ w0 M+ ?% P+ d  ?6 u
( v+ F3 `/ u# _+ u' p图15  LogStash的消息视图. N0 @: e7 X6 i3 w2 l  ?5 C
" ^% O0 F! G8 F% X7 K* g
图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。4 o& [; \5 p/ @4 y5 f+ U

* a0 Q" Z5 T* I: |0 P/ F% B
7 Z' I# d# O( `, b0 z- E& S+ H2 a) w% j4 ]! W
图16  LogStash的消息过滤视图: i6 u2 _. K0 a* G
以上是“OpenStack企业云平台监控的示例分析
8 W( O+ c7 x) \; s2 r7 Q- h% |
8 z. q  v( `* e* e& R( L/ r) I0 k

( I, u4 o0 O% C0 `2 ?) m6 w" q; ]1 m& h" x5 T; c4 o

  \4 }( j9 Z9 Y' T5 X& C1 K' x3 D
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。
性能监控$ w- b! S. [6 q5 C4 o# m
. `$ I, i( l8 T) P6 b
对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。
) Y1 ]7 ]* \5 t' u) |3 |1 \  ]) |- l, a8 Y3 @, z: S7 I5 n8 s& e
Ganglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。- Z" E4 M2 R5 |% n8 [/ `

8 d$ ~. v  h. l# O+ J图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。
3 Z5 n' C! e" E8 B& |  u
$ }9 ?7 [4 y) f$ m0 e
  P% W; @: M! q& Q8 m) q) _& H& r+ O! w1 H( [
图1  Ganglia的Overview界面
. W; L" d$ U! ?- h# j+ `2 I7 _2 i; G# d9 N9 o
图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。
) z3 v& [2 g8 c. j+ w* E2 s7 i' w7 }

, A/ G8 |1 o9 m0 Z, T4 {
( C; s% A- ^. r图2  Ganglia的聚合视图和节点视图
# L6 I; F% n& h% \
. x9 M5 L' P  n0 @. M) t图3是CPU详细监控项目。
+ y2 V( q7 P9 j2 C
% [" m% }  V1 A* m# G
' E! Y; {- Y9 C" }0 X
+ s2 F3 K6 j5 z. a( m图3  Ganglia的CPU监控
" R" w+ k5 A- D6 D' b/ N: \" i: }
% A# _5 f7 d* j# }/ I图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。0 g: I# O8 C$ z4 M+ k3 a

) y+ b- }4 x' B; F6 g  M5 c
: n% K" ~$ l2 D7 R" T+ {% l) z图4  Ganglia监控虚拟机内存
6 m7 d. @5 v" P0 F( w7 @
$ V+ j; s5 |, Y- F' n! T服务与资源监控6 p& ?' ]3 V+ i3 [* W

8 y" G9 N; B* I$ rNagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。
4 E' {- V+ g( N$ {" q; E. R' U4 w5 J' S  y
图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。% F, u+ o/ P: D
" ?/ k/ Q6 E# w9 d" Y. @/ N% Z

1 U) r& e* |0 U) ^% o& Q8 Z: p( p' m
4 B( N8 D: l( _, s0 L6 K图5  Nagios的连接视图
# a* ~/ Y+ q& o+ E4 ^# Y& ^/ I+ o: L* J, A( K' O9 l6 N+ D" {
另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。" L0 e( `4 V' q- a! W8 j

0 L9 S# A  H, T/ ^# o另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。
6 o8 \  v: F/ p: }, j& J3 j" @) R! f/ K' M( D
图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。/ U  M: j2 ^( I8 E
5 L) q1 t9 z( E5 f# ?7 Z* I8 z

$ [( m' ~/ T6 U& Y. Q, `8 G/ t5 u5 O
图6  Nagios的主机视图5 }2 D4 {: t" g
# J" i. L( j) w/ h3 h
图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。1 F* k1 Z: Q6 ?: ]. c. R) V

; Y! @+ ?6 q& Y$ x  W$ C* w1 ]8 f/ n/ H8 h5 L

& C% W: ^. m* ?& z2 a& @. B" @5 m图7  Nagois的服务监控视图
8 G- G( v8 R+ N, ]3 h0 W" ]& l7 H- }6 H
. [! l9 J; {- [# T# h. t对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。6 a5 M& C% H0 P0 X
, H( V1 h/ {- {( ?2 L* ~- A

$ N0 e1 F; p+ Y( u消息中间件监控
6 v9 P; ?  v# g9 F9 w
0 ^4 e. k) N. X! Y: W; G* T消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。
1 f; z! J3 `$ U& `; D+ t0 H
+ W5 ]4 S: M9 t, _7 w图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。% Z5 t, O/ {# l# l% M

9 y$ p: V" K! s4 }4 m5 M6 v' R
; l% V8 d2 j! z) R# t9 B2 L
3 I; v; S, [  n, g图8  RabbitMQ的Overview视图
; m; \+ ~9 ]/ c2 T! |/ P
5 y0 R9 A. h' x8 _2 w5 j2 A图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。! W/ U1 `4 m3 v' Y
" J; X. i" c4 m8 e3 h* P
9 A7 K5 o% }9 j* B6 u" y

4 z8 P8 S- W3 k2 v2 p图9  RabbitMQ的连接视图
1 g9 G8 h9 R! @4 U6 D. c' K
$ D6 X3 j/ y2 a) b图10展示了消息中间件的通道视图。
) T& v: S. r+ l8 X/ p3 h  n! G) q% \' n; k% x% s# o" W2 ^8 c7 [
4 ^$ S' f7 I& M
' G% x/ L8 A. N+ e* ~8 i' Z
图10  RabbitMQ的通道视图
" v2 o6 g' ^' w( U$ z5 M
" n* z; [& K* |  M6 j2 H图11展示了消息中间件的交换(Exchange)视图。8 X: i; S! _$ ?6 g

6 V) Q  t" g, j6 E" m: v
" g' V7 q; L' l8 F6 H
7 v/ G/ e! }# H1 g4 p% q$ T图11  RabbitMQ的交换视图
# X% O! F% q6 S5 p- A" y
! L+ ^: [3 m  F图12展示了消息中间件的队列视图,并包括了统计信息。
  F1 g( b5 s) Z  k& o2 s, l( |5 p  H) O, n1 f9 O
' X5 M/ o- x  _& @9 e
8 A* s& \8 `$ U2 m  r* l# h
图12  RabbitMQ的队列视图
9 i& p  s) y' G2 Z* m
3 o( y6 d9 e3 m. K' j' P* P/ x图13是管理员视图,可以修改密码、增加用户等。/ `; D3 q! Z" \

" U& A1 S9 d- [* i! T: N7 F: C$ H  G; ~$ M1 }  F

" l$ U$ Q0 g9 f* t, d6 u图13  RabbitMQ的管理员视图$ l' B* f8 x* U5 g
) S2 W1 V+ Z, v6 C& Q  _
日志分析
/ Z/ V: Q; g# J9 m' p5 C- e3 ?. p2 z' ~: R& S
OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。8 }0 G  c: `/ u; T+ z
' r/ Z0 s! p8 U
LogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。$ Y- v* j9 ~8 b' T/ s9 j1 Z
" x, x* i. s2 L8 O7 E
图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。+ K0 A, S/ c1 E" J/ A! _
7 r1 J- A  s. F0 m  Z

& y6 g0 S3 ^# @, c% l/ Y$ a$ O4 l+ \- P/ A" r' Q; ]
图14  LogStash的Overview视图
1 q) E; G3 f) Z% K) u- g7 c! z
$ q5 s/ Y: R+ {- J4 A' A图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。
; F& i2 l  e* g) D+ `1 h. ~, F6 l, j+ x1 ~- Y3 H
2 R/ |; o2 s' Q' {
* y5 }! N$ Q6 t
图15  LogStash的消息视图
: ~, K% J4 V0 P, J0 M( ]' n+ M, H3 V3 V* B* L% F
图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。( O5 P* Y) r( k$ W6 m+ O6 ^- V
3 i! T- g7 D5 n

- @0 T* e+ o# F; Y9 w* V( }
& {, d( l) S+ H$ F图16  LogStash的消息过滤视图; C. o* B9 H: ?3 o
以上是“OpenStack企业云平台监控的示例分析

4 j- G7 ?: l! U! O; ^  G8 ^( C+ U
$ D5 ~1 N3 t0 S' o5 q
 楼主| 发表于 2022-12-15 10:26:22 | 显示全部楼层
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。
性能监控
, c, R% X$ C, b2 c/ e, }6 {+ ?8 s; {! m
7 ~' @$ ^6 |( W对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。* }5 G$ q7 Y! x0 h1 Z

- Q! @5 t2 y2 [Ganglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。1 [7 M2 F* U6 N. I# k
- K6 K" L/ |, ]7 k; F
图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。& X9 D9 v6 o: Z1 q

( A/ r1 a7 ^) {' o- _- f                               
登录/注册后可看大图
3 o+ }, V- ]8 M' P# d# C/ W! ]+ |
6 x. A* ^9 B2 K9 m8 C
/ Z6 }( V3 P! B" I( t
图1  Ganglia的Overview界面/ O5 E% E+ L1 w8 z5 ~

4 \" z* h; q/ V: v图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。$ \: P% J/ r$ _, r  x
1 W9 Y2 C" y: ]. V5 y0 F

: Z& @/ D3 D( x                               
登录/注册后可看大图

( F! N! q7 W' d  j8 ]: v5 I+ D, u  b0 |$ y; s; S6 v; H/ A
图2  Ganglia的聚合视图和节点视图
: \  C- L6 [8 y2 K$ j4 ^! \$ c" @4 a. E4 J6 M- k2 o" I" z
图3是CPU详细监控项目。; o; C! ~# t4 P& U* }
3 h% S. ~9 l: {# Y$ @
9 j4 u3 t/ A5 K! k$ ?0 l9 g4 l
                               
登录/注册后可看大图
  `) r7 }( v9 Y+ z# d

: \& S& {8 W' Q, C/ @6 y图3  Ganglia的CPU监控
$ S& [, Q; ^3 J; ~; w" R
" y4 K/ o* r5 f& j4 E4 B* Y图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。
4 V! Y% y* }7 {. S
/ B2 W: I- Q" A0 N$ N( g/ Q6 `8 g5 }
' @( N' y( D0 K
                               
登录/注册后可看大图

( p* k4 H& ?) H' ?8 A1 U& j- m图4  Ganglia监控虚拟机内存* ]3 }3 c$ i; n% h$ S

- H9 P5 u- k- f服务与资源监控
  }, T' O7 ]1 A# h# u% t3 M( N$ @: Z- n. Y* c# A- `
Nagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。
. N0 U# J9 U9 T% V, p% z  y; a: H4 p1 w% ~. M: g+ \6 @. c6 w1 u* n: y8 h
图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。
; ^7 ~" s4 w8 z7 Z; L! n& z( \. R0 d9 n- t
3 ^6 q& e9 M/ t4 Y, I

' z% @: A) a4 Q' Y# c$ X                               
登录/注册后可看大图
9 `0 V' h5 `' c/ [' S$ q
图5  Nagios的连接视图
7 x& L5 `/ V8 B/ x& ?9 y( z- s# R
) w, x* {  r; L- i( y3 b* d- _另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。
  F. y* B* y: ~0 [% d5 T- ~! ?0 `* F9 N0 g/ d2 B9 J
另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。! h' P: D9 r) y0 u. r8 }! o) ]
9 B9 U/ c* I+ W; [
图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。; V0 O8 T) P" O6 a) j4 ]& h

' b" k$ O* ?7 y( u/ J3 Q
/ u; |& P8 K, n) Y) n

, F; e' @) E5 [, @( i                               
登录/注册后可看大图
0 v" J5 `) J8 B1 w
图6  Nagios的主机视图7 J5 g& v. F' ]7 k( o* I- r0 Y
' w& v. M  d7 w/ A' Q
图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。
& \) J; M. Q* a- m  ~$ P: t5 i" [; l* j  w1 R, p6 K8 w/ S, D* t

, |( {: _" [6 u* b6 a
) r, w* K, O. R% Y- b# y
                               
登录/注册后可看大图

2 O, U" p# `' [6 y图7  Nagois的服务监控视图/ Z. l6 T3 H7 L4 V+ P

4 {" _+ r0 _5 y$ I对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。
. b" T5 i' t  W" b5 B; r
" X. q( o9 g2 k( @) F9 j0 Y
; B- ^+ @2 w. s& a5 t  P1 ^* j消息中间件监控# ^  m" S( i) j5 P

2 @0 `8 d4 K4 n, q* }, g! r+ D5 J3 y消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。( O9 ~5 ?5 j- T# j0 j

- ^4 s' Y' R3 C图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。1 j8 q: O# J% k/ Q0 ^" Z5 q$ t
/ C6 I8 z. ?/ L0 ]$ v- S2 q8 ~5 f
& E- v0 F0 q9 Q/ J) t9 k
                               
登录/注册后可看大图
) W) R' T( ~+ m7 b6 R( P. P
- G1 |5 v) h, R  i
图8  RabbitMQ的Overview视图
4 r, G7 u) N  C* S. @" x+ Q* w+ B% W, |  l6 H. P
图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。3 p5 L4 F. n4 L' \7 c) m
9 b3 l% U9 N) |; b9 Q, t7 l6 g% Z
6 C$ E- }9 Y. \" ^
                               
登录/注册后可看大图

( H9 y. H; R4 x- l: r1 B( Z) N6 ~# Z: B
图9  RabbitMQ的连接视图
. J& }; O2 S5 ?3 e% ]6 v4 @  m2 J1 ?3 S$ a; S
图10展示了消息中间件的通道视图。: k. M( j7 B( C2 |3 K$ F

6 g# u- n1 e( ~7 S% Y

2 o" N9 C4 L  @5 j0 ^                               
登录/注册后可看大图
+ I& q6 z1 L$ M+ H1 M

+ G  j- i6 A: _# u4 Y图10  RabbitMQ的通道视图, V, u- f* D1 @5 q. ~9 A# @$ ^4 D
* s1 [% c( n, ?8 ^3 Q) E
图11展示了消息中间件的交换(Exchange)视图。
9 K. v- B  V" F4 }0 W- |' U, Z  {# [0 H1 B& f
. e7 U9 g4 s) H7 O6 d- N% a4 V6 Q
                               
登录/注册后可看大图

+ p5 T( u$ A8 o; y3 l, P& Q8 o" M" }% |7 m/ d; T
图11  RabbitMQ的交换视图# |: h1 u$ C& N5 V

) h& [/ z' r2 N% ~! W! b图12展示了消息中间件的队列视图,并包括了统计信息。
# B2 L7 G# L) q; R, i0 H' y3 P& U; n; A* e

6 P8 b" u, ]* t* I9 u) @$ p
) j+ T/ k5 n: M9 o/ P$ H4 ^
                               
登录/注册后可看大图
2 ^* B/ c4 L& o) X
图12  RabbitMQ的队列视图
3 K6 V2 ]1 J* s. n/ |. h& U9 P" Z0 D% O2 G+ ]
图13是管理员视图,可以修改密码、增加用户等。. C  ], X; h" x6 @8 B

# W$ w9 T( f" M6 _

9 I* ^: ^- o% J                               
登录/注册后可看大图
$ h9 e2 `7 S& g
% @8 ]" L" O& s& A3 K9 q
图13  RabbitMQ的管理员视图
9 h/ r; _1 h* u4 X5 K# Y
1 I# S  ^7 s# ]0 ?" x  G日志分析
& |, h4 N) x' q: H- P% Z) I
. y  ^$ C9 K- FOpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。8 t# X4 n" I) v: c4 P: ^; I
8 j, [+ J) W) D4 U/ i4 \
LogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。, o& g* ]# o) }0 z& e0 Q  B+ ^% d
( E* \2 g$ J$ k1 @
图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。& \" p- t& ?7 Q- Y
+ N6 S  @5 V. L! W" \

$ f0 K) `! S# C6 W                               
登录/注册后可看大图

) J' n4 [5 V1 [5 ^2 c% o; r! t' j
' e/ L2 ]4 h! w' \图14  LogStash的Overview视图
: r$ {3 B+ {; c  p
" q4 P- @3 k. t8 C, ]. G8 s图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。
, ]2 R6 l5 j8 h/ j- X, q, U1 L( C9 w$ W

4 y) j6 z( {5 Q0 C! u% q                               
登录/注册后可看大图

8 ]2 B% a) q, J8 N* r% ]. w9 Q' o" l2 m5 w
图15  LogStash的消息视图5 z4 {7 W1 p+ g5 v/ c

3 H7 i3 N+ ?2 p& o; D3 ?' A图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。
* V  ~0 Q% q- n& G+ Q6 T6 ]+ \& y, c1 z, ~, F2 K

0 {; c# ]; E0 j0 K2 h, Z& w  G4 k                               
登录/注册后可看大图
+ R6 O* l3 M0 R, o2 k

- b' f- v* u* @3 l* P图16  LogStash的消息过滤视图
. c  @1 Y3 u+ N, g. [0 D
以上是“OpenStack企业云平台监控的示例分析

1 F0 M) a1 D2 t: C) v
您需要登录后才可以回帖 登录 | 开始注册

本版积分规则

关闭

站长推荐上一条 /4 下一条

如有购买积分卡请联系497906712

QQ|返回首页|Archiver|手机版|小黑屋|易陆发现 点击这里给我发消息

GMT+8, 2023-2-9 15:05 , Processed in 0.061995 second(s), 23 queries .

Powered by LR.LINUX.cloud bbs168x X3.2 Licensed

© 2012-2022 Comsenz Inc.

快速回复 返回顶部 返回列表