15丨性能测试场景:如何进行监控设计?
15丨性能测试场景:如何进行监控设计?
讲述:高楼
时长22:57大小20.96M
监控设计步骤
监控技术图谱
架构图
监控设计
全局监控设计
OS 层(CentOS 为例)
DB 层(MySQL 为例)
定向监控
OS 层之定向监控细化 1
OS 层之定向监控细化 2
DB 层之定向监控细化 1
DB 层之定向监控细化 2
监控工具
总结
思考题
赞 20
提建议
精选留言(26)
- 餘生2020-01-20看完这篇文章的感觉就是,一个武林高手给了我一本100页的书,我以为就是秘籍的全部,原来只是目录
作者回复: 这个比喻非常的恰当。如果要秘籍的全部,估计还要再写几个专栏。 而做为我写的第一个专栏,我希望能授人以渔。
51 - 小老鼠2020-01-30老师好厉害,作了二十年测试还是没听懂,好专业。共 5 条评论15
- 律飛2020-01-191.为什么要先有全局监控,再有定向监控? 先全局监控,才能有全面系统的数据分析,避免遗失信息,能更快速有效的发现问题。 通过分析全局、定向、分层的监控数据做分析,再根据分析的结果决定下一步要收集什么信息,然后找到完整的证据链,才能体现监控的价值。 2.为什么不建议一开始就上代码级的监控工具呢? 因为代码级的监控消耗资源,更重要的是,代码级监控数据很多,查看这些数据耗费精力,就像大海捞针,没必要像无头苍蝇乱撞。如果定位到它们有问题时再去监控、去看,更一针见血。展开
作者回复: 这位同学已经完全理解我的意图,非常好。
12 - hou2020-03-04老师,请问您是如何把自己的经验沉淀成一套理论方法,其中的过程有什么方法吗?我在学一些东西的时候,经常是一些散乱的知识点,如何把它们形成一套理论方法呢?
作者回复: 这跟上学的时候学知识点是一样的道理。 像数学,一开始只学加减乘除,再学各种公式,再到高等数学。这些都只是基础,而应用数学就是融会贯通使用了。 IT的知识首先肯定是散乱的知识点。比如说linux操作系统基础操作和原理,这些必须要看一遍。比如说网络知识TCPIP协议栈,这些也必须都看一遍。再比如说..... 只有将这些内容都掌握了大概,在项目中具体的实操应用,最后才能形成完成的知识体系。 这个路子,也没什么捷径可走。 专栏可以提供的借鉴和思路,但是这条路,只能自己走完,才会形成自己的体系。
9 - 罗辑思维2020-03-10不谋全局者,不足谋一域。
作者回复: 有文化。
8 - 小宝2021-12-02老师,哪里有完整的分析思维导图么(包括定向监控细化的部分)
作者回复: 第二个专栏中有网盘链接。
共 2 条评论3 - 小呀么小二郎2020-03-26今日思考题: 为什么要先有全局监控,再有定向监控? 首先,比较好的监控设计思路是:先了解架构,对架构中的组件进行分析,然后通过全局——定向的思路列出要看的计数器,在通过相应的监控工具去实现,拿到要分析的数据。 其次,全局监控和定向监控也不可能一起做,肯定有先后顺序 最后,如果先做定向监控,会有以下几个缺点: 1、耗费的时间太多; 2、列出来也不一定用得上; 3、照搬列出来的定向监控逻辑,可能会误导对实时数据的判断。 综上所述,先有全局监控,再有定向监控是比较好也是合理的监控设计思路。 为什么不建议一开始就上代码级的监控工具? 1、对性能有损耗; 2、多数情况下,性能分析不会到达代码的层面,一开始就上代码级的没有必要。 光这节课我觉得就已经值回票价了。 老师的思维导图里的生词(对我来说大部分都不认识)就够我查半个月了,还不知道半个月够不够……展开
作者回复: 我觉得应该把票价退给你,以鼓励你的学习精神。 真是完全掌握的节奏。
3 - 沃克2020-01-19最后4张图是用什么工具得出来的?
作者回复: k8s的dashboard呀。 最后一个是skywalking。
2 - songyy2020-01-19思考题 为什么要先有全局监控,再有定向监控:因为首先要从大方向上,找到瓶颈在哪里;再进入细节去分析,才比较有效率 为什么不建议一开始就上代码级的监控工具呢:一上来就上代码级别的监控,一方面配置这些监控太耗时间,另一方面可能得到的数据,也用不上 另外,我们公司用的是DataDog,可以给每个机器单独的top/ps命令的记录,我们公司从框架级别支持收集一些基本的数据(比如,一个GRPC耗时多久),把AWS的相关数据也都集中在这里,还可以设置起来对应的报警;感觉颇为好用展开
作者回复: 挺好。工具可以让我们工作更有效率,原理让我们理解看哪些数据。
2 - 章鱼2022-03-29我被大佬狠狠的抛弃在了汽车尾……
作者回复: 静下心来,欲练此功.....
1 - 七月的雨2021-11-21老师说到只看重监控工具而没有分析思路就像花架子一样,深有体会,之前感觉搭建一套性能监控工具好像有点厉害,但当别人闻到关于如何定位性能问题,一些问题的定位就有点迷茫了,思路感觉都有点乱了,全局到定向真的是一个不错的解惑思路,希望自己后续不断补充缺少的知识点
作者回复: 开窍了哦。
1 - bolo2021-02-261、为什么要先有全局监控,再有定向监控? 因为刚开始做一个项目,出现了问题,可以大致分分类,从更高的层次去分析比较简单直接,也是最节省时间的方式。 监控的层面: 操作系统:cpu、内存、IO Nginx: Tomcat: 数据库: redis、mysql等 举个栗子:一个操作引发了一个bug,我们肯定要先定位是前端的还是后端的,如果是后端的又要具体是哪个服务或者模块出现了问题, 最后才是给出代码行的问题及修改意见。 2、为什么不直接上代码级别的监控呢? "不识庐山真面目,只缘身在此山中" 这个有点像学习这件事儿,我们学习一样东西,一般是先去看看大致有哪些东西吧,然后再决定细化,一步一步拆解进行学习。也是更符合常规的一个思路。展开
作者回复: 理解很对。
1 - bettynie2020-04-01高老师,我们在搭建监控系统时是不是应该尽量将被监控服务器和监控系统放在一个局域网内,以降低网络延迟带来的数据影响?比如我的服务器是阿里云的机器,就在同一区域的另一台阿里云机器搭建监控系统?
作者回复: 理论上是的。
1 - Geek_8868d72020-03-31目前只会工具基本操作,表示这套课程要反复听好几遍才能懂。
作者回复: 工具自学就行,只有不断操作才能记得住。
1 - 小老鼠2020-01-30监控工具运行在服务器端的,会不会影响系统的性能数据
作者回复: 从极端的角度来说,每个监控工具运行在服务端都会对性能有影响。取的数据越多越影响。所以,我们的监控工具选择的时候,基本也使用和运维同样的工具。 这样测试出现的结果也和生产一样了。因为生产上也是用这些监控工具来做的。
1 - wchao1902023-02-13 来自上海大的方向都知道,但是具体到去定位问题就无从下手了,后面有这种案例吗?另外,部署在阿里云的微服务如何安装os监控工具?开发们用yaml部署的k8s服务,如何去搭建监控工具?因为,他们有时候也不知道怎么搞,运维不在一个基地,又见不着面,头疼。
作者回复: k8s有相应的监控工具。prometheus就可以支撑。 不在同一地方的团队合作属于管理问题了,这个只能根据实际情况协调了。
- Geek_f5de6e2022-12-08 来自北京老师k8s+docker的那个图用什么工具画的呢?
作者回复: prometheus的模板。
- 王盛东2022-12-06 来自广东老师, 学习这些监控指标有什么推荐书籍么,谢谢~
作者回复: 暂时我还没看到有这样的书籍。
- 麥白2022-11-21 来自上海第二遍,收益继续累加中~
作者回复: 学习就像跑步,每一步都算数。
- A0桑荫不徙2021-11-16看完,只是知道监控要分全局和定向,可是关于具体每个组件的全局和定向都有哪些,还是不太清楚如何去识别,尤其是如果这个组件都没怎么用过的时候
作者回复: 对组件的理解是基础知识。是需要去补充学习的。像操作系统基础、数据库基础等等。