小胖有技能|记录一次生产上的OOM解决过程一.项目架构SpringCloudDalston.SR1+Sp

一.项目架构
SpringCloudDalston.SR1+SpringBoot1.5.9+Mysql+Redis+RabbitMQ
所有的业务模块的应用服务都部署在同一个服务器，且单实例部署，服务器配置4核32G 。
二.原因分析
自己所负责的data模块这两天OOM较多，导致服务重启；
data服务主要业务是报表相关，数仓对接的业务以及多个外部数据相关的小程序的后台，与数据库的交互比较多，业务逻辑相对其他模块较为简单，
第一次：2月25日OOM情况:
由于Redis反序列化失败导致的OOM

文章图片
第二次：2月26日的OOM情况:
由于GC无法回收对象导致

文章图片
第一次发生OOM时，觉得可能就是由于Redis序列化器和反序列化器不一致，原有的JVM参数仅设置时-Xmx:512m-Xms:512m,老年代：年轻代=2：1 ，老年代大概分配有300M内存
时候排查问题时，发现Redis的使用都是用自己用RedisTemplate封装的工具类，按道理说不会出现什么问题，并未过多关注；
第二次发生OOM时，与第一次相距的时间仅为1天，当时就觉得问题不对了，
1.首先使用jmap-histo:livepid查看服务内存活的对象，发现[C类型的数组和ConcurrentHashMap对象都存活较多；
【小胖有技能|记录一次生产上的OOM解决过程】检查代码后发现并未有显示的使用该两类类型，怀疑时是String字符串过多导致的；
2.其次使用JDK自带的分析工具：jmap-dump:format=b,file=文件名[pid]导出OOM时的dump日志；
导出时间非常慢，且占用线上系统的CPU ，导致CPU达到100%
3.使用jstat-gcpid/jstat-gcutilpid查看gc的状况
发现gc和fgc的都非常多，特别是fgc已经达到1000多次；

文章图片
初步解决方案:（2月26日）
最后仍然是重启服务， -添加参数Xmx1024m-Xms:1024m
然后添加JVM参数（使用jinfo-flag可以在生产环境上直接添加）
jinfo-flag+HeapDumpBeforeFullGCpid
jinfo-flag+HeapDumpAfterFullGCpid
jinfo-flag+HeapDumpOnOutOfMemoryErrorpid
jinfo-flag+HeapDumpPath=/home/xxx/xxxpid添加dump日志的目录（需要提前建好）
jinfo-flag-XX:+PrintGCDetailspid开启gc日志
jinfo-flag-XX:+PrintGCDateStamps-Xloggc:/xxx/xxx设置gc日志的目录
修改完成后第二天根据fgc产生的dump日志，加载到jvisualVM里面之后发现也是[C占用内存较多
下午2点左右，监控线上服务时发现Old老年代的内存占用为300M ，总大小为700M,经过一次FGC之后占用70M ，这就比较正常了；
重点来了：
在2月26日添加完成JVM参数后，第二天同样的接口， FGC之前终于拿到了dump文件，大小是1.4G,接下来就是分析dump文件了，这里我选择了两个工具：
MAT与Jvisualvm
在使用体验来说JDK自带的Jvisualvm真的很垃圾，文件打开都要半个小时，果断放弃，转而使用MAT
导入dump文件以后如图

文章图片
这里主要是看LeakSuspects：其他的几个指标在此也说明一下:
1.Histogram可以列出内存中的对象，对象的个数以及大小。
2.DominatorTree可以列出那个线程，以及线程下面的那些对象占用的空间。
3.Topconsumers通过图形列出最大的object 。
4.LeakSuspects通过MA自动分析泄漏的原因。
打开LeakSuspects后可以看到线程堆栈如图

小胖有技能|记录一次生产上的OOM解决过程

推荐阅读

『核武器』在核武器“威胁”下的和平，真的算得上是真正的和平吗？

怀念亲人逝世的诗句有哪些？

委托招徕是什么意思招徕的读音

碧雪春是红茶吗,仙女红茶

下置饮水机第一次使用怎么清洗下置饮水机容易坏吗

越战经典战争电影大全

中国新闻网|谭耀宗：全国人大常委会决定令香港能够集中精力抗疫

澎湃新闻|建设银行一口气补齐两位副行长：吕家进、王浩履新

真爱你的人，会看重“两个字”，别不明白

[时尚迪科]叫“精致”A字裙，比真丝洋气，任谁见都想多看几眼，发现一女装

立夏的真名叫什么

净流入|7月8日恒生指数收盘上涨0.59%，南向资金当日净流入103.25亿元

静文|三件让人感到幸福的事情

俊妈故事会|准妈妈也该好好休息，别打扰宝宝发育，这3个时间是胎儿睡眠时间

姚哥乡村行1|营养丰富制作方法简单易学，孩子能多吃碗饭，味道正宗好吃下饭

适合刚成年的贷款平台(刚成年怎么借钱)

北晚新视觉网|医生5分钟取出，太危险！10个月大婴儿误食3厘米长别针

92岁老人与家人走失公交司机和乘客接力送她回家

肺癌▲我国每年80万人患上肺癌，身上有4处“变大”，一定要重视

便利店|每个离不开便利店的人都该去太原看看