Java后端最全技术栈指南详解(java技术栈有哪些)

前几天,有个搞培训的朋友,和我要一份java后端目前最常用的工具和框架,正好我以前画过这样一张图,于是发给了他。虽然不是很全,但也希望得到他的夸奖。没想到…

本篇内容涵盖14个方面,涉及上百个框架和工具。会有你喜欢的,大概也会有你所讨厌的家伙。这是我平常工作中打交道最多的工具,大小公司都适用。如果你有更好的,欢迎留言补充。一、消息队列二、缓存三、分库分表四、数据同步五、通讯六、微服务七、分布式工具八、监控系统九、调度十、入口工具十一、OLT(A)P十二、CI/CD十三、问题排查十四、本地工具复制代码

一、消息队列

一个大型的分布式系统,通常都会异步化,走消息总线。 消息队列作为最主要的基础组件,在整个体系架构中,有着及其重要的作用。kafka是目前最常用的消息队列,尤其是在大数据方面,有着极高的吞吐量。而rocketmq和rabbitmq,都是电信级别的消息队列,在业务上用的比较多。2019年了,不要再盯着JMS不放了(说的就是臃肿的ActiveMQ)。

pulsar是为了解决一些kafka上的问题而诞生的消息系统,比较年轻,工具链有限。有些激进的团队经过试用,反响不错。

mqtt具体来说是一种协议,主要用在物联网方面,能够双向通信,属于消息队列范畴。

二、缓存

数据缓存是减少数据库压力的有效途径,有单机java内缓存,和分布式缓存之分。

对于单机来说,guava的cache和ehcache都是些熟面孔。

对于分布式缓存来说,优先选择的就是redis,别犹豫。由于redis是单线程的,并不适合高耗时操作。所以对于一些数据量比较大的缓存,比如图片、视频等,使用老牌的memcached效果会好的多。

JetCache是一个基于Java的缓存系统封装,提供统一的api和注解来简化缓存的使用。类似SpringCache,支持本地缓存和分布式缓存,是简化开发的利器。

三、分库分表

分库分表,几乎每一个上点规模的公司,都会有自己的方案。目前,推荐使用驱动层的sharding-jdbc,或者代理层的mycat。如果你没有额外的运维团队,又不想花钱买其他机器,那么就选前者。

如果分库分表涉及的项目不多,spring的动态数据源是一个非常好的选择。它直接编码在代码里,直观但不易扩展。

如果只需要读写分离 ,那么mysql官方驱动里的replication协议,是更加轻量级的选择。

上面的分库分表组件,都是大浪淘沙,最终的优胜品。这些组件不同于其他组件选型,方案一旦确定,几乎无法回退,所以要慎之又慎。

分库分表是小case,准备分库分表的阶段,才是重点:也就是数据同步。

四、数据同步

国内使用mysql的公司居多,但postgresql凭借其优异的性能,使用率逐渐攀升。

不管什么数据库,实时数据同步工具,都是把自己模拟成一个从库,进行数据拉取和解析。 具体来说,mysql是通过binlog进行同步;postgresql使用wal日志进行同步。

对mysql来说,canal是国内用的最多的方案;类似的databus也是比较好用的工具。

现在,canal、maxwell等工具,都支持将要同步的数据写入到mq中,进行后续处理,方便了很多。

对于ETL(抽取、清洗、转换)来说,基本上都是source、task、sink路线,与前面的功能对应。gobblin、datax、logstash、sqoop等,都是这样的工具。

它们的主要工作,就是怎么方便的定义配置文件,编写各种各样的数据源适配接口等。这些ETL工具,也可以作为数据同步(尤其是全量同步)的工具,通常是根据ID,或者最后更新时间 等,进行处理。

binlog是实时增量工具,ETL工具做辅助。通常一个数据同步功能,需要多个组件的参与,他们共同组成一个整体。

五、通讯

Java 中,netty已经成为当之无愧的网络开发框架,包括其上的socketio(不要再和我提mina了)。对于http协议,有common-httpclient,以及更加轻量级的工具okhttp来支持。

对于一个rpc来说,要约定一个通讯方式和序列化方式。json是最常用的序列化方式,但是传输和解析成本大,xml等文本协议与其类似,都有很多冗余的信息;avro和kryo是二进制的序列化工具,没有这些缺点,但调试不便。

rpc是远程过程调用的意思 ,其中,thrift、dubbo、gRPC默认都是二进制序列化方式的socket通讯框架;feign、hessian都是onhttp的远程调用框架。

对了,gRPC的序列化工具是protobuf,一个压缩比很高的二进制序列化工具。

通常,服务的响应时间主要耗费在业务逻辑以及数据库上,通讯层耗时在其中的占比很小。可以根据自己公司的研发水平和业务规模来选择。

六、微服务

我们不止一次说到微服务,这一次我们从围绕它的一堆支持框架,来窥探一下这个体系。是的,这里依然是在说spring cloud。

默认的注册中心eureka不再维护,consul已经成为首选。nacos、zookeeper等,都可以作为备选方案。其中nacos带有后台,比较适合国人使用习惯。

熔断组件,官方的hystrix也已经不维护了。推荐使用resilience4j,最近阿里的sentinel也表现强劲。

对于调用链来说,由于OpenTracing的兴起,有了很多新的面孔。推荐使用jaeger或者skywalking。spring cloud集成的sleuth+zipkin功能稍弱,甚至不如传统侵入式的cat。

配置中心是管理多环境配置文件的利器,尤其在你不想重启服务器的情况下进行配置更新。目前,开源中做的最好的要数apollo,并提供了对spring boot的支持。disconf使用也较为广泛。相对来说,spring cloud config功能就局限了些,用的很少。


网关方面,使用最多的就是nginx,在nginx之上,有基于lua脚本的openrestry。由于openresty的使用非常繁杂,所以有了kong这种封装级别更高的网关。

对于spring cloud来说,zuul系列推荐使用zuul2,zuul1是多线程阻塞的,有硬伤。spring-cloud-gateway是spring cloud亲生的,但目前用的不是很广泛。

七、分布式工具

大家都知道分布式系统zookeeper能用在很多场景,与其类似的还有基于raft协议的etcd和consul。

由于它们能够保证极高的一致性,所以用作协调工具是再好不过了。用途集中在:配置中心、分布式锁、命名服务、分布式协调、master选举等场所。

对于分布式事务方面,则有阿里的fescar工具进行支持。但如非特别的必要,还是使用柔性事务,追寻最终一致性,比较好。

八、监控系统

监控系统组件种类繁多,目前,最流行的大概就是上面四类。

zabbix在主机数量不多的情况下,是非常好的选择。

prometheus来势凶猛,大有一统天下的架势。它也可以使用更加漂亮的grafana进行前端展示。

influxdata的influxdb和telegraf组件,都比较好用,主要是功能很全。

使用es存储的elkb工具链,也是一个较好的选择。我所知道的很多公司,都在用。

九、调度

大家可能都用过cron表达式。这个表达式,最初就是来自linux的crontab工具。

quartz是java中比较古老的调度方案,分布式调度采用数据库锁的方式,管理界面需要自行开发。

elastic-job-cloud应用比较广泛,但系统运维复杂,学习成本较高。相对来说,xxl-job就更加轻量级一些。中国人开发的系统,后台都比较漂亮。

十、入口工具

为了统一用户的访问路口,一般会使用一些入口工具进行支持。

其中,haproxy、lvs、keepalived等,使用非常广泛。

服务器一般采用稳定性较好的centos,并配备ansible工具进行支持,那叫一个爽。

十一、OLT(A)P

现在的企业,数据量都非常大,数据仓库是必须的。

搜索方面,solr和elasticsearch比较流行,它们都是基于lucene的。solr比较成熟,稳定性更好一些,但实时搜索方面不如es。

列式存储方面,基于Hadoop 的hbase,使用最是广泛;基于LSM的leveldb写入性能优越,但目前主要是作为嵌入式引擎使用多一些。

tidb是国产新贵,兼容mysql协议,公司通过培训向外输出dba,未来可期。

时序数据库方面,opentsdb用在超大型监控系统多一些。druid和kudu,在处理多维度数据实时聚合方面,更胜一筹。

cassandra在刚出现时火了一段时间,虽然有facebook弃用的新闻,但生态已经形成,常年霸占数据库引擎前15名。

十二、CI/CD

为了支持持续集成和虚拟化,除了耳熟能详的docker,我们还有其他工具。

jenkins是打包发布的首选,毕竟这么多年了,一直是老大哥。当然,写Idea的那家公司,还出了一个叫TeamCity的工具,操作界面非常流畅。

sonar(注意图上的错误)不得不说是一个神器,用了它之后,小伙伴们的代码一片飘红,我都快被吐沫星子给淹没了。

对于公司内部来说,一般使用gitlab搭建git服务器。其实,它里面的gitlab CI,也是非常好用的。

十三、问题排查

java经常发生内存溢出问题。使用jmap导出堆栈后,我一般使用mat进行深入分析。

如果在线上实时分析,有arthas和perf两款工具。

当然,有大批量的linux工具进行支持。比如下面这些:

《Linux上,最常用的一批命令解析(10年精选)》

十四、本地工具

本地使用的jar包和工具,那就多了去了。下面仅仅提一下最最常用的几个。

数据库连接池方面,国内使用druid最多。目前,有号称速度最快的hikari数据库连接池,以及老掉牙的dbcp和c3p0。

json方面,国内使用fastjson最多,三天两头冒出个漏洞;国外则使用jackson多一些。它们的api都类似,jackson特性多一些,但fastjson更加容易使用。

声明:本文内容整理自网络,观点仅代表原作者本人,投稿号仅提供信息发布服务。如有侵权,请联系管理员。

投稿号的头像投稿号注册会员
上一篇 2022年10月1日
下一篇 2022年10月1日

热点推荐

  • 日本气象厅解除全部海啸预警

    观点网讯:1月2日,日本气象厅于当地时间上午10点(北京时间上午9点)解除了全部海啸预警。此次海啸预警的解除,对于日本沿海地区的居民和企业来说,无疑是一个重要的消息。 据相关数据显示,本次海啸预警共持续了数小时,期间引发了广泛的关…

    2024年1月8日
    70
  • 48岁阿信假唱风波后远走法国!发千字长文回应粉丝,但求无愧于心

    阿信离开法国回应“口型同步”争议 去年12月,一则有关48岁阿信与五月天假唱丑闻的新闻报道引起了音乐圈的广泛关注。 面对质疑和批评,阿信选择前往法国,为下一场巴黎演唱会做准备,并寻找自己音乐的初衷。 经过这次争议,阿信决定回应粉丝…

    2023年12月8日
    100
  • 两个女生气场不同的穿着效果也不一样,简单而美丽。

    很多女孩的身材各不相同,暴露出来的气质也不一样,看得出来,每个女孩都想拥有最好的身材,因为这样的身材,在夏天,就可以穿上更好看的衣服,让自己更有活力,把自己最完美的身材展现出来。每种形状各不相同,凸出的气场也不同。 其实,在日常生…

    2023年7月30日
    260
  • 研究发现即使是少量的运动也能极大地增加大脑的体积

    稿源:cnBeta锻炼使身体和心灵都保持健康,但对于体育锻炼如何以及在哪些方面影响我们的大脑却知之甚少。”在以前的研究中,大脑通常被视为一个整体,”神经科学家和当前研究的主要作者FabienneFox说。”我们的目标是对大脑进行…

    2022年10月7日
    1650
  • 抖音可以上传多长时间视频(怎样把视频发到抖音上)

    对于大多数抖音用户来讲,其实不止可以上传或者拍摄15秒的视频,也可以拍摄上传更长时间的视频,比如1分钟的视频,这个是比较简单的。具体只需打开抖音app,进入app后点击页面下方的“+”图标,在抖音拍摄页面下方就可以看到60秒选项,…

    2022年10月7日
    700
  • 48岁大姐成功应聘月薪3万麻将主播 背后的真相让人始料未及

    近日,四川一位48岁的王女士成功应聘成为月薪三万的麻将主播,引起了广大网友的关注和热议。在接受采访时,王女士分享了自己的成功经历,表示自己此前一直从事文职工作,看到麻将主播的招聘信息后,对自己符合招聘条件感到有信心。她拥有麻将等级…

    2023年8月15日
    250
  • 在线尺子测量工具_35cm是多长

    35cm有多长 cm是5/3倍的A4纸的短边长度。A4纸长是21cm,把第二张纸3等分的折叠,然后取两份,和第一张连起来放。厘米是一个 长度计量单位,等于一米的百分之一。长度单位,英语符号即缩写为:cm.,1厘米=1/100米。 …

    2023年6月17日
    330
  • ac什么意思(ac什么意思 算法)

    简要回答ac一般是简称,在不同的领域代表着不同的意思,一般情况下,ac就是交流电的简称。…

    2022年9月21日
    720
  • 华春莹回应俄在叙空中打击是怎么回事?

    10月8日,外交部发言人华春莹在例行记者会上就俄罗斯在叙利亚境内空中打击“伊斯兰国”恐怖分子答记者问表示,中方支持国际社会的反恐努力,希望有关各方加强沟通协调,形成合力。有记者问:9月30日以来,俄罗斯对叙利亚境内的“伊斯兰国…

    2022年10月11日
    630
  • 纪念币可以当钱花吗?

    01 银行纪念币中的普通纪念币可以当钱花,它是国家法定货币,具有和人民币等额的流通价值。不过,一般情况下,没有人会直接拿着银行纪念币在实际消费场景中使用。 纪念币是一个国家为纪念国际或本国的政治、历史、文化等方面的重大事件、杰出人…

    2023年10月12日
    160