北京华网天下

从代码菜鸟到高手：如何写出整洁的面向对象代码

2024-07-18

来源：网络整理

伯乐在线/程序员的故事已获得授权转载

代码，顾名思义就是整洁的代码，或者说是清晰漂亮的代码，相信大多数工程师都希望能够写出这样的代码。

也许这是一个对不同的人来说角度不同的话题，每个工程师都有自己的理解。比如我从被批评写出糟糕的代码，到逐渐学习成长，现在我能写出“像人一样”的代码。这期间我积累了一些经验，想分享给大家，激发讨论。

本文主要描述面向对象的编程代码。过程式代码的思路有所不同，不属于本文的讨论范围。

整洁代码的前提

很多时候，代码是用来维护的，而不是用来实现功能的。

这个原则适用于大多数项目，一方面我们的代码是写给机器执行的，完成功能需求；另一方面，代码是写给队友和自己看的，需要长期维护，大多数项目都不是短命的。

大多数情况下，如果你不能写出清晰、好看的代码，也许你会高兴一时，但后续维护的代价和成本会比你想象的要高得多。

追求清晰优美的代码比一切技巧都重要。

大多数好的代码都是自我描述的，比文档和注释更好。

当你翻阅大量开源代码时，会发现注释甚至比我们自己写的项目还要少，但读起来还是很舒服的。当你读完源码，很多功能设计都清晰明了。通过精心思考的方法命名和清晰的流程控制，代码本身可以作为文档，而且永远不会过期。

相反，注释并不能使糟糕的代码变得更好。如果别人只能依靠注释来理解你的代码，你就必须反思一下代码到底哪里出了问题（当然，这并不意味着你不应该写注释）。

我们来说一下比较适合写评论的两种场景：

，清楚地向其他人发布你的函数的语义、输入和输出，而无需担心实现。

当功能有歧义或者涉及很深的专业知识的时候，比如你正在写一个客户端，各种参数的含义等等。

设计模式只是手段，清晰的代码才是目的

我见过一些所谓的“专家”写出相对抽象的代码，有各种工厂和继承。找到实现总是一条漫长而曲折的道路。项目中的大多数类都是抽象类或接口。如果找不到一两行实现代码，阅读代码是非常困难的。当我和他交谈时，他的主要立场是：保留适当的扩展点并克服所有硬编码。

其实在我看来，或许他的代码是“过度设计”的。首先我们必须承认，在同一家公司工作的同事水平参差不齐，无论你采用的设计有多高端，如果大多数人看不懂你的代码，或者觉得难以阅读，其实这是一个失败的设计。

当你的系统中大多数抽象只有一种实现时，你应该仔细考虑一下设计是否有点过度设计。清晰度永远是第一原则。

清洁代码的常用方法

记住了原理之后，我们就开始进入实战阶段，我们先来看一下常见的促成代码的手段。

代码

很多大公司都是用git的pull机制来写代码的，我们该关注什么呢？是代码格式，业务逻辑还是代码风格？我想说的是，凡是机器能检查的东西，就不需要人来检查了。比如换行，注释，方法长度，代码重复等等。除了基本功能需求的逻辑合理性，没有bug之外，我们更应该关注代码的设计和风格。比如，某个函数是否应该属于某个类，是否有很多类似的函数可以提取出来复用，代码是否过于冗长难以理解等等。

我个人非常提倡集体代码，因为往往小组中比较资深的工程师可以一眼就发现代码中的重大设计缺陷，并提出改进或重构的方法，可以在整个小组内部形成良好的文化底蕴和风格统一，很大程度上培养了大家对代码的热情。

勤奋重构

好的代码通常不是一蹴而就的，即使一开始很优秀，但随着业务的快速迭代，也有可能被改得面目全非。

为了避免重构带来的负面影响（需求或者bug），我们需要做到以下几点：

①掌握一些常见的“无痛”重构技术，下面会详细讲解。

②小步快跑。不要妄图一口吃掉一个胖子。一点点改，一点点测试，一方面减少编码的痛苦，另一方面减少上线的风险。

③建立自动化测试机制，保证即使代码被错误修改，系统最小核心功能仍然可用，并且修改的部分被测试覆盖。

④ 熟练掌握IDE的自动重构功能。这将大大减少我们的体力劳动，避免犯错。

静态检查

市面上有很多代码静态检查工具，这也是一种比较容易发现 Bug 和不良风格的手段。它们可以和发布系统集成，强制修复主要问题后再上线。目前质量管理平台已经在美团点评技术团队内部广泛接入研发流程。

阅读更多开源代码和身边优秀同学的代码

感谢开源社区给我们提供了这么好的学习机会，不管是JDK的源码，还是经典的、、、或者一些小工具等等，都是代码示例，多学习，多反思，多总结，一定会受益匪浅。

清洁代码的常用技巧

前面的内容只是热身，让大家有个大概的了解，现在终于进入实战部分，我会从几个角度讲解编写干净代码的常见技巧和误区。

一般提示

单一职责

这是干净代码最重要和最基本的原则。简单来说，从单个事物到单个属性，所有事物都应该有明确的职责。如果你不能用一句话描述某件事的职责，那就把它删掉。

当我们编写代码时，最常犯的错误是一个方法执行多项操作或一个类承载多项功能。

先说方法吧。我极力主张把方法拆开，这是复用的基础。如果一个方法做了两件事，很可能其中一个功能和另外一个业务不一样，不容易复用。另外语义不清晰，我经常看到一个 get() 方法居然修改了数据。这对使用你的方法的人来说有多尴尬？如果你不点进去看看实现，可能会让程序陷入 bug，让测试陷入困境。

再说一下类的问题，我们经常看到“又长又臭”的/biz层代码，里面有几十个方法，增删改查什么的都有，还有业务逻辑的聚合，每次都很难找到一个方法，不属于同一领域或者层级的函数不要放在一起。

对我们团队的代码最常见的批评是某个方法应该属于哪个类。

优先定义总体框架

我写代码的时候，喜欢先定义整体框架，也就是写很多空的实现来串起整体业务流程。好的方法签名使用输入和输出参数来控制流程。这样可以避免陷入业务细节。先在脑子里定义流程的各个阶段，然后为每个阶段找到合适的方法/类。

这样做的好处是读你代码的人无论读得多深都能清楚的了解每一层的作用，如果不关心下一层实现的话可以直接跳过，方法的粒度就刚刚好。

总之，我写代码时更喜欢“广度优先”而不是“深度优先”，这和我读代码的方式一致。当然这跟个人的思维习惯有关系，可能对抽象思维能力要求比较高。如果在开始写代码时这些都不清楚，至少要不断重构，让代码达到这个水平。

清晰命名

这个老话题我就不细说了，但不得不记下来。有时候，我思考一个方法的命名时间，比写一段代码的时间还要长。原因还是那句话：每次写一个像“temp”、“a”、“b”这样的变量，每个维护代码的人，都需要花几倍的精力去梳理。

而这也是代码自描述的最重要的基础。

避免使用长参数

如果一个方法参数的长度超过了4个，就需要提高警惕了。一方面，没人能记住这些函数的语义；另一方面，代码的可读性会很差；最后，如果参数太多，就意味着肯定有很多参数在很多场景下是没用的，我们只能构造默认值来传递它们。

这个问题的解决方法很简单，一般我们会构造一个或者一个来携带数据，一般这个对象都是不可变的对象，这样可以大大提高代码的复用性和可读性，必要时提供适当的方法来简化上层代码的开发成本。

避免使用过长的方法和类

当一个类或方法太长时，读者总会感到沮丧。简单地将方法、类和职责拆分开来，往往会有立竿见影的效果。以类为例，拆分的维度有很多，最常见的就是水平/垂直。例如，如果一个类处理了与库表对象相关的所有逻辑，水平拆分就是将创建/更新/修改/通知逻辑按照业务拆分到不同的类中；而垂直拆分就是

将数据库操作/MQ操作/操作/对象验证等分离到不同的对象中，让主流程尽可能简单可控，尽量让同一个类表达同一维度的事物。

让相同长度的代码段表示相同粒度的逻辑

我这里想要表达的是，提取尽可能多的方法，使得代码具有自描述性。

g（地图，地图）{

执行1执行1 = ();

Do2 do2 = ();

do2.设置A(.get("a"));

do2.设置B(.get("b"));

do2.设置C(.get("c"));

（执行1，执行2）；

（地图）;

（do1，do2）{…}；

这样的代码在业务代码中随处可见，获取do1是一个方法，但是获取do2的代码却写在主流程中。这种代码，流程越长，读起来越累。很多人读代码都是“广度优先”，先看主流程，再看细节。这样的代码，如果能把构造do2的代码抽取出来，放到一个方法中，那就舒服多了。

面向对象设计技术

贫血和领域驱动

不得不承认它已经成为企业级Java开发事实上的标准，大部分公司采用的三层/四层贫血模型使得我们的编码习惯变成了面向DAO的，而不是面向对象的。

缺乏必要的模型抽象和设计环节，导致代码冗长，复用度比较差，每次写代码，从头开始似乎已经成为一种不成文的规范。

优点是上手容易，学习成本低。但是每次都无法复用，然后看着那两三千行的类就头晕了，内心很痛苦。本文就不展开领域驱动设计模式了，回归面向对象，跟大家分享一些更好的编码技巧，让大家在通用的框架下，尽可能写出漂亮且复用性高的代码。

我个人认为一个好的系统必须建立在好的模型定义之上，梳理系统中的核心模型，明确定义各个方法的类归属，对代码的可读性、互操作性，以及与产品的沟通都会有很大的益处。

为每种方法找到正确的类，并尝试将数据和行为保持在一起

如果一个类的所有方法都对另一个类的对象进行操作，那么你就要好好思考一下这个类的设计是否合理了。面向对象设计在理论上主张数据和行为应该在一起。这样对象之间的结构清晰，可以减少很多不必要的参数传递。

但是这里要讨论的还有一种方法：对象。如果所有操作对象数据的方法都构建在对象内部，那么对象可能会携带许多不属于其自身功能的方法。

比如我定义一个类叫，。这个类有很多行为，比如：吃饭，睡觉，上厕所，生孩子；还有很多字段，比如：姓名，年龄，性格。

显然，领域在更大程度上定义和描述了我这个人，但很多行为跟我的领域无关，上厕所什么的，我不管我多大年纪，如果把跟人有关的行为都往内部扛，这个类肯定会臃肿。

这就是方法的价值体现的时候了，如果一个行为不能明确标识出它属于哪个领域对象，那么强行把它归到领域对象中就显得不自然了，这时候无状态就能发挥它的作用了，但是要把握好度，回归本质，要合理定义属于各个模型的行为。

警报

方法本质上是面向过程的，无法清晰体现对象之间的关系。虽然可以用一些代码实例的无状态方法来表示（比如实现单例或者自己托管），但这种抽象是浅薄的。说白了，如果我们把所有的调用位置都写出来，那么所有的功能就都由类自己来承载了。

让我画一个类图？抱歉，我不会画。

单例的膨胀很大程度上也是贫血模型的一个副作用，如果对象本身是有血有肉的，就没必要有那么多无状态的方法了。

真正适用的场景：工具方法，而不是商业方法。

巧妙利用

是大规模重构的常用手法。当一段逻辑特别复杂的代码，充斥着各种参数传递和非因果判断时，我首先想到的重构方法就是提取。所谓提取，就是一个有数据和行为的对象，依赖的数据会成为这个对象的变量，所有的行为都会成为这个对象的内部方法。用成员变量代替参数传递，会让代码简洁清晰很多。另外，将过程式代码转换成对象式代码，为面向对象编程中才能用到的继承/封装/多态提供了基础。

例如，上面引用的代码如果表达为

{

地图 ;

做1做1；

做2做2；

（地图，地图）{

这个。=；

（）{

do1 = ();

do2 = ();

（执行1，执行2）；

（）；