面向对象的编程在实现想法乃至系统的过程中都非常重要,我们不论是使用 TensorFlow 还是 PyTorch 来构建模型都或多或少需要使用类和方法。而采用类的方法来构建模型会令代码非常具有可读性和条理性,本文介绍了算法实现中使用类和方法来构建模型所需要注意的设计原则,它们可以让我们的机器学习代码更加美丽迷人。
大多数现代编程语言都支持并且鼓励面向对象编程(OOP)。即使我们最近似乎看到了一些偏离,因为人们开始使用不太受 OOP 影响的编程语言(例如 Go, Rust, Elixir, Elm, Scala),但是大多数还是具有面向对象的属性。我们在这里概括出的设计原则也适用于非 OOP 编程语言。
为了成功地写出清晰的、高质量的、可维护并且可扩展的代码,我们需要以 Python 为例了解在过去数十年里被证明是有效的设计原则。
1. 实体对象
这类对象通常对应着问题空间中的一些现实实体。比如我们要建立一个角色扮演游戏(RPG),那么简单的 Hero 类就是一个实体对象。
- class Hero:
- def __init__(self, health, mana):
- self._health = health
- self._mana = mana
- def attack(self) -> int:
- """
- Returns the attack damage of the Hero
- """
- return 1
- def take_damage(self, damage: int):
- self._health -= damage
- def is_alive(self):
- return self._health > 0
这类对象通常包含关于它们自身的属性(例如 health 或 mana),这些属性根据具体的规则都是可修改的。
2. 控制对象(Control Object)
控制对象(有时候也称作管理对象)主要负责与其它对象的协调,这是一些管理并调用其它对象的对象。我们上面的 RPG 案例中有一个很棒的例子,Fight 类控制两个英雄,并让它们对战。
- class Fight:
- class FightOver(Exception):
- def __init__(self, winner, *args, **kwargs):
- self.winner = winner
- super(*args, **kwargs)
- def __init__(self, hero_a: Hero, hero_b: Hero):
- self._hero_a = hero_a
- self._hero_b = hero_b
- self.fight_ongoing = True
- self.winner = None
- def fight(self):
- while self.fight_ongoing:
- self._run_round()
- print(f'The fight has ended! Winner is #{self.winner}')
- def _run_round(self):
- try:
- self._run_attack(self._hero_a, self._hero_b)
- self._run_attack(self._hero_b, self._hero_a)
- except self.FightOver as e:
- self._finish_round(e.winner)
- def _run_attack(self, attacker: Hero, victim: Hero):
- damage = attacker.attack()
- victim.take_damage(damage)
- if not victim.is_alive():
- raise self.FightOver(winner=attacker)
- def _finish_round(self, winner: Hero):
- self.winner = winner
- self.fight_ongoing = False
在这种类中,为对战封装编程逻辑可以给我们提供多个好处:其中之一就是动作的可扩展性。我们可以很容易地将参与战斗的英雄传递给非玩家角色(NPC),这样它们就能利用相同的 API。我们还可以很容易地继承这个类,并复写一些功能来满足新的需要。
3. 边界对象(Boundary Object)
- class UserInput:
- def __init__(self, input_parser):
- self.input_parser = input_parser
- def take_command(self):
- """
- Takes the user's input, parses it into a recognizable command and returns it
- """
- command = self._parse_input(self._take_input())
- return command
- def _parse_input(self, input):
- return self.input_parser.parse(input)
- def _take_input(self):
- raise NotImplementedError()
- class UserMouseInput(UserInput):
- pass
- class UserKeyboardInput(UserInput):
- pass
- class UserJoystickInput(UserInput):
- pass
4. Bonus:值对象(Value Object)
如果将它们结合在我们的游戏中,Money 类或者 Damage 类就表示这种对象。上述的对象让我们容易地区分、寻找和调试相关功能,然而仅使用基础的整形数组或者整数却无法实现这些功能。
- class Money:
- def __init__(self, gold, silver, copper):
- self.gold = gold
- self.silver = silver
- self.copper = copper
- def __eq__(self, other):
- return self.gold == other.gold and self.silver == other.silver and self.copper == other.copper
- def __gt__(self, other):
- if self.gold == other.gold and self.silver == other.silver:
- return self.copper > other.copper
- if self.gold == other.gold:
- return self.silver > other.silver
- return self.gold > other.gold
- def __add__(self, other):
- return Money(gold=self.gold + other.gold, silver=self.silver + other.silver, copper=self.copper + other.copper)
- def __str__(self):
- return f'Money Object(Gold: {self.gold}; Silver: {self.silver}; Copper: {self.copper})'
- def __repr__(self):
- return self.__str__()
- print(Money(1, 1, 1) == Money(1, 1, 1))
- # => True
- print(Money(1, 1, 1) > Money(1, 2, 1))
- # => False
- print(Money(1, 1, 0) + Money(1, 1, 1))
- # => Money Object(Gold: 2; Silver: 2; Copper: 1)
1. 抽象(Abstraction)
上面的游戏案例阐述了抽象,让我们来看一下 Fight 类是如何构建的。我们以尽可能简单的方式使用它,即在实例化的过程中给它两个英雄作为参数,然后调用 fight() 方法。不多也不少,就这些。
注意,我们的 Hero#take_damage() 函数不会做一些异常的事情,例如在还没死亡的时候删除角色。但是如果他的生命值降到零以下,我们可以期望它来杀死我们的角色。
2. 封装
在大多数编程语言中,封装都是通过所谓的 Access modifiers(访问控制修饰符)来完成的(例如 private,protected 等等)。Python 并不是这方面的最佳例子,因为它不能在运行时构建这种显式修饰符,但是我们使用约定来解决这个问题。变量和函数前面的_前缀就意味着它们是私有的。
举个例子,试想将我们的 Fight#_run_attack 方法修改为返回一个布尔变量,这意味着战斗结束而不是发生了意外。我们将会知道,我们唯一可能破坏的代码就是 Fight 类的内部,因为我们是把这个函数设置为私有的。
3. 分解
试想我们现在希望 Hero 类能结合更多的 RPG 特征,例如 buffs,资产,装备,角色属性。
- class Hero:
- def __init__(self, health, mana):
- self._health = health
- self._mana = mana
- self._strength = 0
- self._agility = 0
- self._stamina = 0
- self.level = 0
- self._items = {}
- self._equipment = {}
- self._item_capacity = 30
- self.stamina_buff = None
- self.agility_buff = None
- self.strength_buff = None
- self.buff_duration = -1
- def level_up(self):
- self.level += 1
- self._stamina += 1
- self._agility += 1
- self._strength += 1
- self._health += 5
- def take_buff(self, stamina_increase, strength_increase, agility_increase):
- self.stamina_buff = stamina_increase
- self.agility_buff = agility_increase
- self.strength_buff = strength_increase
- self._stamina += stamina_increase
- self._strength += strength_increase
- self._agility += agility_increase
- self.buff_duration = 10 # rounds
- def pass_round(self):
- if self.buff_duration > 0:
- self.buff_duration -= 1
- if self.buff_duration == 0: # Remove buff
- self._stamina -= self.stamina_buff
- self._strength -= self.strength_buff
- self._agility -= self.agility_buff
- self._health -= self.stamina_buff * 5
- self.buff_duration = -1
- self.stamina_buff = None
- self.agility_buff = None
- self.strength_buff = None
- def attack(self) -> int:
- """
- Returns the attack damage of the Hero
- """
- return 1 + (self._agility * 0.2) + (self._strength * 0.2)
- def take_damage(self, damage: int):
- self._health -= damage
- def is_alive(self):
- return self._health > 0
- def take_item(self, item: Item):
- if self._item_capacity == 0:
- raise Exception('No more free slots')
- self._items[item.id] = item
- self._item_capacity -= 1
- def equip_item(self, item: Item):
- if item.id not in self._items:
- raise Exception('Item is not present in inventory!')
- self._equipment[item.slot] = item
- self._agility += item.agility
- self._stamina += item.stamina
- self._strength += item.strength
- self._health += item.stamina * 5
- # 缺乏分解的案例
例如,我们的耐力分数为 5 个生命值,如果将来要修改为 6 个生命值,我们就要在很多地方修改这个实现。
解决方案就是将 Hero 对象分解为多个更小的对象,每个小对象可承担一些功能。下面展示了一个逻辑比较清晰的架构:
- from copy import deepcopy
- class AttributeCalculator:
- @staticmethod
- def stamina_to_health(self, stamina):
- return stamina * 6
- @staticmethod
- def agility_to_damage(self, agility):
- return agility * 0.2
- @staticmethod
- def strength_to_damage(self, strength):
- return strength * 0.2
- class HeroInventory:
- class FullInventoryException(Exception):
- pass
- def __init__(self, capacity):
- self._equipment = {}
- self._item_capacity = capacity
- def store_item(self, item: Item):
- if self._item_capacity < 0:
- raise self.FullInventoryException()
- self._equipment[item.id] = item
- self._item_capacity -= 1
- def has_item(self, item):
- return item.id in self._equipment
- class HeroAttributes:
- def __init__(self, health, mana):
- self.health = health
- self.mana = mana
- self.stamina = 0
- self.strength = 0
- self.agility = 0
- self.damage = 1
- def increase(self, stamina=0, agility=0, strength=0):
- self.stamina += stamina
- self.health += AttributeCalculator.stamina_to_health(stamina)
- self.damage += AttributeCalculator.strength_to_damage(strength) + AttributeCalculator.agility_to_damage(agility)
- self.agility += agility
- self.strength += strength
- def decrease(self, stamina=0, agility=0, strength=0):
- self.stamina -= stamina
- self.health -= AttributeCalculator.stamina_to_health(stamina)
- self.damage -= AttributeCalculator.strength_to_damage(strength) + AttributeCalculator.agility_to_damage(agility)
- self.agility -= agility
- self.strength -= strength
- class HeroEquipment:
- def __init__(self, hero_attributes: HeroAttributes):
- self.hero_attributes = hero_attributes
- self._equipment = {}
- def equip_item(self, item):
- self._equipment[item.slot] = item
- self.hero_attributes.increase(stamina=item.stamina, strength=item.strength, agility=item.agility)
- class HeroBuff:
- class Expired(Exception):
- pass
- def __init__(self, stamina, strength, agility, round_duration):
- self.attributes = None
- self.stamina = stamina
- self.strength = strength
- self.agility = agility
- self.duration = round_duration
- def with_attributes(self, hero_attributes: HeroAttributes):
- buff = deepcopy(self)
- buff.attributes = hero_attributes
- return buff
- def apply(self):
- if self.attributes is None:
- raise Exception()
- self.attributes.increase(stamina=self.stamina, strength=self.strength, agility=self.agility)
- def deapply(self):
- self.attributes.decrease(stamina=self.stamina, strength=self.strength, agility=self.agility)
- def pass_round(self):
- self.duration -= 0
- if self.has_expired():
- self.deapply()
- raise self.Expired()
- def has_expired(self):
- return self.duration == 0
- class Hero:
- def __init__(self, health, mana):
- self.attributes = HeroAttributes(health, mana)
- self.level = 0
- self.inventory = HeroInventory(capacity=30)
- self.equipment = HeroEquipment(self.attributes)
- self.buff = None
- def level_up(self):
- self.level += 1
- self.attributes.increase(1, 1, 1)
- def attack(self) -> int:
- """
- Returns the attack damage of the Hero
- """
- return self.attributes.damage
- def take_damage(self, damage: int):
- self.attributes.health -= damage
- def take_buff(self, buff: HeroBuff):
- self.buff = buff.with_attributes(self.attributes)
- self.buff.apply()
- def pass_round(self):
- if self.buff:
- try:
- self.buff.pass_round()
- except HeroBuff.Expired:
- self.buff = None
- def is_alive(self):
- return self.attributes.health > 0
- def take_item(self, item: Item):
- self.inventory.store_item(item)
- def equip_item(self, item: Item):
- if not self.inventory.has_item(item):
- raise Exception('Item is not present in inventory!')
- self.equipment.equip_item(item)
现在,在将 Hero 对象分解为 HeroAttributes、HeroInventory、HeroEquipment 和 HeroBuff 对象之后,未来新增功能就更加容易、更具有封装性、具有更好的抽象,这份代码也就越来越清晰了。
4. 泛化
- # Two methods which share common characteristics
- def take_physical_damage(self, physical_damage):
- print(f'Took {physical_damage} physical damage')
- self._health -= physical_damage
- def take_spell_damage(self, spell_damage):
- print(f'Took {spell_damage} spell damage')
- self._health -= spell_damage
- # vs.
- # One generalized method
- def take_damage(self, damage, is_physical=True):
- damage_type = 'physical' if is_physical else 'spell'
- print(f'Took {damage} {damage_type} damage')
- self._health -= damage
- class Entity:
- def __init__(self):
- raise Exception('Should not be initialized directly!')
- def attack(self) -> int:
- """
- Returns the attack damage of the Hero
- """
- return self.attributes.damage
- def take_damage(self, damage: int):
- self.attributes.health -= damage
- def is_alive(self):
- return self.attributes.health > 0
- class Hero(Entity):
- pass
- class NPC(Entity):
- pass
这里,我们通过将它们的共同功能移动到基本类中来减少复杂性,而不是让 NPC 类和 Hero 类将所有的功能都实现两次。
继承常常被没有经验的程序员滥用,这可能是由于继承是他们首先掌握的 OOP 技术。
5. 组合
使用组合原则的对象就被称作组合对象(composite object)。这种组合对象在要比所有组成部分都简单,这是非常重要的一点。当把多个类结合成一个类的时候,我们希望把抽象的层次提高一些,让对象更加简单。
组合对象的 API 必须隐藏它的内部模块,以及内部模块之间的交互。就像一个机械时钟,它有三个展示时间的指针,以及一个设置时间的旋钮,但是它内部包含很多运动的独立部件。
- class Entity:
- def __init__(self, x, y):
- self.x = x
- self.y = y
- raise Exception('Should not be initialized directly!')
- def attack(self) -> int:
- """
- Returns the attack damage of the Hero
- """
- return self.attributes.damage
- def take_damage(self, damage: int):
- self.attributes.health -= damage
- def is_alive(self):
- return self.attributes.health > 0
- def move_left(self):
- self.x -= 1
- def move_right(self):
- self.x += 1
- class Hero(Entity):
- pass
- class NPC(Entity):
- pass
我们的解决方案可能是简单地将 move 逻辑移动到独立的 MoveableEntity 或者 MoveableObject 类中,这种类仅仅含有那项功能。
一个从某种程度来说比较好的方法是将动作逻辑抽象为 Movement 类(或者其他更好的名字),并且在可能需要的类里面把它实例化。这将会很好地封装函数,并使其在所有种类的对象中都可以重用,而不仅仅局限于实体类。
6. 批判性思考
1. 内聚(Cohesion)
2. 耦合
3. 分离关注点
网页就是一个很好的例子,它具有三个层(信息层、表示层和行为层),这三个层被分为三个不同的地方(分别是 HTML,CSS,以及 JS)。
如果重新回顾一下我们的 RPG 例子,你会发现它在最开始具有很多关注点(应用 buffs 来计算袭击伤害、处理资产、装备条目,以及管理属性)。我们通过分解将那些关注点分割成更多的内聚类,它们抽象并封装了它们的细节。我们的 Hero 类现在仅仅作为一个组合对象,它比之前更加简单。
