以太坊作为全球领先的智能合约平台,其账户模型是整个区块链系统的基石,理解账户的源码实现,对于深入把握以太坊的工作原理、安全机制以及开发安全、高效的DApp至关重要,本文将从以太坊账户的核心概念入手,逐步深入其Go语言(以太坊客户端Geth的主要实现语言)源码,剖析外部账户(EOA)和合约账户的内部结构、创建流程、状态管理及其在以太坊生态系统中的关键作用。

以太坊账户模型概览

在以太坊中,账户是状态的基本单位,分为两种类型:

  1. 外部账户(Externally Owned Account, EOA):由私钥控制,没有关联代码,用户通过私钥签名交易来发起操作,如转账、部署合约等,其标识是地址。
  2. 合约账户(Contract Account):由智能合约代码控制,合约账户的地址由创建它的交易(通常是另一个账户部署合约)决定,它可以存储数据,并在接收到交易或消息时自动执行其代码。

这两种账户共享同一个地址空间,即以太坊上的每一个地址都对应一个账户,要么是EOA,要么是合约账户,账户状态存储在以太坊的状态数据库(MPT,Merkle Patricia Trie)中。

账户的核心数据结构(源码视角)

在以太坊Geth的core/types包中,Account结构体定义了账户的基本信息,它主要反映的是账户的状态快照,而非完整的账户对象(完整的账户对象在状态树中)。

// core/types/account.go
type Account struct {
    Nonce    uint64
    Balance  *big.Int
    Root     common.Hash // 仅合约账户有,指向存储树的根
    CodeHash common.Hash
}

这个结构体包含了账户的关键状态信息:

  • Nonce
    • EOA:该账户发起的交易序号,用于防止重放攻击,确保每笔交易都是唯一的。
    • 合约账户:该账户创建的合约数量(即其创建的交易序号)。
  • Balance:账户持有的以太币余额,以Wei为单位(1 ETH = 10^18 Wei)。
  • Root仅合约账户有效,指向一个MPT(Merkle Patricia Trie)的根哈希,该MPT存储了合约账户的存储数据(Storage),每个合约账户都有自己的独立存储空间。
  • CodeHash仅合约账户有效,指向合约代码的哈希值,以太坊中,合约代码本身是存储在状态数据库的一个独立区域,通过CodeHash来索引,EOA的CodeHash为空。

状态对象(StateObject)的源码实现

在Geth的状态管理模块(core/state)中,StateObject结构体代表了内存中的一个账户对象,它包含了Account结构体的信息,并提供了修改账户状态的方法。

// core/state/state_object.go
type StateObject struct {
    address  common.Address
    data     Account
    db       Database
    dbErr    error
    // 其他字段,如标记是否被修改、是否被删除等
    dirty    bool
    deleted  bool
    onCommit func(addr common.Address) // 提交时的回调函数
    // 对于合约账户,可能还会缓存存储等
    // ...
}

StateObject是操作账户状态的核心,它封装了对账户数据的读写,并负责在状态转换时(如处理交易后)更新状态树。

账户的创建与初始化(源码视角)

外部账户(EOA)的“创建”

EOA本身并不像合约账户那样有一个明确的“创建”过程,它是由用户拥有私钥“衍生”出来的,当用户导入私钥或新密钥对时,客户端可以根据私钥计算出地址,然后从状态数据库中查询该地址对应的账户状态,如果不存在,则可以认为是一个新的EOA,其初始状态为Nonce=0, Balance=0, CodeHash=空。

合约账户的创建

合约账户的创建通常由一个创建交易(CREATE)或另一个合约账户通过创建指令(CREATE opcode)触发,其源码流程大致如下:

  1. 交易处理:在core/executorcore/tx_processor中,当处理到一个类型为Create的交易时,会执行合约部署逻辑。
  2. 创建合约账户
    • 系统会根据发送方(EOA或合约账户)的地址和其当前Nonce,计算出新的合约账户地址,地址的计算公式通常是: 合约地址 = keccak256(发送方地址 + 发送方Nonce)[12:] (简化描述,实际Geth实现中可能有细微差别,如Create2)。
    • 在状态数据库中,为这个新地址创建一个初始的StateObject,其Nonce为1(因为创建合约本身消耗了发送方的一个Nonce),Balance为0,Root为空(初始存储为空),CodeHash为空。
  3. 执行合约代码
    • 将合约的字节码(作为交易的数据部分)作为初始化代码执行。
    • 在执行初始化代码的过程中,可能会进行存储操作(写入SSTORE opcode),这些操作会更新合约账户的存储树(MPT)。
    • 初始化代码执行完毕后,通常会返回最终的合约代码(通过RETURN opcode)。
  4. 设置合约代码
    • 执行引擎会将返回的合约代码存储起来,并计算其CodeHash。
    • 更新新创建的StateObjectCodeHash字段,并将合约代码本身存储到状态数据库的代码区域(通过CodeHash索引)。
    • 初始化代码执行过程中的所有存储操作也会被持久化到合约账户的存储树中。

Geth中与合约创建相关的代码主要在core/vm/execution.go随机配图