Python 可变对象与不可变对象全面总结

1. 基本概念

不可变对象 (Immutable Objects)

定义：创建后状态不能被修改的对象
类型：int, float, str, tuple
特点：任何"修改"操作都会创建新对象

可变对象 (mutable Objects)

定义：创建后状态可以被修改的对象
类型：list, dict
特点：支持原地修改，对象标识保持不变

2. 实现机制对比

Python 的限制方式

# 不可变对象 - 通过接口限制
s = "hello"
# s[0] = "H"  # TypeError: 没有 __setitem__ 方法

# 可变对象 - 提供修改接口
lst = [1, 2, 3]
lst[0] = 99  # 正常工作，有 __setitem__ 方法

与 C 语言 const 的本质区别

特性	C语言 const	Python 不可变对象
限制层面	编译时类型系统	运行时对象行为
内存保护	可能触发段错误	只是没有修改接口
错误时机	运行时可能崩溃	立即抛出TypeError
绕过方式	类型转换可绕过	无法绕过

3. 内存模型可视化

不可变对象的内存模型

Python 执行环境
┌─────────────────┐    ┌─────────────────┐
│ 命名空间        │    │    堆内存        │
│ ├─ a → 0x100  │──→│ 0x100: int(5)    │
│ ├─ b → 0x100  │──→│ type: int        │
│ ├─ s1 → 0x200 │──→│ value: 5         │
│ └─ s2 → 0x200 │──→│ refcount: 2      │
└─────────────────┘    └─────────────────┘
                       ┌─────────────────┐
                       │ 0x200: str("abc")│
                       │ type: str       │
                       │ value: "abc"    │
                       │ refcount: 2     │
                       └─────────────────┘

可变对象的内存模型

Python 执行环境
┌─────────────────┐    ┌─────────────────┐
│ 命名空间        │    │    堆内存        │
│ ├─ lst1 → 0x300│──→│ 0x300: list     │
│ ├─ lst2 → 0x300│──→│ type: list      │
│ └─ lst3 → 0x400│──→│ items: [0x100, 0x500] │
└─────────────────┘    │ refcount: 2     │
                       └─────────────────┘
                       ┌─────────────────┐
                       │ 0x100: int(1)   │
                       │ 0x500: int(2)   │
                       └─────────────────┘

4. 变量系统的本质

Python 变量 = 对象引用（智能指针）

# 变量名本质是指向对象的引用
a = [1, 2, 3]  # a 是指向列表对象的引用
b = a          # b 指向同一个对象

print(a is b)  # True - 同一个对象
print(id(a) == id(b))  # True - 相同的内存地址

变量赋值的真实过程

创建对象（或在堆上分配内存）
在命名空间中建立变量名到对象的映射
增加对象的引用计数

5. 关键行为差异

赋值操作的影响

# 不可变对象 - 创建新对象
x = 5
print(f"Before: id(x) = {id(x)}")
x = x + 1  # 创建新整数对象
print(f"After: id(x) = {id(x)}")  # 不同的id

# 可变对象 - 修改原对象
lst = [1, 2, 3]
print(f"Before: id(lst) = {id(lst)}")
lst.append(4)  # 修改原对象
print(f"After: id(lst) = {id(lst)}")  # 相同的id

函数参数传递

def modify_immutable(x):
    """不可变参数 - 不影响原始值"""
    x = x + 1  # 创建新对象
    return x

def modify_mutable(lst):
    """可变参数 - 会影响原始对象"""
    lst.append(99)  # 修改原对象

num = 5
modify_immutable(num)
print(num)  # 5 - 不变

my_list = [1, 2, 3]
modify_mutable(my_list)
print(my_list)  # [1, 2, 3, 99] - 被修改

6. Python 的优化机制

小整数缓存 (-5 到 256)

a = 100
b = 100
print(a is b)  # True - 同一个缓存对象

x = 1000
y = 1000  
print(x is y)  # False - 不同对象

字符串驻留

s1 = "hello"
s2 = "hello"
print(s1 is s2)  # True - 字符串驻留

s3 = "hello world!"
s4 = "hello world!"
print(s3 is s4)  # False - 长字符串不驻留

7. 实际应用注意事项

常见的陷阱

# 陷阱1：可变默认参数
def bad_function(data=[]):  # 默认参数在定义时创建
    data.append("default")
    return data

print(bad_function())  # ['default']
print(bad_function())  # ['default', 'default'] - 意外！

# 正确做法
def good_function(data=None):
    if data is None:
        data = []  # 每次调用时创建新列表
    data.append("default")
    return data

8. 设计哲学总结

Python 的选择

统一对象模型：一切皆对象，变量都是引用
接口级别限制：通过不提供修改方法实现不可变性
运行时安全：清晰的错误信息，不会内存崩溃
性能优化：小对象缓存、字符串驻留

与 C 的核心理念差异

C：信任程序员，提供底层内存控制
Python：安全第一，通过抽象隐藏复杂性

9. 关键结论

Python 变量本质是对象引用，类似于智能指针
不可变性通过接口设计实现，不是内存保护
所有修改操作都有明确的方法支持
理解这个机制对于避免常见陷阱至关重要
Python 的设计在易用性和安全性之间取得了良好平衡

这种设计让 Python 既保持了高级语言的易用性，又通过清晰的抽象提供了可预测的行为，是 Python 哲学"显式优于隐式"的完美体现。

元组不变性

核心概念

元组的不可变性是浅层不可变，而非深层不可变。

关键要点

1. 引用不可变，内容可能可变

t = ([1, 2], "hello")
t[0].append(3)    # ✅ 允许 - 修改列表内容
# t[0] = [4, 5]   # ❌ 禁止 - 改变引用

2. 内存模型理解

元组对象
┌─────────┬─────────┐
│ 引用A   │ 引用B   │   ← 这些引用不可变
└─────────┴─────────┘
    │        │
    ▼        ▼
  [1,2,3]  "hello"   ← 这些对象内容可能可变

3. 哈希性条件

只有当所有元素都可哈希时，元组才可哈希
包含可变对象的元组不可哈希，不能作为字典键

设计思路

性能优先：避免深拷贝带来的性能开销
明确职责：元组负责结构稳定，元素负责自身可变性

元组保证的是"引用地址不变"，而不是"引用对象内容不变"。

CS61A 2.4 note

Python 可变对象与不可变对象全面总结

1. 基本概念

不可变对象 (Immutable Objects)

可变对象 (mutable Objects)

2. 实现机制对比

Python 的限制方式

与 C 语言 const 的本质区别

3. 内存模型可视化

不可变对象的内存模型

可变对象的内存模型

4. 变量系统的本质

Python 变量 = 对象引用（智能指针）

变量赋值的真实过程

5. 关键行为差异

赋值操作的影响

函数参数传递

6. Python 的优化机制

小整数缓存 (-5 到 256)

字符串驻留

7. 实际应用注意事项

常见的陷阱

8. 设计哲学总结

Python 的选择

与 C 的核心理念差异

9. 关键结论

元组不变性

核心概念

关键要点

1. 引用不可变，内容可能可变

2. 内存模型理解

3. 哈希性条件

设计思路