如何使用 Python 进行切片

Posted on Wed, 25 Dec 2024 16:09:24 +0800 by LiangMingJian


什么是切片

切片是 Python 用来解决从某个对象中抽取部分值这一问题的一种方法,切片在实际使用时表现为一种表达式。

切片的表达式

一个完整的切片表达式包含两个冒号,用来分隔三个参数 start_index、end_index、step。当只有一个冒号时,默认第三个参数 step=1;当一个冒号也没有时,start_index=end_index,表示切取 start_index 指定的那个元素。

object[start_index:end_index:step]
  • step:正负数均可,其绝对值大小决定了切取数据时的步长,而正负号决定了切取方向,正表示从左往右取值,负表示从右往左取值。当 step 省略时,默认为1,即从左往右以步长1取值。
  • start_index:表示起始索引(包含该索引对应值),该参数省略时,表示从对象端点开始取值,至于是从起点还是从终点开始,则由 step 参数的正负决定,step 为正从起点开始,为负从终点开始。
  • end_index:表示终止索引(不包含该索引对应值),该参数省略时,表示一直取到数据端点,至于是到起点还是到终点,同样由 step 参数的正负决定,step 为正时直到终点,为负时直到起点。

索引的方式

切片的索引包括正索引和负索引两部分,如下图所示,以 list 对象 a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 为例,正索引从序号小到大,负索引从序号大到小。

示例

a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

a. 切取单个元素

>>>a[0]
>>>0
>>>a[-4]
>>>6
# 当索引只有一个数时,表示切取某一个元素。

b. 切取完整对象

>>>a[:]     # 从左往右
>>> [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>a[::]    # 从左往右
>>> [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>a[::-1]  # 从右往左
>>> [9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

c. start_index 和 end_index 全为正(+)索引的情况

step=1,从左往右取值,start_index=1 到 end_index=6 同样表示从左往右取值。

>>>a[1:6]
>>> [1, 2, 3, 4, 5]

step=-1,决定了从右往左取值,而 start_index=1 到 end_index=6 决定了从左往右取值,两者矛盾,所以为空。

>>>a[1:6:-1]
>>> []

step=1,决定了从左往右取值,而 start_index=6 到 end_index=2 决定了从右往左取值,两者矛盾,所以为空。

>>>a[6:2]
>>> []

step=1,表示从左往右取值,而 start_index 省略时,表示从端点开始,因此这里的端点是起点,即从起点值 0 开始一直取到 end_index=6(该点不包括)。

>>>a[:6]
>>> [0, 1, 2, 3, 4, 5]

step=-1,从右往左取值,而 start_index 省略时,表示从端点开始,因此这里的端点是终点,即从终点值 9 开始一直取到 end_index=6(该点不包括)。

>>>a[:6:-1]
>>> [9, 8, 7]

step=1,从左往右取值,从 start_index=6 开始,一直取到终点值 9。

>>>a[6:]
>>> [6, 7, 8, 9]

step=-1,从右往左取值,从 start_index=6 开始,一直取到起点 0。

>>>a[6::-1]
>>> [6, 5, 4, 3, 2, 1, 0]

d. start_index 和 end_index 全为负(-)索引的情况

step=1,从左往右取值,而 start_index=-1 到 end_index=-6 决定了从右往左取值,两者矛盾,所以为空。

>>>a[-1:-6]
>>> []

step=-1,从右往左取值,start_index=-1 到 end_index=-6 同样是从右往左取值。

>>>a[-1:-6:-1]
>>> [9, 8, 7, 6, 5]

step=1,从左往右取值,而 start_index=-6 到 end_index=-1 同样是从左往右取值。

>>>a[-6:-1]
>>> [4, 5, 6, 7, 8]

step=1,从左往右取值,从起点开始一直取到 end_index=-6(该点不包括)。

>>>a[:-6]
>>> [0, 1, 2, 3]

step=-1,从右往左取值,从终点开始一直取到 end_index=-6(该点不包括)。

>>>a[:-6:-1]
>>> [9, 8, 7, 6, 5]

step=1,从左往右取值,从 start_index=-6 开始,一直取到终点。

>>>a[-6:]
>>> [4, 5, 6, 7, 8, 9]

step=-1,从右往左取值,从 start_index=-6 开始,一直取到起点。

>>>a[-6::-1]
>>> [4, 3, 2, 1, 0]

e. start_index 和 end_index 正(+)负(-)混合索引的情况

start_index=1 在 end_index=-6 的左边,因此从左往右取值,而 step=1 同样决定了从左往右取值。

>>>a[1:-6]
>>> [1, 2, 3]

start_index=1 在 end_index=-6 的左边,因此从左往右取值,但 step=-1 则决定了从右往左取值,两者矛盾,因此为空。

>>>a[1:-6:-1]
>>> []

start_index=-1 在 end_index=6 的右边,因此从右往左取值,但 step=1 则决定了从左往右取值,两者矛盾,因此为空。

>>>a[-1:6]
>>> []

start_index=-1 在 end_index=6 的右边,因此从右往左取值,而 step=-1 同样决定了从右往左取值。

>>>a[-1:6:-1]
>>> [9, 8, 7]

f. 多层切片操作

理论上可无限次多层切片操作,只要上一次返回的是非空可切片对象即可。

>>>a[:8][2:5][-1:]
>>> [4]
# 相当于:
a[:8]=[0, 1, 2, 3, 4, 5, 6, 7]
a[:8][2:5]= [2, 3, 4]
a[:8][2:5][-1:] = [4]

g. 切片操作的三个参数可以用表达式

>>>a[2+1:3*2:7%3]
>>> [3, 4, 5]
# 即:a[2+1:3*2:7%3] = a[3:6:1]

h. 其他对象的切片操作

前面的切片操作以 list 对象为例进行说明,但实际上可进行切片操作的数据类型还有很多,包括元组、字符串等等。

>>> (0, 1, 2, 3, 4, 5)[:3]
>>> (0, 1, 2)
>>>'ABCDEFG'[::2]
>>>'ACEG'

i. 取偶数位置的切片

>>>b = a[::2]
[0, 2, 4, 6, 8]

j. 取奇数位置的切片

>>>b = a[1::2]
[1, 3, 5, 7, 9]

k. 通过切片拷贝对象

>>>b = a[:]
>>>print(b)     # [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>print(id(a)) # 41946376
>>>print(id(b)) # 41921864
>>>b = a.copy()
>>>print(b)     # [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>print(id(a)) # 39783752
>>>print(id(b)) # 39759176

需要注意的是:[:].copy() 都属于浅拷贝,只拷贝最外层元素,内层嵌套元素则通过引用方式共享,而非独立分配内存,如果需要彻底拷贝则需采用深拷贝方式,如下例所示:

>>>a = [1,2,['A','B']]
>>>print('a={}'.format(a))
>>>b = a[:]
>>>b[0] = 9      # 修改b的最外层元素,将1变成9
>>>b[2][0] = 'D' # 修改b的内嵌层元素
>>>print('a={}'.format(a))
>>>print('b={}'.format(b))
>>>print('id(a)={}'.format(id(a)))
>>>print('id(b)={}'.format(id(b)))
a=[1, 2, ['A', 'B']] # 原始a
a=[1, 2, ['D', 'B']] # b修改内部元素A为D后,a中的A也变成了D,说明共享内部嵌套元素,但外部元素1没变。
b=[9, 2, ['D', 'B']] # 修改后的b
id(a)=38669128
id(b)=38669192

l. 在某个位置插入元素

>>>a[3:3] = ['A','B','C']
[0, 1, 2, 'A', 'B', 'C', 3, 4, 5, 6, 7, 8, 9]
>>>a[0:0] = ['A','B']
['A', 'B', 0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

f. 替换一部分元素

>>>a[3:6] = ['A','B']
[0, 1, 2, 'A', 'B', 6, 7, 8, 9]
参考文件 1: 彻底搞懂Python切片操作 @马尔代夫Maldives