《Python语言》课件 第5章 正则表达式.pdf
《《Python语言》课件 第5章 正则表达式.pdf》由会员分享,可在线阅读,更多相关《《Python语言》课件 第5章 正则表达式.pdf(52页珍藏版)》请在咨信网上搜索。
1、Python语言大数据应用人才培养系列教材第五章字符串与正则表达式5.1 字符串基础5.2 字符串方法5.3 正则表达式5.4 实验5.5 小结 习题5.1字符串基础第五章字符串与正则表达式字符串常用的表示方式1、字符串中的字符可以是ASCII字符也可以是其他各种符号。2、它常用英文状态下的单引号()、双引号(”)或者三单引号 三双引号进行表示。5.1字符串基础第五章字符串与正则表达式转义字符 字符串中还有一种特殊的字符叫做转义字符,转义字符通常用于不能够直接输入的各 种特殊字符。Python常用转义字符如表5.1所示:表5.1用的转义字符5.1字符串基础第五章字符串与正则表达式字符串的基础操
2、作包括。求字符串的长度、字符串的连接、字符串的遍历、字符串的包含判断、字符串的索引和切片等。1、求字符串的长度字符串的长度是指字符数组的长度,又可以理解为字符串中的字符个 数(空格也算字符),可以用len()函数查看字符串的长度。如:sample_str1=Jack loves Python print(len(sample_str1)#查看字符串长度运行结果如下:175.1字符串基础第五章字符串与正则表达式2、字符串的连接字符串的连接是指将多个字符串连接在一起组成一个新的字符串。例如:sample_str2=Jack1,Is,a,Python,fan#字符串用逗号隔开,组 成元组 print
3、(sample_str2:,sample_str2,type(sample_str2)运行结果如下:sample_str2:(Jack,is,a Python1,fan)当字符串之间没有任何连接符时,这些字符串会直接连接在一起,组成 新的字符串。sample_str3=JackisaPythonfan#字符串间无连接符,默认合 并 print(sainple_str3:,sample_str3)运行结果如下:sample_str3:JackisaPythonfan5.1字符串基础第五章字符串与正则表达式字符串之间用+号连接时,也会出现同样的效果,这些字符串将连接在一起,组成一 个新的字符串。s
4、ample_str4=Jack+is+a+Python+fan#字符串中连接,默认合并 print(sample_str4:,sample_str4)运行结果如下:sample_str4:JackisaPythonfan用皇饯国与正整数进行乘法运算时 的子付串。sample_str5=Jack*3,相当于创建对应次数的字符串,最后组成一个新#重复创建相应的字符串 print(sample_str5:sample_str5)运行结果如下:sample_str5:JackJackJack注意:字符串直接以空格隔开的时候,该字符串会组成元组类型。5.1字符串基础第五章字符串与正则表达式3、字符串的遍
5、历通常使用for循环对字符串进行遍历。例如:sample_str6=Python,#遍历字符串 for a in sample_str6:print(a)运行结果如下:Python其中变量a,每次循环按顺序代指字符串里面的一个字符。5.1字符串基础第五章字符串与正则表达式4、字符串的包含判断字符串是字符的有序集合,因此用in操作来判断指定的字符是否存在 包含关系。如:sample_str7=Python print(,a,in sample_str7)#字符串中不存在包含关系 printCPy in sample_str7)#字符串中存在包含关系运行结果如下:FalseTrue5.1字符串基础
6、 第五章字符串与正则表达式5、索引和切片字符串是一个有序集合,因此可以通过偏移量实现索引和切片的操作。在字符 串中字符从左到右的字符索引依次为0,1,2,3,。字符从右到左 的索弓I依次为12-3,。,-所()。索引其实简单来说是指字符串的排列顺 序,可以通过索引来查找该顺序上的字符。例如:sample_str8=Python print(sample_str80)print(sample_str81)print(sample_str8-1)print(sample_str8-2)运行结果如下:#字符串对应的第一个字符#字符串对应的第二个字符#字符串对应的最后一个字符#字符串对应的倒数第二个字
7、符Pyno5.1字符串基础第五章字符串与正则表达式注意:虽然索引可以获得该顺序上的字符,但是不能够通过该索引去修改对应的字符。例如:sample_str80=b#修改字符串的第一个字符Traceback(most recent call last):#系统正常报错File,line 9,in sample_str80=bTypeError:str object does not support item assignment切片,也叫分片,和元组与列表相似,是指从某一个索引范围中获取连续的多个字符(又称为子 字符)。常用格式如下:stringnamestart:end这里的stringname
8、是指被切片的字符串,start和end分别指开始和结束时字符的索引,其中切片的 最后一个字符的索引是end-1,这里有一个诀窍叫:包左不包右。例如:sample_str9=abcdefghijkl print(sample_str90:4)#获取索引为0-4之间的字符串,从索引0开始到3为止,不包括索引 为4的字符运行结果如下:abed5.1字符串基础第五章字符串与正则表达式若不指定起始切片的索引位置,默认是从。开始;若不指定结束切片的顺序,默认是字符串的长度-1o例如:sample_str10=abcdefg print(起始不指定”,sample_str10:3)#获取索引为0-3之间的字
9、符串,不包括3 print(结束不指定,sample_str103:)#从索引3到最后一个字符,不包括len运行结果如下:起始不指定abc结束不指定defg默认切片的字符串是连续的,但是也可以通过指定步进数(step)来跳过中间的字符,其中默认 的step是1。例如指定步进数为2:sample_str11=012345678,print。跳2个字符,sample_str111:7:2)#索弓|17,每2个字符截取运行结果如下:跳2个字符1355.1字符串基础第五章字符串与正则表达式字符串格式化方法想要进行字符串格式化可以使用format。方法。例如:print(My name is 0,and
10、 I am 1.formatCJack1,9)#函数格式化 运行结果如下:My name is Jack,and I am 95.1字符串基础第五章字符串与正则表达式字符串常见的格式化符号如表5.2格式控制符说明%s字符串(米用str()的显示)或其他任何对象%r与$相似(采用repr()的显示)%c单个字符%b参数转换成二进制整数%d参数转换成十进制整数%i参数转换成十进制整数%o参数转换成八进制整数%u参数转换成十进制整数%x参数转换成十六进制整数,字母小写%X参数转换成十/进制整数,字母大与%e.E按科学计数法格式转换成浮点数%f.F按定点小数格式转换成浮点数%g.G按定点小数格式转换成
11、浮点数,与.F不 同表5.2 Python格式控制符号5.1字符串基础第五章字符串与正则表达式字符串的格式化通常有两种方式,除了之前提到的用函数的形式进行格式化以外,还可以用字符串格式化表达式来进行格式,常用进行表示,其中前面是需要格式化 的字符串,而后面就是需要填充的实际参数,这个实际参数其本质就是元组。也 可以理解为占位符。例如:print(My name is%s,and I am%d,%(,Jack,9)#表达式格式化运行结果如下:My name is Jack,and I am 9注意:如果想要将后面填充的浮点数保留两位小数,可以用f2表示,同时会 对第三位小数进行四舍五入。例如:p
12、rint。你花了2元钱%(20.45978)#浮点数保留两个小数运行结果如下:你花了20.46元钱5.1字符串基础第五章字符串与正则表达式字符串的格式化通常有两种方式,除了之前提到的用函数的形式进行格式化以外,还可以用字符串格式化表达式来进行格式,常用进行表示,其中前面是需要格式化 的字符串,而后面就是需要填充的实际参数,这个实际参数其本质就是元组。也 可以理解为占位符。例如:print(My name is%s,and I am%d,%(,Jack,9)#表达式格式化运行结果如下:My name is Jack,and I am 9注意:如果想要将后面填充的浮点数保留两位小数,可以用f2表示
13、,同时会 对第三位小数进行四舍五入。例如:print。你花了2元钱%(20.45978)#浮点数保留两个小数运行结果如下:你花了20.46元钱大数据应用人才培养系列教材第五章字符串与正则表达式5.1 字符串基础5.2 字符串方法5.3 正则表达式5.4 实验5.5 小结 习题5.2字符串方法第五章字符串与正则表达式字符串是str类型对象,所以Python内置了一系列操作字符串的方法。其中常用的方法如下:1.str.strip(chars)若方法里面的chars不指定默认去掉字符串的首、尾空格或者换行符,但是如果指定了chars,那么会删除首信的chars例如:sample_fun1=1 Hel
14、lo worlds print(sample_fun1.strip()#默认去掉首尾空格 print(sample_fun1.stripf#1)#指定首尾需要删除的字符 print(sample_fun1.strip(,A#)运行结果如下:Hello worldA#Hello worldAHello world5.2字符串方法第五章字符串与正则表达式2.str.count(vcharsstart,end)统计chars字符串或者字符在str中出现的次数,从start顺序开始查找 一直到end顺序范围结束,默认是从顺序0开始。例如:sample_fun2=abcdabfabbcd,print(s
15、ample_fun2.count(,abJ239)#统计字符串出现的次数运行结果如下:25.2字符串方法第五章字符串与正则表达式3.str.capitalize()将字符串的首字母大写。例如:sample_fun3=abc print(sample_fun3.capitalize()#首字母大写运行结果如下:Abc4.str.replace(oldstr,newstr,count)用旧的子字符串替换新的子字符串,若不指定count默认全部替换。例如:sample_fun4=ab12cd3412cd print(sample_fun4.replace(12,21)#不指定替换次数count pr
16、int(sample_fun4.replace(12;21,1)#指定替换次数count运行结果如下:ab21cd3421cdab21cd3412cd5.2字符串方法第五章字符串与正则表达式5.str.find(strstarLend)查找并返回子字符在start到end范围内的顺序,默认范围是从父字符 串的头开始到尾结束,例如:sample_fun5=0123156,print(sample_fun5.find(,5,)#查看子字符串的顺序 print(samplejun5.find(15,1,4)#指定范围内没有该字符串默认返回-1 print(sample_fun5.find(,1)#多
17、个字符串返回第一次出现时候的顺序运行结果如下:5-115.2字符串方法第五章字符串与正则表达式6.str.indexCstrstart,end)该函数与find函数一样,但是如果在某一个范围内没有找到该字符串 的时候,不再返回-1而是直接报错。例如:sample_fun6=0123156,print(samplejun6.index(7)#指定范围内没有找到该字符串会报错 一运行结果如下:Traceback(most recent call last):File HD:/python/space/demo05-02-03.pyH3 line 2,in print(sample_fun6.ind
18、ex(7)#指定范围内没有找到该字符串会报错TypeError:must be str,not int5.2字符串方法第五章字符串与正则表达式7.str.isalnum()字符串是由字母或数字组成则返回true否则返回false。例如:sample_fun7=abc123#字符串由字母和数字组成 sample_fun8=abc#字符串由字母组成 sample_fun9=123#字符串由数字组成 sample_fun1O=abc12%#字符串由除了数字字母以为的字符组成 一print(sample_fun7.isalnum()print(sample_fun8.isalnum()print(sa
19、mple_fun9.isalnum()print(sample_fun10.isalnum()运行结果如下:TrueTrueTrueFalse5.2字符串方法第五章字符串与正则表达式8.str.isalpha()字符串是否全是由字母组成的,是返回true,否则返回false。例如 sample_fun11=3bc123,#字符串中不只是有字母 sample_fun12=abc#字符串中只是有字母print(sample_fun11.isalpha()print(sample_fun12.isalpha()运行结果如下:FalseTrue5.2字符串方法第五章字符串与正则表达式9.str.isd
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Python语言 Python语言课件 第5章 正则表达式 Python 语言 课件 正则 表达式
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【曲****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【曲****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。