Python数据分析.ppt
《Python数据分析.ppt》由会员分享,可在线阅读,更多相关《Python数据分析.ppt(83页珍藏版)》请在咨信网上搜索。
1、Python学习数据分析与数据挖掘认识PythonlPython是一种解释型、面向对象、动态数据类型的高级程序设计语言。lPython由GuidovanRossum于1989年底发明,第一个公开发行版发行于1991年。lPython是纯粹的自由软件,源代码和解释器CPython遵循GPL(GNUGeneralPublicLicense)协议lPython具有丰富和强大的库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C+)很轻松地联结在一起。常见的一种应用情形是,使用Python快速生成程序的原型,然后对其中有特别要求的部分,用更合适的语言改写,比如3D游戏中的图形渲染模块
2、,性能要求特别高,就可以用C/C+重写,而后封装为Python可以调用的扩展类库。Python优点有哪些lPython是一种开源的、解析性的,面向对象的编程语言lPython使用一种优雅的语法,可读性强lPython具有丰富的库,可以处理各种工作lPython支持类和多层继承等的面向对象编程技术lPython可运行在多种计算机平台和操作系统中,如Unix、Windows、MacOS、Ubuntu、OS/2等等为什么选择Python进行数据分析l在众多解释型语言中,Python最大的特点是拥有一个巨大而活跃的科学计算社区。进入21世纪以来,在行业应用和学术研究中采用python进行科学计算的势头
3、越来越猛。l近年来,由于Python有不断改良的库(主要是pandas),使其成为数据处理任务的一大代替方案,结合其在通用编程方面的强大实力,完全可以只是用Python这一种语言去构建以数据为中心的应用程序。l作为一个科学计算平台,Python的成功源于能够轻松的集成C、C+以及Fortran代码。大部分现代计算机环境都利用了一些Fortran和C库来是西安线性代数、优选、积分、快速傅里叶变换以及其他诸如此类的算法。课程内容1.Python环境搭建环境搭建 1.1 python1.1 python版本选择版本选择 1.2 python 1.2 python 安装安装2.Python基础基础 2
4、.1 python2.1 python基础语法基础语法 2.2 python2.2 python数据类型数据类型 2.3 2.3 条件和循环条件和循环 2.4 Python 2.4 Python 函数函数 2.5 Python 2.5 Python 模块模块 2.6 Python2.6 Python文件文件I/OI/O3.Python库介绍库介绍 3.1 NumPy3.1 NumPy库介绍库介绍 3.2 Pandas 3.2 Pandas库介绍库介绍 4.数据处理与分析数据处理与分析 4.1 4.1 数据探索数据探索 4.2 4.2 数据预处理数据预处理 4.3 4.3 挖掘建模挖掘建模5.实
5、例分析实例分析 5.1 5.1 TitanicTitanic数据集分析数据集分析 5.2 5.2 餐饮客户价值分析餐饮客户价值分析1.1 Python环境搭建lPython2.X和Python3.XPython的3.0版本,常被称为Python 3000,或简称Py3k。相对于Python的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0在设计的时候没有考虑向下相容,许多针对早期Python版本设计的程式都无法在Python 3.0上正常执行。大多数第三方库都正在努力地相容Python 3.0版本。即使无法立即使用Python 3.0,也建议编写相容Python 3.0
6、版本的程式,然后使用Python 2.6,Python 2.7来执行。In summary:Python 2.x is legacy,Python 3.x is the present and future of the language1.2 Python安装lUnix&Linux平台安装Python打开WEB浏览器访问http:/www.python.org/download/选择适用于Unix/Linux的源码压缩包。下载及解压压缩包。如果你需要自定义一些选项修改Modules/Setup 执行./configure 脚本 make make installlWindow平台安装Pyth
7、on打开WEB浏览器访问http:/www.python.org/download/在下载列表中选择Window平台安装包,包格式为:python-XYZ.msi 文件,XYZ 为你要安装的版本号。要使用安装程序 python-XYZ.msi,Windows系统必须支持Microsoft Installer 2.0搭配使用。只要保存安装文件到本地计算机,然后运行它,看看你的机器支持MSI。Windows XP和更高版本已经有MSI,很多老机器也可以安装MSI。下载后,双击下载包,进入Python安装向导,安装非常简单,你只需要使用默认的设置一直点击下一步直到安装完成即可。集成开发环境选择lPy
8、CharmPyCharm 是由 JetBrains 打造的一款 Python IDE,支持 macOS、Windows、Linux 系统。PyCharm 功能:调试、语法高亮、Project管理、代码跳转、智能提示、自动完成、单元测试、版本控制PyCharm 下载地址:https:/ Python基本语法lPython标识符在Python里,标识符由字母、数字、下划线组成。在Python中,所有标识符可以包括英文、数字以及下划线(_),但不能以数字开头。Python中的标识符是区分大小写的。Python可以同一行显示多条语句,方法是用分号;分开。以下划线开头的标识符是有特殊意义的。以单下划线开
9、头_foo的代表不能直接访问的类属性,需通过类提供的接口进行访问,不能用fromxxximport*而导入以双下划线开头的_foo代表类的私有成员;以双下划线开头和结尾的_foo_代表Python里特殊方法专用的标识,如_init_()代表类的构造函数。lPython 保留保留字符字符下面的列表显示了在Python中的保留字。这些保留字不能用作常数或变数,或任何其他标识符名称。所有Python的关键字只包含小写字母。andexecnotassertfinallyorbreakforpassclassfromprintcontinueglobalraisedefifreturndelimport
10、tryelifinwhileelseiswithexceptlambdayieldl行和缩进行和缩进学习Python与其他语言最大的区别就是,Python的代码块不使用大括号来控制类,函数以及其他逻辑判断。python最具特色的就是用缩进来写模块。缩进的空白数量是可变的,但是所有代码块语句必须包含相同的缩进空白数量,这个必须严格执行。以下代码会执行错误:lPython引号引号Python可以使用引号()、双引号()、三引号(或)来表示字符串,引号的开始与结束必须的相同类型的。其中三引号可以由多行组成,编写多行文本的快捷语法,常用于文档字符串,在文件的特定地点,被当做注释。lPython注释注释
11、python中单行注释采用#开头python中多行注释使用三个单引号()或三个双引号()。2.2 Python数据类型l标准数据类型标准数据类型Python定义了一些标准类型,用于存储各种类型的数据。Python有五个标准的数据类型:Numbers(数字)String(字符串)List(列表)Tuple(元组)Dictionary(字典)lPython数字数字数字数据类型用于存储数值。他们是不可改变的数据类型,这意味着改变数字数据类型会分配一个新的对象。当你指定一个值时,Number对象就会被创建。可以通过使用del语句删除单个或多个对象的引用。例如:Python支持四种不同的数字类型:int
12、(有符号整型)long(长整型也可以代表八进制和十六进制)float(浮点型)complex(复数)var1=1var2=10delvardelvar_a,var_blPython字符串字符串字符串或串(String)是由数字、字母、下划线组成的一串字符。python的字串列表有2种取值顺序:从左到右索引默认0开始的,最大范围是字符串长度少1从右到左索引默认-1开始的,最大范围是字符串开头如果你要实现从字符串中获取一段子字符串的话,可以使用变量头下标头下标:尾下标尾下标,就可以截取相应的字符串,其中下标是从0开始算起,可以是正数或负数,下标可以为空表示取到头或尾。s=a1a2an(n=0)S=
13、ilovepythons1:5的结果是love。lPython列表列表List(列表)是Python中使用最频繁的数据类型。列表可以完成大多数集合类的数据结构实现。它支持字符,数字,字符串甚至可以包含列表(即嵌套)。列表用标识,是python最通用的复合数据类型。列表中值的切割也可以用到变量头下标:尾下标,就可以截取相应的列表,从左到右索引默认0开始,从右到左索引默认-1开始,下标可以为空表示取到头或尾。加号+是列表连接运算符,星号*是重复操作。如下实例:lPython元组元组元组是另一个数据类型,类似于List(列表)。元组用()标识。内部元素用逗号隔开。但是元组不能二次赋值,相当于只读列表
14、。lPython 字典字典字典(dictionary)是除列表以外python之中最灵活的内置数据结构类型。列表是有序的对象结合,字典是无序的对象集合。两者之间的区别在于:字典当中的元素是通过键来存取的,而不是通过偏移存取。字典用标识。字典由索引(key)和它对应的值value组成。PythonPython数据类型数据类型数据类型数据类型转换转换转换转换函数描述int(x,base)将x转换为一个整数long(x,base)将x转换为一个长整数float(x)将x转换到一个浮点数complex(real,imag)创建一个复数str(x)将对象x转换为字符串repr(x)将对象x转换为表达式字
15、符串eval(str)用来计算在字符串中的有效Python表达式,并返回一个对象tuple(s)将序列s转换为一个元组list(s)将序列s转换为一个列表set(s)转换为可变集合dict(d)创建一个字典。d必须是一个序列(key,value)元组。frozenset(s)转换为不可变集合chr(x)将一个整数转换为一个字符unichr(x)将一个整数转换为Unicode字符ord(x)将一个字符转换为它的整数值hex(x)将一个整数转换为一个十六进制字符串oct(x)将一个整数转换为一个八进制字符串2.3 条件和循环lPython条件语句Python条件语句是通过一条或多条语句的执行结果(
16、True或者False)来决定执行的代码块。Python程序语言指定任何非0和非空(null)值为true,0或者null为false。Python编程中if语句用于控制程序的执行,基本形式为lPython 循环语句循环语句循环语句允许我们执行一个语句或语句组多次。Python提供了for循环和while循环(在Python中没有do.while循环)循环类型描述while循环在给定的判断条件为true时执行循环体,否则退出循环体。for循环重复执行语句嵌套循环你可以在while循环体中嵌套for循环演示演示 Python while 语句执行过程语句执行过程2.4 Python 函数函数l定
17、义函数遵循的相关规则函数代码块以def关键词开头,后接函数标识符名称和圆括号()。任何传入参数和自变量必须放在圆括号中间。圆括号之间可以用于定义参数。函数的第一行语句可以选择性地使用文档字符串用于存放函数说明。函数内容以冒号起始,并且缩进。return 表达式表达式结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回None。函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段。l函数语法l实例2.5 Python 模块模块l定义模块好处模块让你能够有逻辑地组织你的Python代码段。把相关的代码分配到一个模块里能让你的代码更好用,更易懂。模块能定义函数,类和变
18、量,模块里也能包含可执行的代码。Python模块(Module),是一个Python文件,以.py结尾,包含了Python对象定义和Python语句。l模块的引入模块定义好后,我们可以使用import语句来引入模块,语法如下:比如要引用模块math,就可以在文件最开始的地方用import math来引入。在调用math模块中的函数时,必须这样引用:import module1,module2,.moduleN模块名.函数名2.6 Python文件I/Ol打印到屏幕打印到屏幕最简单的输出方法是用print语句,你可以给它传递零个或多个用逗号隔开的表达式。此函数把你传递的表达式转换成一个字符串表达
19、式,并将结果写到标准输出如下:l读取键盘输入读取键盘输入Python提供了两个内置函数从标准输入读入一行文本,默认的标准输入是键盘。二者区别raw_input会提示你输入任意字符串,然后在屏幕上显示相同的字符串。input函数和raw_input函数基本类似,但是input可以接收一个Python表达式作为输入,并将运算结果返回。raw_inputinput打开和关闭打开和关闭文件文件lopen 函数函数 你必须先用Python内置的open()函数打开一个文件,创建一个file对象,相关的方法才可以调用它进行读写。语法:file_name:file_name变量是一个包含了你要访问的文件名称
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Python 数据 分析
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【胜****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【胜****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。