<small id='QtEZ'></small> <noframes id='fCrOAyB'>

  • <tfoot id='vTJS'></tfoot>

      <legend id='xnP3gsCdXo'><style id='p2EnBYU'><dir id='NbHxZl2Xz'><q id='oEUI8NLm'></q></dir></style></legend>
      <i id='80JDXMcWC'><tr id='2ePD'><dt id='exlQ2fv1S'><q id='ONik'><span id='ZAS2fjI'><b id='1XDeqA7l'><form id='Awr8'><ins id='6PqzsTD0o'></ins><ul id='AehL'></ul><sub id='wH1Y4uySUL'></sub></form><legend id='znBrpaqGU8'></legend><bdo id='vfG1rWBK9'><pre id='FBLo'><center id='RW9Cvmy75'></center></pre></bdo></b><th id='ew84SaBrCq'></th></span></q></dt></tr></i><div id='8VzdjED'><tfoot id='UPyF'></tfoot><dl id='24oY'><fieldset id='eJTwpZhLf'></fieldset></dl></div>

          <bdo id='U0R2W5a3k'></bdo><ul id='JhqiWcP0Tv'></ul>

          1. <li id='kOIA1FQ'></li>
            登陆

            章鱼彩票安卓-python的这14个问题,你都get到了吗

            admin 2019-05-10 204人围观 ,发现0个评论

            全文共3733字,估计学习时长7分钟


            Python最近火了,大红大紫那种。PYPL(编程言语受欢迎程度) 四月官方榜单宣告,Python荣获NO.1,居然连朋友圈里的文科生都开端转发Python课程打卡的链接了……这是怎样一个令全民张狂的言语?

            作为编程界的“头牌”名媛,Python和蔼可亲的情绪和精明婉转的灵动深得各个大佬欢心。比方:人工智能、web开发、爬虫、体系运维、数据剖析与核算等等。这几位风流多金的职业精英随意哪个都能“反转未来”。

            本文为你精心预备了一段Python与数据科学的“含糊史”——用Python进行数据科学概述,包括Numpy,Scipy,pandas,Scikit-Learn,XGBoost,TensorFlow和Keras等模块、包、库的用法。

            目录

            1. 为何挑选Python?

            2. 装置Python

            3. 运用Python进行数据科学研讨

            4. Python中的数值核算

            5. Python中的核算剖析

            6. Python中的数据操作

            7. 在Python中运用数据库

            8. Python中的数据工程

            9. Python中的大数据工程

            10. Python中的进一步核算

            11. Python中的机器学习

            12. Python的深度学习

            13. Python中的数据科学API

            14. Python中的运用程序

            1. 为何挑选Python?

            Python作为一种言语,十项全能,易于学习,装置简略。一同有许多扩展,十分合适进行数据科学研讨。像Google、Instagram、章鱼彩票安卓-python的这14个问题,你都get到了吗Youtube、Reddit等明星网站都在用Python树立中心事务。

            Python不仅仅用于数据科学,还运用Python来做更多的作业——如编写脚本、构建API、构建网站等等。

            关于Python的几点重要事项需求留意。

            现在,有两种常用的Python版别。它们是版别2和3。大多数教程和本文将默许运用的是Python的最新版别Python 3。但有时会遇到运用Py章鱼彩票安卓-python的这14个问题,你都get到了吗thon 2的书本或文章。版别之间的差异并不大,但有时在运转版别3时仿制和张贴版别2代码将无法正常作业,因而需求进行一些细微的修改。

            要留意Python十分介怀空白的当地(即空格和回来字符)。假如把空格放在过错的当地,程序很或许会发生过错。

            与其他言语比较,Python不需求办理内存,也有杰出的社区支撑。


            2. 装置Python

            装置用于数据科学的Python的最佳办法是运用Anaconda发行版。

            Anacoda有你运用Python进行数据科学研讨所需的材料,包括将在本文中介绍的许多软件包。

            单击Products - > Distribution并向下翻滚,能够看到适用于Mac,Windows和Linux的装置程序。即便Mac上现已有Python,也应该考虑装置Anaconda发行版,由于有利于装置其他软件包。

            此外,还能够去官方Python网站下载装置程序。

            包办理器

            包是一段Python代码,而不是言语的一部分,包关于履行某些使命十分有协助。经过包,咱们能够仿制并张贴代码,然后将其放在Python解说器(用于运转代码)能够找到的当地。

            但这很费事,每次发动新项目或更新包时都有必要进行内容的仿制和张贴操作。因而,咱们能够运用包办理器。Anaconda发行版中自带包办理器。假如没有,主张装置pip。

            不管挑选哪一个,都能够在终端(或指令提示符)上运用指令轻松装置章鱼彩票安卓-python的这14个问题,你都get到了吗和更新软件包。

            3. 运用Python进行数据科学研讨

            Python投合许多不同开发人员的技能要求(Web开发人员,数据剖析师,数据科学家),因而运用该言语具有许多不同的编程办法。

            Python是一种解说型言语,不必将代码编译成可履行文件,只需将包括代码的文本文档传递给解说器即可。

            快速阅读一下与Python解说器交互的不同办法吧。

            在终端



            假如翻开终端(或指令提示符)并键入单词'Python',将发动一个shell会话。能够在对话中输入有用的Python指令,以完结相应的程序操作。

            这能够是快速调试某些东西的好办法,但即便是一个小项目,在终端中调试也很困难。

            运用文本修改器




            假如你在文本文件中编写一系列Python指令并运用.py扩展名保存它,则能够运用终端导航到该文件,并经过输入python YOUR_FILE_NAME.py来运转该程序。

            这与在终端中逐一输入指令根本相同,仅仅更简略修正过错并更改程序的功用。

            在IDE中



            IDE是一种专业级软件,能够进行软件项目办理。

            IDE的一个优点是,运用调试功用能够通知你在测验运转程序之前犯错的方位。

            某些IDE附带了项目模板(用于特定使命),你能够运用这些模板依据最佳实践设置项目。

            Jupyter Notebooks



            这些办法都不是用python进行数据科学的最佳办法,最好是运用Jupyter Notebooks。

            Jupyter Notebooks使你能够一次运转一“块”代码,这意味着你能够在决议下一步做什么之前看到输出信息-这在数据科学项目中十分重要,咱们常常需求在获取输出之前检查图表。

            假如你正在运用Anaconda,且现已装置了Jupyter lab。要发动它,只需求在终端中输入'jupyter lab'即可。

            假如正在运用pip,则有必要运用指令'python pip install jupyter'装置Jupyter lab。

            4. Python中的数字核算

            NumPy软件包中包括许多有用的函数,用于履行数据科学作业所需的数学运算。

            它作为Anaconda发行版的一部分装置,而且运用pip装置,就像装置Jupyter Notbooks相同简略('pip install numpy')。

            咱们在数据科学中需求做的最常见的数学运算是矩阵乘法,核算向量的点积,改动数组的数据类型以及创立数组!

            以下是如何将列表编入NumPy数组的办法:



            以下是如安在NumPy中进行数组乘法和核算点积的办法:



            以下是如安在NumPy中进行矩阵乘法:



            5. Python中的核算剖析

            Scipy包中包括专门用于核算的模块(包的代码的子部分)。

            你能够运用'from scipy import stats'指令将其导入(在程序中使其功用可用)到你的笔记本中。该软件包包括核算数据核算丈量、履行核算测验、核算相关性、汇总数据和研讨各种概率散布所需的全部。

            以下是运用Scipy快速拜访数组的汇总核算信息(最小值,最大值,均值,方差,偏斜和峰度)的办法:



            6. Python中的数据操作

            数据科学家有必要花费许多的时刻来收拾和收拾数据。走运的是,Pandas软件包能够协助咱们用代码而不是手艺来完结这项作业。

            运用Pandas履行的最常见使命是从CSV文件和数据库中读取数据。

            它还具有强壮的语法,能够将不同的数据集组合在一同(数据集在Pandas中称为DataFrame)并履行数据操作。

            运用.head办法检查DataFrame的前几行:



            运用方括号挑选一列:



            经过组合其他列来创立新列:



            7.在Python中运用数据库

            为了运用pandas read_sql办法,有必要提早树立与数据库的衔接。

            衔接数据库最安全的办法是运用Python的SQLAlchemy包。

            SQL自身便是一种言语,而且衔接到数据库的办法取决于你正在运用的数据库。

            8.Python中的数据工程

            有时咱们倾向于在数据作为Pandas DataFrame办法抵达咱们的项目之前,对其进行一些核算。

            假如你正在运用数据库或从Web上抓取数据(并将其存储在某处),那么移动数据并对其进行转化的进程称为ETL(提取,转化,加载)。

            你从一个当地提取数据,对其进行一些转化(经过增加数据来总结数据,查找均值,更改数据类型等),然后将其加载到能够拜访的方位。

            有一个十分酷的东西叫做Airflow,它十分长于协助办理ETL作业流程。更好的是,它是用Python编写的,由Airbnb开发。

            9. Python中的大数据工程

            有时ETL进程或许十分慢。假如你稀有十亿行数据(或许假如它们是一种古怪的数据类型,如文本),能够运用许多不同的核算机别离进行处理转化,并在最终一秒将所稀有据整合到一同。

            这种架构形式称为MapReduce,它很受Hadoop的欢迎。

            现在,许多人运用Spark来做这种数据转化/检索作业,而且有一个Spark的Python接口叫做PySpark。

            MapReduce架构和Spark都是十分复杂的东西,这儿我不具体介绍。只需知道它们的存在,假如你发现自己正在处理十分缓慢的ETL进程,PySpark或许会有所协助。

            10. Python中的进一步核算

            咱们现已知道能够运用Scipy的核算模块运转核算测验、核算描述性核算、p值以及偏斜和峰度等作业,但Python还能做些什么呢?

            你应该知道的一个特别包是Lifelines包。

            运用Lifelines包,你能够从称为生计剖析的核算子字段核算各种函数。

            生计剖析有许多运用。咱们能够用它来猜测客户丢失(当客户撤销订阅时)以及零售商铺何时或许会被偷盗。

            这些与包的创造者幻想它将被用于彻底不同(生计剖析传统上是医学核算东西)的范畴。但这仅仅展现了构建数据科学问题的不同办法!

            11. Python中的机器学习

            这是一个重要的主题,机器学习正在风行国际,是数据科学家作业的重要组成部分。

            简而言之,机器学习是一组答应核算机将输入数据映射到输出数据的技能。有一些状况并非如此,但它们归于少量,以这种办法考虑ML一般很有协助。

            Python有两个十分好的机器学习包。

            Scikit-Learn

            在运用Python进行机器学习的时分都会花大部分时刻用于运用Scikit-Learn包(有时缩写为sklearn)。

            这个包完结了一大堆机器学习算法,并经过共同的语法揭露它们。这使得数据科学家很简略充分利用每种算法。

            运用Scikit-Learn的一般结构是这样的——将数据集拆分为练习和测验数据集:



            实例化并练习一个模型:



            运用metrics模块测验模型的作业状况:



            XGBoost

            在Python中常用于机器学习的第二个包是XGBoost。

            Scikit-Learn完结了一系列算法,XGBoost只完结了一个梯度提高的决策树。

            最近这个包(和算法)因其奇门遁甲在线排盘在Kaggle竞赛(任何人都能够参与的在线数据科学竞赛)上被运用而取得成功,变得十分受欢迎。

            练习模型的作业办法与Scikit-Learn算法的作业办法大致相同。

            12. Python中的深度学习

            Scikit-Learn中供给的机器学习算法简直能够满意任何问题。话虽这么说,但有时你需求运用最先进的算法。

            由于运用它们的体系简直优于其他一切类算法,因而深度神经网络的普及率急剧上升。

            可是很难说神经网络正在做什么以及它为什么这样做。因而,它们在金融、医学、法令和相关专业中的运用并未得到广泛认可。

            神经网络的两大类是卷积神经网络(用于对图画进行分类并完结核算机视觉中的许多其他使命)和循环神经网络(用于了解和生成文本)。

            探究神经网作业时超出了本文的规模的机理,假如你想做这类作业,只需知道你需求寻觅的包是TensorFlow(Google contibution!)仍是Keras。

            Keras本质上是TensorFlow的包装器,使其更易于运用。

            13. Python中的数据科学API

            一旦练习了模型,就能够在其他软件中拜访它的猜测,办法是创立一个API。

            API答应模型从外部源一次一行地接纳数据并回来猜测。由于Python是一种通用的编程言语,也可用于创立Web服务,所以很简略运用Python经过API为模型供给服务。

            假如需求构建API,应该检查pickle和Flask。Pickle答应练习有素的模型被保存在硬盘驱动器上,以便今后运用。而Flask是创立Web服务的最简略办法。

            14. Python中的Web运用程序

            最终,假如你想环绕数据科学项目构建功用完全的Web运用程序,则应运用Django结构。

            Django在Web开发社区十分受欢迎,而且用于构建Instagram和Pinterest的第一个版别(以及许多其他版别)。

            留言 点赞 发个朋友圈

            咱们一同共享AI学习与开展的干货

            欢迎重视读芯术

            请关注微信公众号
            微信二维码
            不容错过
            Powered By Z-BlogPHP