Python 因其拥有强大的第三方软件库,广泛应用在人工智能开发、科学计算和数据分析
中。而 pandas 就是一款基于 NumPy 的解决 Python 数据分析任务的软件库。在机器学习和数
据科学中,因为很少有数据可以直接使用,所以对数据进行预处理就成为必不可少的工作。
《Pandas 数据预处理详解》就利用数据处理必需的 pandas 库,从 pandas 基本操作、数据结构,
到 pandas 将执行的各种任务,如汇总统计信息、检查缺失值 / 异常值 / 重复数据以及合并和分
组数据等,通过简单易懂的示例,对预处理的基础知识和各种预处理方法进行了透彻讲解。学
完本书,读者将能够顺利执行各种机器学习和数据分析任务。特别适合作为机器学习工程师、
数据科学及科研工作者初学数据预处理的参考书,也适合作为案头手册,随时翻阅查看。
Python是一款非常强大、易学易用的数据处理和数据分析工具,而大量第三方软件库的支持,更是使其成为人工智能时代非常重要的编程工具。pandas就是一款非常重要的基于NumPy的Python数据分析软件库,它提供了大量能快速便捷处理数据的函数和方法,提供了高效操作大型数据集的工具,通过pandas和Python,可以顺利完成数据科学、机器学习或日常工作中的几乎所有数据分析任务。本书就利用pandas,结合简单易懂的示例代码,对机器学习和数据科学领域数据预处理的知识和各种预处理方法进行了透彻、全面的讲解。学完本书,你会发现Python之所以在数据处理和分析领域如此强大,pandas是其重要的影响因素之一。
1.用浅显易懂的语言,全面介绍pandas的使用方法和应用技巧。
2.用简洁清晰的代码,结合日常工作中需要处理数据的实际场景,学习pandas的实际用法,掌握解决实际问题的方法。
3.644页知识讲解,可作为初学者系统学习pandas的入门书,也可作为资深工程师的案头手册随时翻阅查看。
4.双色印刷 精美排版,学习过程轻松愉悦,学习效率更高。