本书以“数据管理—数据挖掘—知识发现”为主线,将智能数据处理及分析的理论方法与Python程序实现相结合。作者开发了基于Git的在线编程平台和案例库,旨在构建智能数据工程“思想—模型—技术—实现”四位一体的知识学习框架。本书围绕数据处理及分析的典型任务,从不同类型数据的特点出发,介绍架构、模型及算法,注重智能数据处理及分析理念的传递。 本书介绍智能数据工程的经典方法和前沿技术,包括数据管理篇、数据挖掘和智能分析篇、知识表示和知识推理篇三部分。数据管理篇(第1~3章)介绍关系数据库查询优化、经典信息检索、数据组织和架构技术;数据挖掘和智能分析篇(第4~7章)介绍高维数据挖掘、视觉数据分析、文本数据分析和图数据分析技术;知识表示和知识推理篇(第8~9章)介绍知识图谱和贝叶斯网模型及相应的知识推理技术。 学习本书,读者需要具有计算机程序设计、数据库技术、深度学习的基础知识,以及使用开源平台的基本能力。本书可作为计算机和电子信息类相关专业研究生、高年级本科生数据工程、人工智能或机器学习等相关课程的教材,也可作为数据科学及人工智能等相关学科研究和开发人员的参考书。教师可根据学生类别、课程性质、学分设置和学习目标选择不同篇(或章)开展教学。