普通高中教科书·信息技术选择性必修3 数据管理与分析(粤教版2019).pdf
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
7 0人已下载
| 下载 | 加入VIP,免费下载 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 普通高中教科书·信息技术选择性必修3 数据管理与分析粤教版2019 普通高中 教科书 信息技术 选择性 必修 数据管理 分析 粤教版 2019
- 资源描述:
-
1、普 通 高 中 教 科 书选择性必修信息技术普通高中教科书信息技术3数据管理与分析Shuju Guanli yu Fenxi选择性必修 选择性必修3信息技术普通高中教科书数据管理与分析广东教育出版社广东教育出版社批准文号:粤发改价格2017434号 举报电话:12358定价:11.13元ook2020信息技术选择性必修1-6封面.indd 32020/5/28 下午2:31信息技术广东教育出版社普 通 高 中 教 科 书徐福荫 主编广州数据管理与分析Shuju Guanli yu Fenxi3选择性必修 ook2020信息技术-8扉页.indd 52020/5/28 下午2:52 图书在版编目
2、(CIP)数据 信息技术选择性必修3:数据管理与分析/徐福荫主编广州:广东教育出版社,2019.12(2021.1重印)普通高中教科书 ISBN 978-7-5548-3030-7 .信.徐.计算机课高中教材.G634.671 中国版本图书馆CIP数据核字(2019)第202794号 编写单位 广东教育出版社 主 编 徐福荫 副 主 编 朱光明 黄国洪 本册主编 周云虹 王兴芳 核心编写人员(以姓氏笔画为序)丁 辉 邓毅怡 梁爱梅 彭丽欧 责任编辑 严洪超 责任技编 杨启承 陈 瑾 装帧设计 何 维信息技术 选择性必修3 数据管理与分析XINXI JISHU XUANZEXING BIXIU
3、3 SHUJU GUANLI YU FENXI广 东 教 育 出 版 社 出 版(广州市环市东路472号12-15楼)邮政编码:510075网址:http:/广东新华发行集团股份有限公司发行广东新华印刷有限公司南海分公司印刷(佛山市南海区盐步河东中心路)890毫米1240毫米 16开本 9.5印张 190 000字2019年12月第1版 2021年1月第3次印刷ISBN 978-7-5548-3030-7定价:11.13元批准文号:粤发改价格2017434号 举报电话:12315著作权所有请勿擅用本书制作各类出版物违者必究如有印装质量或内容质量问题,请与我社联系。质量监督电话:020-8761
4、3102 邮箱:gjs-购书咨询电话:020-877724389Z343.indd 22020/12/3 17:04:211 1前 言信息技术作为当今先进生产力的代表,已经成为我国经济发展的重要支柱和网络强国的战略支撑。信息技术涵盖了获取、表示、传输、存储和加工信息在内的各种技术。自电子计算机问世以来,信息技术沿着以计算机为核心、到以互联网为核心、再到以数据为核心的发展脉络,深刻影响着社会的经济结构和生产方式,加快了全球范围内的知识更新和技术创新,推动了社会信息化、智能化的建设与发展,催生出现实空间与虚拟空间并存的信息社会,并逐步构建出智慧社会。数据管理与分析技术已经广泛应用于人们的日常生活与
5、学习中,成为解决问题的重要方式。有效地管理与分析数据可帮助人们获取有价值的信息,为决策形成提供重要依据。本教科书是针对数据管理技术与数据分析方法的应用而设置的选择性必修模块。通过本教科书的学习,同学们能了解数据管理与分析技术,能根据需求分析,形成解决方案;能选择一种数据库工具对数据进行管理,从给定数据中提取有用信息并应用于解决实际问题中;在活动过程中形成对数据特征、数据价值、数据管理思想与分析方法的认识。本教科书按“数据需求分析”“数据管理”“数据分析”三部分内容展开,围绕信息技术学科核心素养设计了“中学生膳食和运动习惯的数据管理与分析调查”“中学生体质健康数据管理系统的需求分析与数据建模”“
6、中学生体质健康数据管理系统的数据管理”“中学生体质健康数据管理系统的数据分析”“体验电子商务数据的管理与分析新技术应用”项目范例,教师围绕“情境主题规划探究实施成果评价”的项目范例主线开展教学活动,帮助同学们掌握本教科书的基础知识、方法和技能,增强信息意识、发展计算思维、提高数字化学习与创新能力,树立正确的信息社会价值观和责任感,从而促进同学们的信息素养提升。本教科书要求同学们对现实世界中的真实性问题进行自主、协作、探究学习。同学们围绕“项目选题项目规划方案交流探究活动成果交流活动评价”的项目学习主线开展学习活动,体验“做中学、学中创、创中5Z343.indd 12019/4/1 10:04:
7、34乐”的项目学习理念和“从实践入手、先学后教、先练后讲”的项目学习策略,将知识建构、技能培养与思维发展融入运用数字化工具解决问题和完成任务的过程中,从而促进信息意识、计算思维、数字化学习与创新、信息社会责任的信息技术学科核心素养达成。本教科书设置了“项目范例”“项目选题”“项目规划”“方案交流”“探究活动”“项目实施”“成果交流”“活动评价”等学习栏目,指导同学们开展项目学习活动。其中,“项目范例”是教师通过“情境”“主题”“规划”“探究”“实施”“成果”“评价”等活动,引导同学们了解开展项目学习活动的全过程;“项目选题”是同学们从真实世界选择自己感兴趣的项目主题;“项目规划”是同学们根据项
8、目选题,制订自己的项目方案;“方案交流”是同学们展示交流自己设计的项目方案,师生共同探究、完善其方案;“探究活动”是同学们通过“问题”“观察”“分析”“阅读”“思考”“交流”“实践”“实验”“体验”“调查”“讨论”“拓展”等活动,获取知识和技能的过程;“项目实施”是同学们运用在项目学习过程中所获得的知识和技能来完成项目方案;“成果交流”是教师组织同学们展示交流项目成果,共享创造、分享快乐;“活动评价”是教师组织同学们开展项目评价活动。本教科书各章首页的导言,叙述了本章的学习目的与方式、学习目标与内容,让同学们对整章有个总体认识。每章设置了“本章扼要回顾”,通过知识结构图把每章的主要内容及它们之
9、间的关系描述出来,有助于同学们建立自己的知识结构体系。每章结尾的“本章学业评价”设计了基于学业质量水平的测试题,并通过本章的项目活动评价,让同学们综合评价自己在信息技术知识与技能、解决实际问题的过程与方法,以及相关情感态度与价值观的形成等方面,是否达到了本章的学习目标。此外,本教科书为同学们提供了配套学习资源包,里面含有中学生体质健康数据管理系统、MariaDB数据与分析的各Python程序设计的源代码等,为同学们提供数据采集、管理、分析和可视化表达所需的实验数据和环境。当然,同学们还可以自己收集素材,让自己的项目学习作品更有特色。2前言7Z343.indd 22019/9/26 11:29:
10、571 1第一章 数据管理与分析应用概述 1项目范例 中学生膳食和运动习惯的数据管理与分析调查.21.1 数据管理与分析技术.51.1.1.数据管理技术与方法.51.1.2.数据分析技术与方法.101.2 数据管理与分析的重要性及应用价值.131.2.1.数据管理与分析的重要性.131.2.2.数据管理与分析的应用价值.15第二章 需求分析与数据建模 23项目范例 中学生体质健康数据管理系统的需求分析与数据建模.242.1 项目需求分析与解决方案.272.1.1.项目需求分析.272.1.2.项目解决方案.302.2 数据的采集与分类.342.2.1.数据采集的途径.342.2.2.数据的分类
11、.36目 录目 录CONTENTS7Z343.indd 12019/10/9 18:21:402.3 建立关系数据模型.382.3.1.概念模型与E-.R方法.392.3.2.从概念模型到关系数据模型的转换.41第三章 数据管理 49项目范例 中学生体质健康数据管理系统的数据管理.503.1 关系数据库的建立.533.1.1.创建数据库和数据表.533.1.2.修改表的结构.563.1.3.建立表之间的联系.583.1.4.数据库事务的处理.583.2 数据的查询.653.2.1.数据库基本的查询方法.653.2.2.使用结构化查询语言SQL查询数据.713.3 数据的备份与恢复.753.3.
12、1.数据丢失的风险及原因.753.3.2.常见的数据备份与恢复方法.77第四章 数据分析 84项目范例 中学生体质健康数据管理系统的数据分析.854.1 数据分析概述.884.1.1.数据分析的方法.884.1.2.数据分析的工具.894.1.3.数据导入.902目录7Z343.indd 22019/10/9 18:21:423 34.1.4.数据导出.914.2 数据处理.934.2.1.数据清洗.934.2.2.数据的合并.964.2.3.数据的计算.994.2.4.数据分组.994.3 描述性分析.1004.3.1.基本统计.1004.3.2.平均值分析法.1024.3.3.分组分析法.
13、1034.3.4.对比分析法.1044.3.5.交叉分析法.1044.3.6.相关分析.1054.3.7.常用的数据分析方法对比.1074.4 数据的可视化表达.1084.4.1.常用图形的绘制.1084.4.2.数据可视化实例1回归分析.1154.4.3.数据可视化实例2聚类分析.118第五章 数据管理与分析的发展趋势 124项目范例 体验电子商务数据的管理与分析新技术应用.1255.1 数据管理与分析的新发展.1275.1.1.数据的多样性与应用场景.1275.1.2.数据管理技术新进展.1285.1.3.数据分析技术新进展.132目录7Z343.indd 32019/10/9 18:21
14、:425.2 数据挖掘与大数据的意义.1345.2.1.数据挖掘的意义.1345.2.2.大数据的意义.136附录1 部分术语、缩略语中英文对照表.142附录2 项目活动评价表.143目录47Z343.indd 42019/10/9 18:21:421 1第一章数据管理与分析应用概述随着互联网技术、多媒体技术与通信技术的迅猛发展,数据呈现爆炸式增长,数据管理与分析技术已经广泛应用于人们的生活中,成为信息社会中解决问题的重要方式。本章将通过“数据管理与分析调查”项目,进行自主、协作、探究学习,让同学们认识到数据是一种重要的资源;通过科学管理与分析数据,可以使数据实现其应有价值;感受数据管理与分析
15、技术的重要性,从而将知识建构、技能培养与思维发展融入运用数字化工具解决问题和完成任务的过程中,促进信息技术学科核心素养达成,完成项目学习目标。数据管理与分析技术 数据管理与分析的重要性及应用价值5Z343.indd 12019/4/1 10:04:3722第一章 数据管理与分析应用概述中学生膳食和运动习惯的数据管理与分析调查项目范例情 境为了促进学生体质健康发展,激励学生积极进行身体锻炼,根据教育部国家学生体质健康标准(2014年修订),国家要求各地区和各学校开展相关调研工作,并做好数据管理与分析工作。为了认识中学生的膳食和运动习惯,促进学生体质健康发展,为学校食堂和学生膳食个人习惯等方面做出
16、相应的改善建议和措施,某中学进行了一次全校“中学生膳食和运动习惯”的调查活动。主 题中学生膳食和运动习惯的数据管理与分析调查规 划根据项目范例的主题,在小组中组织讨论,利用思维导图工具,制订项目范例的学习规划,如图1-1所示。图1-1“中学生膳食和运动习惯的数据管理与分析调查”项目学习规划5Z343.indd 22019/4/1 10:04:403 3探 究根据项目学习规划的安排,通过调查、案例分析、文献阅读和网上资料搜索,开展“中学生膳食和运动习惯的数据管理与分析调查”项目学习探究活动,如表1-1所示。表1-1“中学生膳食和运动习惯的数据管理与分析调查”项目学习探究活动探究活动学习内容知识技
17、能调查活动的数据管理分 析 数 据管理技术。正确描述数据。认识到数据是一种重要的资源。认识数据管理技术及发展。调查活动的数据分析体 验 数 据分析技术。了解数据分析技术及特征。体验数据分析技术的基本步骤和方法。数据管理与分析的 重 要 性 及 应 用价值体 验 数 据管理与分析的重要性。体验数据管理技术的重要性。感受数据管理与分析技术的重要性。体验数据分析技术的重要性。认 识 数 据的应用价值。数据的预测性价值。数据的挖掘性价值。数据的分析性价值。认识到通过科学管理与分析数据,可以使数据实现其应有价值。实 施实施项目学习各项探究活动,进一步认识中学生膳食和运动习惯的数据管理与分析调查。成 果在
18、小组开展项目范例学习过程中,利用思维导图工具梳理小组成员在“头脑风暴”活动中的观点,建立观点结构图,运用多媒体创作工具(如演示文稿、在线编辑工具等),综合加工和表达,形成项目范例可视化学习成果,并通过各种分享平台发布,共享创造、分享快乐。例如,运用在线编辑工具制作的“中学生膳食和运动习惯的数据管理与分析调查”可视化报告,可以在教科书的配套学习资源包中查看,其目录截图如图1-2所示。中学生膳食和运动习惯的数据管理与分析调查5Z343.indd 32019/4/1 10:04:4044第一章 数据管理与分析应用概述评 价根据教科书附录2的“项目活动评价表”,对项目范例的学习过程和学习成果在小组或班
19、级上进行交流,开展项目学习活动评价。项目选题同学们以36人组成一个小组,选择下面一个参考主题,或者自拟一个感兴趣的主题,开展项目学习。1中学生早餐营养搭配的数据管理与分析调查2校园歌手大赛成绩的数据管理与分析调查3图书馆图书借阅的数据管理与分析调查项目规划各小组根据项目选题,参照项目范例的样式,利用思维导图工具,制订相应的项目方案。方案交流各小组将完成的方案在全班进行展示交流,师生共同探讨、完善相应的项目方案。图1-2“中学生膳食和运动习惯的数据管理与分析调查”可视化报告的目录截图5Z343.indd 42019/4/1 10:04:415 51.1 数据管理与分析技术1.1 数据管理与分析技
20、术1.1.1 数据管理技术与方法在开展“中学生膳食和运动习惯的数据管理与分析调查”项目时,我们可以直接利用发放问卷的形式采集数据,也可以利用网络工具设计问卷来直接采集和管理数据。而对于项目调查活动中所涉及的各种数据,可以利用表格数据分析工具(如Excel,SPSS等),进行统计、分析及研究,并借助数据库技术、大数据技术去学习数据管理与分析的基础知识。探究活动同学们结合“中学生膳食和运动习惯的数据管理与分析调查”项目活动问卷需求,通过获取有关的资料,请尝试分别对膳食种类信息、膳食喜好信息、运动种类信息、中学生运动喜好信息等信息进行数据的描述,认识数据管理技术。1数据的描述“中学生膳食和运动习惯的
21、数据管理与分析调查”项目包括制订问卷、发放问卷、收集问卷、处理问卷、数据整理、数据分析、撰写调查报告、修改提交报告等过程。在开始制订问卷时,就需要将各种数据规范化,要对数据进行合理解释和描述,有效地进行拆解和组合,从而适于数据的处理和分析,达到数据有效管理的目标。(1)认识数据。数据是现实世界客观事物的符号记录,是信息的载体,是计算机加工的对象。在计算机科学中,数据是对所有输入计算机并被计算机识别、存储和处理的符号的总称,是联系现实世界和计算机世界的途径。在大数据时代,数据不仅是信息的载体,也是人们提取信息做出决策的重要依据,成为人们认识和理解现实世界客观事物的重要资源。如图1-3所示是国家统
22、计局网站上发布的权威数据。图1-3 国家统计局网站上发布的权威数据 可视化统计图秉持方便易用的理念展示统计数字,通过简单的图像或动态界面及互动式统计图,您可更清楚了解一些统计指标。7Z343.indd 52019/9/26 11:29:5866第一章 数据管理与分析应用概述(2)解释数据。数据是形成信息和知识的源泉,是计算机程序加工的“原料”。一般来说,数据主要包括结构化数据(structured data)、半结构化数据(semi-structured data)、非结构化数据(unstructured data)。合理解释数据,首先要对数据进行选择或将数据转化为结构化数据,其次要将数据融入
23、相应的背景进行解读,对数据做出合理解释,转化为有意义的信息。因此,数据和信息都是可解释的。如图1-4所示,单纯性数据37.8,可以是毫无意义的,但是添加一定背景,就如同为数据赋予了骨架。例如,一名叫小睿的两岁儿童,用体温计测量的腋下体温为37.8,此时37.8就转化为有意义的信息,即说明小睿为低烧状态,应该先采取一定的降温手段,再去深入探讨导致这次低烧的原因及预防方法。(3)描述数据。在日常生活中,人们通常直接用自然语言对人或事物进行描述,自然语言可以是中文、地方方言或者外文等。在计算机中,为了存储和处理这些人或事物,就要抽出对这些感兴趣的特征组成一条记录来描述。学生记录就是描述学生的数据,这
24、样的数据是有结构的,是记录计算机中表示和存储信息的一种格式表达。例如,在生活中可以这样来描述一名学生的个人数据信息:彭睿同学,男,学号是20190506873,2002年12月12日出生,出生在广东省广州市,2016年入学,高二(5)班,家庭成员有父亲、母亲、爷爷、奶奶,籍贯是河南省洛阳市,在学校住宿,学习成绩优秀,不懂广州本地方言等。通过认识、解释和描述数据,结合“中学生膳食和运动习惯的数据管理与分析调查”项目活动实际需求,在计算机中应描述为:(彭睿,男,20190506873,20021212,广东省广州市,2016,高二年级,5班)2数据管理技术及发展数据管理是指对数据的采集、分类、组织
25、、编码、存储、查询和维护等活动,从而实现数据的规范化和结构化。以数据库为代表的数据管理技术已经历近半个世纪的大发展。数据管理技术已经从第一代的层次与网状数据库系统、第二代的关系数据库系统,发展到新一代数据库,继而发展到大数据管理技术,人们在不断努力开发适合最新需求的数据库管理系统,如图1-5所示是数据管理技术发展的主要历程示意图。图1-4 合理解释数据9Z343.indd 62020/9/1 9:59:157 71.1 数据管理与分析技术3数据管理方法数据管理方法有五大类:人工管理、文件系统管理、数据库系统管理、新一代数据库和大数据管理技术。(1)人工管理。20世纪50年代中期以前,计算机刚刚
26、诞生不久,硬件和软件的发展水平都比较低,计算机主要用于科学计算,数据量少,数据结构简单,用户一般用机器指令编写程序,通过纸带输入程序和数据,如图1-6所示。这个时期数据管理处于人工管理阶段,其主要特点有:第一,没有专门的软件用来管理数据,管理数据需要依赖应用程序本身来处理。第二,数据和程序是紧密联系的,一组数据只能对应一个应用程序,而数据又不能共享。第三,数据通常包含在程序中,不具有独立性,一旦数据的结构发生变化,应用程序就要作相应的修改。图1-5 数据管理技术发展历程示意图图1-6 人工管理阶段应用程序与数据之间的对应关系5Z343.indd 72019/4/1 10:04:4588第一章
27、数据管理与分析应用概述(2)文件系统管理。20世纪50年代后期至60年代中期,数据管理进入了文件系统阶段。在文件系统中,数据可按其内容、结构和用途组织成若干个独立的文件,应用程序可以通过操作系统从文件中读写数据,如图1-7所示。在文件系统中,文件可以与程序分离,有利于长期保存,与人工管理相比,取得了长足的进步,但仍然存在以下问题:第一,数据独立性差。在文件系统中,数据文件是按照应用程序的具体要求建立的,程序改变,将引起文件结构改变,因此程序与数据之间仍缺乏数据独立性。第二,数据冗余度大。在文件系统中,文件一般为某一用户或用户组所有,文件仍然是面向应用的,因此数据共享性差,冗余度大。同时由于数据
28、重复存储,各自管理,容易产生数据的不一致性。第三,数据的安全性和完整性难以保障。文件之间相互独立,缺乏集中管理,数据的完整性和安全性等无法得到保证。(3)数据库系统管理。数据库(Database,DB)是按照数据结构来组织、存储和管理数据的仓库。数据库系统(Database System,DBS)克服了文件系统的缺陷并提供了对数据更高级、更有效的管理,如图1-8所示。这个阶段的程序和数据的联系通过数据库管理系统(Database Management System,DBMS)来实现。图1-7 文件系统阶段应用程序与数据之间的对应关系图1-8 数据库系统阶段应用程序与数据之间的对应关系5Z343
29、.indd 82019/4/1 10:04:469 91.1 数据管理与分析技术数据库管理系统是对数据库进行管理的通用软件系统,是数据库系统的核心。它具有对数据库中的数据资源进行统一管理和控制的功能。在数据库系统中,用户对数据库进行的各种操作都是通过数据库管理系统实现的,因而使数据库中的数据具有较大的独立性。数据库应用系统则是指针对某个特定目标,建立在数据库管理系统之上的计算机应用系统。简单地说,它是指引入数据库技术后的应用软件,由数据库、数据库管理系统、应用程序和用户等组成。因此,数据库、数据库管理系统和数据库应用系统是三个不同的概念,数据库强调的是数据,数据库管理系统强调的是对数据库进行存
30、储与管理的系统软件,而数据库应用系统强调的是面向具体应用软件。与人工管理和文件系统相比,数据库系统主要有以下特点:第一,数据结构化。这是数据库系统与文件系统的根本区别。数据库系统中的数据按照某一特定的数据模型组织,具有特定的统一的结构。例如,在“中学生膳食和运动习惯的数据管理与分析调查”项目活动关系数据库里,数据库中的数据组成多个二维表形式,其中学生个人信息就是一个二维表,而二维表由若干记录组成,个人信息(彭睿,男,20190506873,20021212,广东省广州市,2016,高二年级,5班)就是一条记录,而每个记录又由若干属性项组成。第二,数据共享。数据库中的数据是可以被多个应用程序共享
31、的,这和文件系统不同。数据库中的数据可以通过数据库管理系统为多个用户所共享,冗余度小。第三,数据具有较高的独立性。在数据库系统中,数据通过DBMS管理,使用户或应用程序在操作数据时,并不需要了解数据库中的数据是如何存储的,只需要以简单的逻辑结构来操作数据。第四,数据的安全性得到保证。在数据库系统中,数据的安全性和完整性由DBMS统一管理和控制。总的来说,如果说从人工管理到文件系统,是计算机领域质的飞跃,那么从文件系统到数据库系统,则标志着数据管理技术质的飞跃。(4)新一代数据库。数据库新技术是一个不断发展的范畴,在数据模型的改进、与相关技术融合以及面向应用领域等方面都在不断改进与发展。数据模型
32、的改进。相对于传统的数据库而言,集成了新的技术、工具与机制的有:面向对象数据系统(OODBS);时态数据库系统(TDBS);实时数据库系统(RTDBS);主动数据库系统(ADBS)。数据库与相关技术结合。比较有代表性的有:分布式数据库;Web数据库。5Z343.indd 92019/4/1 10:04:461010第一章 数据管理与分析应用概述面向应用领域。非结构化数据库。(5)大数据管理技术。随着网络技术的发展,非结构化数据的数量日趋增大。这时,主要用于管理结构化数据的关系数据库的局限性越来越明显。这就催生了数据管理技术进入新一代的数据库。如iBase数据库是一种面向最终用户的非结构化数据库
33、,Hbase是一个适合非结构化数据存储的数据库。例如,在制订“中学生膳食和运动习惯的数据管理与分析调查”项目活动中,需要采集不同学生、班级、群体等结构化或半结构化数据,还要采集各种半结构化或非结构化数据,如文本、图像、音频、视频等数据。在面对如此多且杂乱无章的数据文件时,要根据不同的数据采用不同的数据管理技术进行处理。在现代信息社会里,我们既可以采用现代技术化的数据管理技术,也不排除人工管理技术来管理数据,只有将不同的数据管理技术有机结合起来,才能使数据管理更加高效,特别是根据特定的需求和目的来建立对应功能的数据库管理系统,更能实现数据管理的智能化和便利化。项目实施各小组根据项目选题及拟订的项
34、目方案,结合本节所学知识,剖析调查活动的数据管理技术。1对调查信息进行数据描述。2认识数据管理技术及其发展历史。1.1.2 数据分析技术与方法通过开展“中学生膳食和运动习惯的数据管理与分析调查”项目活动,根据调查得出的系列化数据,我们可以利用表格工具(如Excel,SPSS等)或专业数据分析软件对数据进行汇总和分析,从而深入认识目前中学生的膳食和运动喜好情况与原因,为区域主管部门、学校、家庭、学生个人习惯等方面做出相应的改善建议和措施。探究活动在“中学生膳食和运动习惯的数据管理与分析调查”项目中,问卷内容主要包括性别、年龄、身高、体重、膳食中的肉类和蔬菜比、膳食摄入量、各种食物种类摄入程度、每
35、天平均运动时长、主要运动方式、最喜欢的运动方式等项目数据,随机抽取全校各个年7Z343.indd 102019/9/26 11:30:0011 111.1 数据管理与分析技术级,让同学们现场网络限时答卷。同学们自主探究与小组研讨,寻求网络检索和老师等帮助,小组汇报下列内容。(1)根据本次调查活动项目的目的,同学们应该从什么方面对数据进行分析?(2)结合本次调查项目不同的数据分析类型,同学们可以采用什么数据分析技术或工具?1数据分析技术通过合理的数据管理,同学们可以得出规范化和结构化的数据。随着信息社会的发展,大数据时代的到来,数据呈现大量化、多样化、快速化、价值密度低的特征。为了提取有用信息和
36、形成结论,进而对数据加以详细研究和概括,总结出所研究对象的内在规律,需要对数据进行分析。一般来说,数据分析是指用适当的统计分析方法对采集来的数据进行分析,将这些大量的数据进行汇总,并做成可以被人们消化和理解的资料,从中提取有用和有价值的信息。数据分析主要分为描述性数据分析、探索性数据分析、验证性数据分析等,如图1-9所示。数据分析常常是以数和量的形式展现,通过实验、观察、调查等方式获取结果。数据分析技术就是指与数据分析活动有关的技术总和,包括数据对象的描述、采集、处理、统计、分析及呈现等,在常用的数据分析中,我们会用到的工具软件主要有Excel,SPSS,Python,SAS等。在大数据时代,
37、运用大数据的批处理、流计算、图计算及查询分析计算等功能模式,可以实现对大数据的批处理、实时分析、图结构分析、查询分析等,如常用的工具软件有MapReduce,Storm,GraphX,Dremet等。2数据分析的基本步骤和方法同学们通过调查结果采集到的数据,选择不同的数据分析方法,按照数据分析的基本步骤,得出翔实的调查数据分析结果,并进一步撰写研究调查报告。(1)数据分析的基本步骤。一般来说,数据分析主要包括以下四大基本步骤,如图1-10所示,它们循序渐进、缺一不可、相辅相成,无论是对小型数据分析还是对大型数据分析,都是必不可少的环节。图1-9 数据分析类型图1-10 数据分析的四大基本步骤8
38、Z343.indd 112020/5/9 17:06:511212第一章 数据管理与分析应用概述识别需求。识别需求是确保数据分析过程有效性的首要条件,可以为采集数据、分析数据提供清晰的目标。识别信息需求是管理者的职责,管理者应根据决策过程控制的需求提出对信息的需求。采集数据。有目的地采集数据,是确保数据分析过程有效的基础。根据需求,对采集数据的内容、渠道、方法进行策划。分析数据。分析数据是指对采集的数据进行加工、整理和分析,使其转化为信息。过程改进。过程改进是指根据数据分析目标,改进做事的过程、方法或工具。例如,对以下问题进行分析,评估其有效性:a.提供决策的信息是否充分、可信,是否存在因信息
39、不足、失准、滞后而导致决策失误的问题。b.采集数据的目的是否明确,采集的数据是否真实和充分。c.数据分析方法是否合理,是否将风险控制在可接受的范围。d.是否在项目实施过程中有效运用数据分析。e.数据分析所需资源是否得到保障。(2)数据分析的基本方法。数据分析具有现状分析、原因分析、预测分析三大作用,因此,数据分析的基本方法对应这三大作用进行设置。常用的数据分析方法有对比分析法、平均分析法、分组分析法、结构分析法、交叉分析法,具体如表1-2所示。表1-2 数据分析基本方法作用方法数据分析方法现状分析对比对比分析法、平均分析法、综合评价分析法原因分析细分分组分析法、结构分析法、交叉分析法、杜邦分析
40、法、漏斗图分析法、矩阵关联分析法、聚类分析法预测分析预测回归分析法、时间序列分析法、决策树分析法、神经网络分析法随着数据库与互联网技术等的发展和应用,数据的积累不断膨胀,数据的需求也不断更新,同时带来的数据管理与分析技术也在不断进步和更新。5Z343.indd 122019/4/1 10:04:4713 131.2 数据管理与分析的重要性及应用价值最后,对数据分析除了要注意选用恰当的分析方法之外,还需注意到数据的来源,如搜索引擎抓取数据、网站的HTTP响应时间数据、网站流量来源数据等。项目实施各小组根据项目选题及拟订的项目方案,结合本节所学知识,剖析调查活动的数据分析。1确定调查活动项目的数据
41、分析技术。2体验数据分析技术的基本步骤和方法。1.2 数据管理与分析的重要性及应用价值数据管理首先是要保证数据的规范性、描述性、结构性、科学性,其次是要按照实际情况有针对性地对数据进行整理,为数据分析的应用过程提取有用信息,形成结论,最后对数据加以详细研究和概括,挖掘数据背后的内在规律和内在价值,从而体现数据管理与分析的重要性。一般来说,数据管理是数据分析的基础,有效地对数据进行管理与分析可以实现数据的预测性价值、挖掘性价值和分析性价值。1.2.1 数据管理与分析的重要性1数据管理技术的重要性(1)提高元数据管理的标准化。元数据一般是来源于监测、勘探等数据管理技术下最原始的基础数据,具有基础性
42、和原始性,因此,在数据管理技术中,要对大量的原始资料进行整理加工,将大量的纸质材料数字化,注重元数据采集中的标准化,依据不同的规则进行分类和提取。例如,在“中学生膳食和运动习惯的数据管理与分析调查”项目中,依据“中国居民平衡膳食宝塔”“中国食物成分表”“中学生体质健康标准”等基础元数据,结合区域中学生的膳食特点和运动习惯整理成调查问题。将设计出的问卷初稿先进行小范围初测、个别访谈以及征求专业学者的意见,经修改、删除、完善不明确和信度较差的试题后,形成最终的调查问卷,从而能反映当前中学生膳食和运动习惯的元数据基础,并采集最初的元数据。表1-3是“中学生膳食和运动习惯的数据管理与分析调查”项目活动
43、问卷元数据框架。5Z343.indd 132019/4/1 10:04:471414第一章 数据管理与分析应用概述表1-3“中学生膳食和运动习惯的数据管理与分析调查”项目活动问卷元数据框架项目维度对应题号第一部分基本信息1,2,3,4第二部分正餐中肉类和蔬菜的比例5晚餐摄入食物总量6一天的食物摄入总量7正餐外的食物摄入量排序8每天平均运动总时长9每天的主要运动方式10喜欢的运动方式11元数据是科学发展和基础研究的基本支撑和本源,也是国家的重要基础信息资源,在国家的宏观决策、科技创新、防灾减灾、环境保护和国民经济的各行各业发挥着不可替代的作用。加强对元数据科学的管理有利于各项工作更好地为经济建设
44、、社会发展和人民生活提供高质量、及时周到的服务。例如,加强气象数据的开发力度,提高气象元数据的标准化格式,充分利用网络和信息技术,丰富气象服务的原始数据,拓展数据服务空间,这样便能提高对气象信息预测的准确性和针对性,才能不断适应社会经济发展日益增长的需求。(2)加强数据管理服务的系统性。随着现代信息技术和网络通信技术的发展,数据管理技术的系统性也变得更加突出,只有对各项数据进行系统性的管理,才能实现数据管理技术的高效。一方面,在数据管理技术中,需要对数据进行有效的信息化处理;另一方面,要依照各项数据管理技术搭建数据共享平台,增强对数据资料系统的开发能力。例如,通过建立“气象元资料服务系统”“气
45、象档案管理系统”“气象台历史沿革管理系统”等,从而使气象数据管理服务系统化,提升了信息化资料服务和数据深加工服务,有效地完成数据的各项数字化、系统化管理服务。(3)优化大数据管理技术的准确性。面对大数据时代的到来,数据管理的准确性是考验数据管理技术的重要指标之一。因此,在大数据环境下,数据管理技术须积极应对社会需求拓展各项服务领域,积极推进网络下的科学数据共享,攻克大数据管理技术的关键性阶段,开发面向服务系统的应用终端,从而让人们更加安全有效地享受大数据环境下数据管理技术的准确性服务。2数据分析技术的重要性(1)确保数据分析的完整性。数据分析产生的分析价值建立在详尽和真实的数据层面,数据采集的
46、完善是完善数据分析技术的一个过程,不论是数字、文本、图表等各种结构化的数据,还是各种不同形式的半结构化或非结构化数据,最后都需要通过汇总、分析,进而做出相应的规划和决策,这就需要在数据分析的前期确保数据的完整性。依靠现有的数据分析技术手段,可以确保5Z343.indd 142019/4/1 10:04:4715 151.2 数据管理与分析的重要性及应用价值数据的完整性要求。(2)提高数据决策的准确性。数据的完整性约束可以确保数据的准确性,随着计算机技术的飞速发展以及专业化和国际化,各种数据分析技术应运而生,数据的准确性在依托于目前各项分析技术与方法手段基础上,让更多的数据分析可以直接依靠分析技
47、术的自动化和智能化,不仅可以降低人为的不准确性因素,更能最大效率地提高数据分析对于决策的准确性。(3)增强数据创造的价值性。数据分析技术是增强国民各项经济价值创造力的重要手段,实施有效的数据分析技术是使数据价值增值的最佳方式。在信息化高速发展的背景下,各商业体积累了海量数据,依靠目前数据分析技术的数据仓库(DW)技术、数据挖掘技术,通过积极探讨商业经营效益的分析,可以促进商业数据的最大价值化。在信息化和网络化不断发展的时代,特别是大数据时代的产生和发展,数据已经成为衡量效益的重要指标,同时也为其对于科学的评估提供了重要的参考资源。因此,随着社会和科技的不断发展,数据管理和分析技术的重要性也变得
48、越来越突出,数据管理与分析技术的发展也必将引领数据时代的健康发展。探究活动讨 论结合数据管理与分析技术的重要性,同学们查找有关资料,结合实例来讨论影响数据管理和分析技术重要性发展的因素主要有哪些。1.2.2 数据管理与分析的应用价值通过项目范例的学习,我们认识到数据是一种重要的资源,并通过科学管理与分析数据,可以使数据实现其应有的价值。1数据的预测性价值(1)气象预测。气象中的气流、风速、云层等各种数据通过系统软件的数据分析,能够比较准确地预报某区域在某时间段的气象情况。例如,针对大部分自然灾害均由气象因素引发这一现状,广东省以科技创新加强气象现代化建设,着力构建未雨绸缪式的气象趋势预测及高效
49、有序的预警信息发布体系,更好地服务于民,使得相关部门和公众在应对恶劣天气突发事件过程中游刃有余,最大限度预防和减少突发事件可能造成的危害。如图1-11所示是广东省突发事件预警信息发布中心内的区域数值天气预报重点实验室。7Z343.indd 152019/9/26 11:30:001616第一章 数据管理与分析应用概述(2)工业预测。工业中的生产过程、生产产品以及各种资源等丰富的数据经过有效分析,往往能优化生产工艺和流程,节约生产成本,降低能耗,增加利润。例如,由于航空公司的自身原因、机场流量控制、机场航空管制、天气恶劣等原因经常会导致航班延误,由民航局发布的2012年民航行业的统计数据,称航班
50、准点率为74.83%。但是某知名公司却做到了能够比航空公司更准确地预测信息。据报道,该公司已建立155处无源雷达接收站,每4.6秒接收一次雷达眼监测到的每架飞机的信息,通过这些信息可以准确了解每一架飞机在空中飞行的情况以及飞机的着陆时间。公司还建立自己的数据库,将自测的信息以及其他信息全部备案保存,经过十多年的积累,公司存储了海量的航空信息,拥有了其他任何公司都无法比拟的数据资源。(3)商业预测。商业活动中海量的数据通过系统软件的分析,能够准确得出某一类商品的市场行情和发展趋势,生产者、销售者可以借此制定生产、经营策略,消费者则可以选购到性价比高、自己喜爱的商品。思 考现代信息社会里,通过利用
51、计算机或手机等终端进行网络购物的现象已经越来越普遍,同学们通过登录相关知名的网络购物平台,体验平台中的数据管理与分析。小组交流平台的商业预测性价值主要体现在哪些方面,有哪些效果。2数据的挖掘性价值一般来说,数据挖掘就是从无意义的数据中提取有意义的信息,指导我们在结构化数据中发现潜在的关系和规律。数据挖掘有三个阶段:把数据变得透明,让大家看到数据;可以提问题,可以形成互动做出实时分析;数据要具有某些预测功能。图1-11 区域数值天气预报重点实验室5Z343.indd 162019/4/1 10:04:4817 171.2 数据管理与分析的重要性及应用价值例如,通过网络留言挖掘顾客的意见,顾客在博
52、客、论坛、社交网站,甚至微博、微信朋友圈中用文字或图片记录的消费体验,对商品和服务发表的看法和评价,是一种非结构化数据。如何把散布在网络上各种结构化、半结构化、非结构化的数据资源进行整合,从中自动挖掘有价值的信息和知识,从而上升为智慧,实现从数据到信息,再到知识,最后到智慧的转变,便是当前数据挖掘面临的巨大挑战之一。如图1-12所示是从数据到信息、到知识、最后上升为智慧的四级跳模型示意图。随着信息社会与大数据的发展,数据挖掘技术主要有决策树、聚类、时间序列、贝叶斯分类、线性回归、关联规则、类神经网络、Logistic回归等,如图1-13所示。3数据的分析性价值数据管理与分析无论是在企业还是在政
53、务部门的各种分析中,都具有数据的分析性价值,主要包括以下三种分析性价值:(1)现状性分析。数据的现状性分析可以提供企业或政务部门在现阶段整体的运营情况,以及各企业或政务部门的各项业务的构成,其中包括各项业务的发展和变动情况。在“中学生膳食和运动习惯的数据管理与分析调查”项目的设计之初就是想摸清区域内中学生膳食和运动习惯的现状,进而呈现数据进行现状性分析。数据的呈现也可称为数据的可视化表达,常用的呈现方式主要有柱形图、条形图、折线图、雷达图、饼状图、圆环等。一般来说,简单的数据呈现主要是采取基本图表形式进行统计分析,当对整体项目调查活动完成导出数据图1-13 常见的数据挖掘技术图1-12 数据信
54、息知识智慧的四级跳5Z343.indd 172019/4/1 10:04:501818第一章 数据管理与分析应用概述后,数据分析还需要对数据进行价值分析和数据的可视化表达,根据不同的数据呈现需要采用不同的手段,如表1-4所示是常用的数据可视化工具及简介。如图1-14所示是本次调查活动中中学生对食物种类喜好程度的统计情况,用折线图和雷达图呈现。表1-4 常用的数据可视化工具及简介数据可视化工具简 介Many Eyes可以得到的图表有散点图、矩阵图、网络图、条形图、直方图、气泡图、线图、堆叠图、饼图、树形图、字树、标签云等。iCharts分免费版和商业版:私人图表、自定义模板。Wolfram Al
55、pha可以输入字符串识别各种数据。Visualize可以得到的图表有图表、地图、示意图、仪表板等。Data Wrangler可以实现清洗和重新整理数据:分割、提取、填充、合并、包装、删除、推广、折叠、展开、调换不同的数据点等。交 流同学们针对“中学生膳食和运动习惯的数据管理与分析调查”项目的设计意图,结合问卷的框架结构,展开小组研讨,分析数据可以用哪些具体的方式来进行可视化表达,进而对数据进行分析。(2)原因性分析。数据的原因性分析可以确定企业或政务部门所存在的问题,认清形势,并针对原因做出相应的解决方案。(3)发展性分析。数据的发展性分析可以对企业或政务部门的发展趋势做出推测,便于制订运营计
56、划和发展。图1-14 中学生对食物种类喜好程度的数据分析的折线图和雷达图5Z343.indd 182019/4/1 21:24:2219 191.2 数据管理与分析的重要性及应用价值数据管理与分析是让数据产生价值的手段,而数据的运用才是数据价值的体现,在项目实践过程中,数据管理与分析将形成数据分析报告,体现数据的应用价值。拓 展互联网的一天互联网所涵盖的范围非常广阔,人们产生、分享和消耗的数据量很难用实体形式来衡量,那么到底有多少数据产生呢?这些数据就是一种重要的资源。2012年“互联网的一天”的数据告诉我们,一天之中,互联网产生的全部内容可以刻满1.68亿张DVD;发出的邮件有2940亿封之
57、多;发出的社区帖子达200万个;卖出的手机为37.8万台,高于全球每天出生的婴儿数量37.1万。国际数据公司(IDC)的研究结果表明,2008年全球产生的数据量为0.49 ZB,2009年的数据量为0.8 ZB,2010年增长为1.2 ZB,2011年的数据量更是高达1.82 ZB,相当于全球每人产生200 GB以上的数据。事实上,当我们仍然在把微博等社交平台当作抒情或者发表议论的工具时,某些敛财高手却正在挖掘这些互联网的“数据财富”,先人一步用其预判市场走势,而且取得不俗的收益。这些庞大数字,意味着什么?它意味着,一种全新的致富手段也许就摆在面前,它的价值堪比石油和黄金。项目实施各小组根据项
58、目选题及拟订的项目方案,结合本节所学知识,体验数据管理与分析的重要性,认识数据的应用价值,并参照项目范例的样式,撰写相应的项目成果报告。成果交流各小组运用数字化学习工具,将所完成的项目成果,在小组或班级上进行展示与交流,共享创造、分享快乐。活动评价各小组根据项目选题、拟订的项目方案、实施情况以及所形成的项目成果,利用教科书附录2的“项目活动评价表”,开展项目学习活动评价。5Z343.indd 192019/4/1 10:04:522020第一章 数据管理与分析应用概述本章扼要回顾同学们通过本章学习,根据“数据管理与分析应用概述”知识结构图,扼要回顾、总结、归纳学过的内容,建立自己的知识结构体系
59、。回顾与总结5Z343.indd 202019/4/1 10:04:5421 21本章学业评价本章学业评价同学们完成下列测试题(更多的测试题可以在教科书的配套学习资源包中查看),并通过“本章扼要回顾”以及本章的项目活动评价,综合评价自己在信息技术知识与技能、解决实际问题的过程与方法,以及相关情感态度与价值观的形成等方面,是否达到了本章的学习目标。1单选题(1)按照数据的结构类型划分,以下不属于数据类型的是()。A.结构化数据 B.半结构化数据 C.非结构化数据 D.结构型数据(2)以下不属于数据管理技术阶段的是()。A.人工管理 B.文件系统管理 C.资源管理器管理 D.数据库系统管理(3)一
60、般来说,数据分析主要有以下项目:采集数据;识别需求;过程改进;分析数据。根据数据分析的基本步骤进行排序,正确的是()。A.B.C.D.2思考题在大数据时代,如何有效地使用数据管理与分析技术?通过调查谈谈在不同行业的方法和经验,从中领会管理大数据的三大价值(时间价值、管理价值和经济价值)。3情境题2016年9月,教育部发布了中国学生发展核心素养报告,指出了目前中国学生要做全面发展的人,要从文化基础、自主发展、社会参与三大层面努力成为具有优秀核心素养的学生,主要包含人文底蕴、科学精神、学会学习、健康生活、责任担当、实践创新等六大核心素养,结合有关数据管理与分析的技术完成下列问题。(1)小睿同学想通
61、过中国学生发展核心素养有关项目的测定,明确自身的核心素养的现状。结合下图模型,为了更好地对数据进行管理和分析,应该如何根据核心素养的栏目来设计本次调查活动?“中国学生发展核心素养”模型5Z343.indd 212019/4/1 10:04:542222第一章 数据管理与分析应用概述(2)在中学生核心素养的调查活动中,小睿同学利用Xcelsius可视化软件工具得出了如下图所示的全年级数据呈现模型,试分析这些呈现方式的合理性和可行性,并对该呈现方式提出建议。Xcelsius可视化软件分析模型5Z343.indd 222019/4/1 10:04:5423 231.2 数据管理与分析的重要性及应用价
62、值第二章需求分析与数据建模数据管理与分析技术已经广泛应用于人们的日常生活与学习中,成为解决问题的重要方式。正确的需求分析与数据建模是有效管理与分析数据的关键。本章将通过“数据管理系统的需求分析与数据建模”项目,进行自主、协作、探究学习,让同学们初步了解分析业务需求、建立数据管理与分析问题整体解决方案的基本过程;尝试对既定方案进行分析、评价,发现问题并优化方案;了解数据采集途径的多样性;能利用适当的工具对数据进行采集和分类;认识噪声数据现象和成因;理解不同结构化程度数据的区别和在管理与应用上的特点;了解关系数据模型的基本概念;掌握设计较简单关系数据库的逻辑结构的方法,从而将知识建构、技能培养与思
63、维发展融入运用数字化工具解决问题和完成任务的过程中,促进信息技术学科核心素养达成,完成项目学习目标。项目需求分析与解决方案 数据的采集与分类 建立关系数据模型5Z343.indd 232019/4/1 10:04:552424第二章 需求分析与数据建模 项目范例中学生体质健康数据管理系统的需求分析与数据建模情 境青少年强则国强,青少年健康事关国家和民族的未来。健康体魄是青少年为祖国和人民服务的基本前提,是中华民族旺盛生命力的体现。近年来,为了贯彻落实健康第一的指导思想,建立健全国家学生体质健康监测评价机制,激励学生积极参加身体锻炼,教育部印发了国家学生体质健康标准(2014年修订)(以下简称标
64、准),要求各学校每学年开展覆盖本校各年级学生的标准测试工作,并根据学生学年总分评定等级。只有达到良好及以上的学生,方可参加评优与评奖。为了及时跟踪和了解当前本地区中学生的体质健康情况,有必要以标准为依据记录该地区学生的体质健康数据,并对记录的数据进行统计分析以便做出科学的指引。为此,计划建立一个数据管理系统,希望能有效地解决以上问题。为了完成“中学生体质健康数据管理系统的需求分析与数据建模”项目,首先需要了解作为数据管理系统使用者的用户到底有哪些业务需求,提出相应的解决方案,需要采集哪些数据,以及对这些数据如何建模,这就是需求分析与数据建模阶段。主 题中学生体质健康数据管理系统的需求分析与数据
65、建模规 划根据项目范例的主题,在小组中组织讨论,利用思维导图工具,制订项目范例的学习规划,如图2-1所示。图2-1“中学生体质健康数据管理系统的需求分析与数据建模”项目学习规划5Z343.indd 242019/4/1 21:24:24探 究根据项目学习规划的安排,通过调查、案例分析、文献阅读和网上资料搜索,开展“中学生体质健康数据管理系统的需求分析与数据建模”项目学习探究活动,如表2-1所示。表2-1“中学生体质健康数据管理系统的需求分析与数据建模”项目学习探究活动探究活动学习内容知识技能项目需求分析与解决方案项目需求分析。分别作为系统的使用者和设计者了解业务需求。尽可能列举与项目有关的问题
66、。初步了解分析业务需求的过程。项目解决方案。项目解决方案的设计。项目解决方案的评价。项目解决方案的优化。初步了解建立整体解决方案的过程。尝试对方案进行分析、评价并优化。数据的采集与分类数据的采集。注重元数据采集中的标准化和数据采集的途径。采集项目数据。了解数据采集途径的多样性和规范性。能依据不同规划,利用适当的工具对数据进行采集和分类。认识噪声数据现象及其成因。理解不同结构化程度数据的区别以及在管理和应用上的特点。数据的分类。数据分类的方法。项目数据分类。建立关系数据模型概 念 模 型 与E-R方法。实体、属性、实体之间的联系相关概念。建立实体关系(E-R)概念模型的方法。建立项目E-R模型。
67、初 步 了 解 概 念 模 型 和 E-R方 法。初步掌握设计较简单数据库的逻辑结构的方法。对采集到的数据建立关系数据模型。从概念模型到关系数据模型的转换。机器世界的有关术语。概念模型转换为关系数据模型的方法。实 施实施项目学习各项探究活动,进一步认识中学生体质健康数据管理系统的需求分析与数据建模。25中学生体质健康数据管理系统的需求分析与数据建模5Z343.indd 252019/4/1 10:04:572626第二章 需求分析与数据建模 成 果在小组开展项目范例学习过程中,利用思维导图工具梳理小组成员在“头脑风暴”活动中的观点,建立观点结构图,运用多媒体创作工具(如演示文稿、在线编辑工具等
68、),综合加工和表达,形成项目范例可视化学习成果,并通过各种分享平台发布,共享创造、分享快乐。例如,运用在线编辑工具制作的“中学生体质健康数据管理系统的需求分析与数据建模”可视化报告,可以在教科书的配套学习资源包中查看,其目录截图如图2-2所示。评 价根据教科书附录2的“项目活动评价表”,对项目范例的学习过程和学习成果在小组或班级上进行交流,开展项目学习活动评价。项目选题同学们以36人组成一个小组,选择下面一个参考主题,或者自拟一个感兴趣的主题,开展项目学习。1校运会管理系统的需求分析与数据建模2图书馆图书借阅管理系统的需求分析与数据建模3早餐营养搭配管理系统的需求分析与数据建模图2-2“中学生
69、体质健康数据管理系统的需求分析与数据建模”可视化报告的目录截图5Z343.indd 262019/4/1 10:04:5827 272.1 项目需求分析与解决方案项目规划各小组根据项目选题,参照项目范例的样式,利用思维导图工具,制订相应的项目方案。方案交流各小组将完成的方案在全班进行展示交流,师生共同探讨、完善相应的项目方案。2.1 项目需求分析与解决方案要设计与实现一个数据管理系统,我们首先要了解用户想要这个系统做什么,用户希望这个系统实现什么功能或者解决什么问题,这就需要对用户的业务需求进行分析,只有确定了需求之后才能提出相应的解决方案。2.1.1 项目需求分析所谓需求分析,是指对用户的业
70、务活动进行分析,也指对要解决的问题进行详细分析,弄清楚问题的要求,包括需要输入什么数据,要得到什么结果,最后应输出什么。在软件工程中,需求分析指的是在建立一个新的或改变一个现存的电脑系统时描写新系统的目的、范围、定义和功能时所要做的所有工作。在项目需求分析阶段,设计者通过和系统用户交流,了解业务需求,获得用户的示例表单、报表、查询、更新等活动的说明,明确系统的设计与实施目的,并编写需求分析说明文档,然后进行可行性论证,制订设计与实施的计划,这是由设计者和用户共同完成的一个过程。理解需求是在问题与其最终解决方案之间架设桥梁的第一步。探究活动体 验以小组为单位,跟你的同学一起通过角色替换,分别扮演
71、设计者和用户:5Z343.indd 272019/4/1 10:04:582828第二章 需求分析与数据建模(1)如果你是用户,你希望“中学生体质健康数据管理系统”应该具备哪些功能?(2)如果你是设计者,你需要了解哪些事情?将你们讨论的内容和得到的结论记录下来。从用户的角度分析:从设计者的角度分析:需求分析,简单地说就是分析用户的具体实际需求,是设计数据库的基本和起点。需求分析的结果是否准确地反映了用户的实际需求将直接影响到后面阶段的设计。需求分析的任务是通过详细调查现实业务要处理的对象,通过对原系统工作情况的充分了解,明确不同角色的用户对功能及管理者的需求,在此基础上确定新系统的功能。对于开
72、发一个数据管理系统项目而言,在项目需求分析阶段最有效的做法通常就是在与用户交流的时候提出一些开放性的问题,尽可能全面了解用户的业务需求。项目需求分析最重要的目标是弄清楚该系统究竟要“做什么”。例如,对于设计一个“学生成绩管理系统”而言,通过设计者和用户的调研协商,可以确定如下需求信息:(1)角色分类:管理员、教师、学生。(2)管理员功能设计如下:班级、教师、学生信息的添加、修改、删除与查询(包括账户密码的修改)。课程基本信息的添加、修改、删除与查询。授课计划(教师授课信息)的添加、修改与删除。(3)教师功能设计如下:修改个人基本资料和密码等。查看课程情况。查看、打印或导出学生名单。填写或修改学
73、生成绩。查看和导出学生成绩。统计学生成绩(如成绩排序、计算平均分、计算最高分、计算合格率等)。(4)学生功能设计如下:账户密码修改。查看个人成绩。查看课程开设信息。选课。5Z343.indd 282019/4/1 10:05:0029 292.1 项目需求分析与解决方案分 析以小组为单位,就“中学生体质健康数据管理系统的需求分析与数据建模”的设计,分析并尽可能把可以提出的问题列举出来。针对“中学生体质健康数据管理系统的需求分析与数据建模”的设计,我们可以考虑提出如下问题:一般有哪些人需要用到该数据管理系统?访问这些人,了解他们希望该系统实现何功能。目前我国中学生体质健康一般包括哪些数据信息?这
74、些数据信息有何特征?通过这些数据如何反映出学生的体质健康情况?通过对这些问题的回答,有助于我们系统地分析业务需求。在本项目中,我们知道使用的用户主要包括学校老师、相关上级行政部门和学生。在通过与学校老师和有关部门负责人沟通了解后,得知中学生体质健康标准登记的一般流程为:学生在学校参加一系列的体质测试;学校老师负责把学生的信息及测试成绩录入系统,并根据成绩及相应的规则对学生体质健康情况进行分析和处理;学生可以通过查询及时了解自己的体质健康情况;上级部门可根据各校上报的学生成绩,对学生的体质健康情况进行跟踪和分析,以便给出正确的指导意见。图2-3为用于记录学生体质健康数据的“国家学生体质健康标准登
75、记表”。通过与用户的访谈交流和实地调查分析,我们可以初步得知“中学生体质健康数据管理系统的需求分析与数据建模”设计与实施的目的主要包括以下几个方面的功能需求:(1)数据录入:如录入学校信息、学生个人信息、学生测试成绩等。(2)数据查询:如查询学生个人信息、学生体质健康指标、学校学生体质健康指标等。(3)数据修改:如修改学校信息、学生个人信息、学生测试成绩等。(4)统计分析报表输出:如统计学校等级信息、男女生体形差异、个人综合评分情况等。图2-3 国家学生体质健康标准登记表9Z343.indd 292020/6/2 16:18:483030第二章 需求分析与数据建模 2.1.2 项目解决方案项目
76、解决方案的重点是分析现存的问题,提出新系统的功能需求及相应的技术实现手段和实施保障的措施,说明用户需求是可以实现的。解决方案是系统开发人员在与用户充分交流的基础上结合自己的专业知识而提出的。1项目解决方案的设计项目解决方案的目的就是为了让用户了解该项目是可行的。作为设计者,一般会从“为什么做”“做什么”“达到什么效果”“怎么做”“如何保障质量”等方面考虑。讨 论以小组为单位,尝试从回答“为什么做”“做什么”“达到什么效果”“怎么做”“如何保障质量”等问题入手,讨论并设计本小组的项目解决方案。小组项目解决方案(1)现状与问题(2)功能需求(3)技术实现手段(4)保障措施项目解决方案是系统设计者在
77、充分了解用户的业务需求基础上提出的。解决方案的基本结构一般包括以下五个部分:现状分析与诊断、系统规划与设计、系统技术方案、系统实施方案、保障措施。(1)现状分析与诊断。一般从本项目所涉及的业务现状描述入手,分析当前存在的问题,并提出改进的建议,得出实施项目系统的必要性,以及需要解决的问题等,即回答了“为什么做”的问题。(2)系统规划与设计。根据现状分析提出的需求,从总体目标、指导思想、总体框架等方面对本项目系统进行总体规划与设计,也就是回答了“做什么”的问题。(3)系统技术方案。从基本功能介绍、关键问题解决方案两个层面介绍具体的技术方案。基本功能介绍是对本项目所涉及的系统产品,在标准功能基础上
78、适当补充新增功能或用户特殊需求的功5Z343.indd 302019/4/1 10:05:0231 312.1 项目需求分析与解决方案能。关键问题解决方案是就用户特别关心的问题、用户特殊需求中有一定难度的问题等提出解决方案和建议。这一步其实就是回答了“达到什么效果”的问题。通常情况下,这一步在之前的项目需求分析阶段已经给出结果。(4)系统实施方案。从本项目的预期效益入手,首先分析项目实施存在的风险,接着介绍规避风险的实施保障措施,最后给出初步实施进度计划。实施规划要结合用户的实施打算,如果系统规模比较大,可以结合用户的需求适当进行目标分解,分期完成,本步骤回答了“怎么做”的问题。(5)保障措施
79、。从能为用户提供的全方位服务承诺入手,阐述技术支持与服务的保障措施,让用户无后顾之忧,这就回答了“如何保障质量”的问题。实 践在“中学生体质健康数据管理系统的需求分析与数据建模”项目范例中,现状分析与诊断就是,由于学生的数据信息量大,传统的纸张记录方式不利于学校老师和相关部门对学生体质健康情况的跟踪和分析,有必要使用数据库系统对这些数据进行集中管理和分析。通过之前的项目需求分析,我们初步可以确定系统的基本功能包括数据的录入、查询、修改及统计和分析报表的输出等。为了操作直观和方便,我们计划选用开源软件MariaDB作为数据库管理实现的软件基础,根据数据分析阶段的需要,我们还会结合Python,S
80、PSS,SAS等软件完成中学生体质健康数据的分析,由此得到本范例初步的项目解决方案。中学生体质健康数据管理系统的需求分析与数据建模 项目解决方案(一)现状分析与诊断本项目中,使用的用户主要包括学校老师、相关上级行政部门和学生。中学生体质健康标准登记的一般流程为:学生在学校参加一系列的体质测试;学校老师负责把学生的信息及测试成绩录入系统,并根据成绩及相应的规则对学生体质健康情况进行分析和处理;学生可以通过查询及时了解自己的体质健康情况;上级部门可根据各校上报的学生成绩,对学生的体质健康情况进行跟踪和分析,以便给出正确的指导意见。传统的手工记录方式不利于及时对数据进行分析,为此需要建立一个计算机数
81、据管理系统有效地管理学生体质健康数据。(二)系统规划与设计通过建立“中学生体质健康数据管理系统”数据库管理学生体质健康测试的相关数据,并能利用这些数据实现相关的查询和统计分析等功能。(三)系统技术方案(系统基本功能)1数据录入:例如录入学校信息、学生个人信息、学生测试成绩等。5Z343.indd 312019/4/1 10:05:023232第二章 需求分析与数据建模 2数据查询:例如查询学生个人信息、学生体质健康指标、学校学生体质健康指标等。3数据修改:例如修改学校信息、学生个人信息、学生测试成绩等。4统计分析报表输出:例如统计学校等级信息、男女生体形差异、个人综合评分情况等。(四)系统实施
82、方案采用小组合作方式,通过本课程的学习,利用MariaDB数据库管理软件建立和管理“中学生体质健康数据管理系统”数据库,根据需求使用适当的数据分析软件(如Python,SPSS,SAS等)、适当的分析方法对数据库数据进行统计和分析,并根据统计分析结果撰写数据分析报告。(五)保障措施作为系统的设计者和开发者,需要为用户整理出详细的使用手册,在一定的时间段内密切留意用户使用系统后的反馈意见并及时作出调整和更新。2项目解决方案的评价目前,关于项目解决方案的评价还没有唯一的标准。一般来说,可以从以下方面进行评价:(1)是否能够透视现存问题并提出有针对性的解决措施。(2)是否针对本项目业务的特点和流程设
83、计。(3)能否满足基本需求、关键需求和未来变化的需要。讨 论以小组为单位,讨论作为一个数据管理系统,除了以上项目解决方案中提到的几部分内容外,还应该考虑哪些因素,把讨论得到的结果列举出来。交 流与其他小组分享交流本小组的数据管理系统项目的需求分析及解决方案,各小组从第三方的角度尝试对该方案进行评价并给出改进的建议。3项目解决方案的优化优化项目解决方案,是指让所设计的项目解决方案更加有针对性,更能满足需求和未来变化的需要。对项目解决方案进行优化,通常可以采取以下方法:(1)重做需求分析,确认现存问题,重新提出有针对性的解决措施。(2)重新梳理项目业务的特点和流程,根据特点和流程进行二次设计。(3
84、)检查项目基本需求、关键需求和未来变化的需要,改进解决方案。5Z343.indd 322019/4/1 10:05:0233 332.1 项目需求分析与解决方案拓 展几种常用数据库管理软件简介1关系数据库。(1)Oracle Database,简称Oracle,是以分布式数据库为核心的关系数据库管理系统,系统可移植性好、使用方便、功能强。(2)SQL Server数据库是一款RMDBS数据库。SQL Server的优点为:真正的客户服务器体系结构;图形化用户界面,更加直观、简单;丰富的编程接口工具,为用户进行程序设计提供更多的选择;具有很好的伸缩性,可跨界运行;对Web技术的支持,使用户能够容
85、易地将数据库中的数据发布到Web上;提供数据仓库功能。(3)Microsoft Office Access是把数据库引擎的图形用户界面和软件开发工具结合在一起的数据库管理系统,其优势为:存储方式单一,便于用户操作和管理;界面友好、易操作;集成环境、处理多种数据信息;支持ODBC。(4)PostgreSQL是一个开源数据库系统,可以运行在所有主流操作系统上,包括Linux、Unix和Windows。PostgreSQL是完全的事务安全性数据库,完整地支持外键、联合、视图、触发器和存储过程。PostgreSQL对很多高级开发语言均有编程接口。2非关系数据库。(1)Apache Hbase是一个分布
86、式的、面向列的开源数据库。Hbase是Hadoop项目的子项目,它利用Hadoop MapReduce来处理Hbase中的海量数据。Hbase是一个适于非结构化数据存储的数据库。从技术上看Hbase更像是“Data store”多于“Data base”,它是一种“NoSQL”数据库。(2)Redis是一个开源的数据结构存储系统,它可以用作数据库、缓存和消息中间件,支持多种类型的数据结构。Redis内置了复制、LUA脚本、LRU驱动事件、事务和不同级别的磁盘持久化,并通过Redis哨兵和自动分区(Cluster)提供高可用性。(3)MongoDB是一个基于分布式文件存储的数据库,旨在为WEB应
87、用提供可扩展的高性能数据存储解决方案。MongoDB支持的查询语言非常强大,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。(4)图形数据库是“NoSQL”数据库的一种类型,它应用图形理论存储实体之间的关系信息。相对于关系数据库中的各种关联表,图形数据库中的关系可以通过关系能够包含属性这一功能来提供更为丰富的关系展现方式。项目实施各小组根据项目选题及拟订的项目方案,结合本节所学知识,完成相应的项目需求分析与解决方案。1分析项目需求。2讨论项目解决方案。3交流项目解决方案并进行优化。5Z343.indd 332019/4/1 10:05:023434第二章 需求分析与
88、数据建模 2.2 数据的采集与分类完成了项目需求分析及提出项目解决方案后,下一个环节就要进入数据的采集与分类阶段了。2.2.1 数据采集的途径在数据管理系统设计中,了解现实系统的运作过程,有必要采集各种原始凭证,并弄清数据的来龙去脉等。探究活动讨 论以小组为单位,讨论并列举你所知道的数据采集的途径,尝试为本小组项目采集相关数据信息。常用数据采集的途径:数据采集的途径多种多样。在数据管理系统设计中,根据解决问题的需要,开发人员通常会使用以下几种数据采集的技术:1分析文档资料分析文档资料有助于了解一些内部信息,比如对数据库的需求是如何提出的、需要记录的数据信息类型等。例如,要为某公司设计一个小型财
89、务数据库系统,设计者必须先熟悉该公司的财务业务流程,其中一个有效的方法就是调用该公司的财务报表文档进行分析。2面谈面谈,通过与人面对面交流来采集信息,是比较常用的一种技术。面谈需要良好的沟通技能,访问者提前准备一系列明确的问题对被访问者提问,而且要选择合适的被访问者才能保证面谈更有效。例如,国家人口普查就是通过入户面谈的方式进行数据采集。3实地调查实地调查是了解一个系统运作的最有效的技术。成功的实地调查需要调查者进行精心5Z343.indd 342019/4/1 10:05:0235 352.2 数据的采集与分类准备,尽可能多地了解相关的人或业务活动。例如,为某小型超市设计一个超市管理系统,最
90、有效的数据采集方法就是到超市实地调查,全面了解该超市的实际经营流程。4研究对应用或问题本身进行详细研究也是一种有用的数据采集方法。相关的期刊、参考书籍和互联网都是很好的信息资源,可以提供解决类似问题的方法。5问卷调查通过问卷的方式进行调查也是一种常用的数据采集技术。利用问卷调查,可以从大量的人群中采集数据信息。问卷调查表里可以包括两类问题,即自由格式的问题和固定格式的问题。自由格式的问题为回答者在作答时提供了较大的自由度,但是被调查者的答案难以列表统计。固定格式的问题需要明确作答,对于每一个问题,被调查者都要从给出的答案中选择,被调查者的答案容易列表统计。例如,若要设计一个“早餐营养管理系统”
91、,我们就可以通过问卷调查的方式采集大量的数据。实 践在“中学生体质健康数据管理系统的需求分析与数据建模”项目中,我们可以通过分析“国家学生体质健康标准登记表”了解到系统需要记录的数据信息。我们还可以通过与学校老师和相关部门负责人面谈,以及到学校实地调查等方法,了解学校和相关部门对中学生体质健康数据记录和统计分析的一般流程,并采集第一手数据信息。我们还根据国家学生体质健康标准(2014年修订)了解到学生的体质健康水平是由学生的身体形态、身体机能和身体素质等方面综合评定的。根据年龄段,初、高中学生分别分为6组进行测试评定。在所有测试指标中,身体形态类中的身高、体重,身体机能类中的肺活量,以及身体素
92、质类中的50米跑、坐位体前屈为各年级学生共性指标。同时,标准还给出了详细的总分计算标准以及评定等级标准,如图2-4所示。图2-4“中学生体质健康数据管理系统的需求分析与数据建模”数据采集5Z343.indd 352019/4/1 10:05:033636第二章 需求分析与数据建模 2.2.2 数据的分类一般来说,开始采集到的数据都是比较凌乱的,有些数据可能很关键,有些数据却无关紧要。到底哪些数据资料是我们建立数据管理系统所关心和必需的呢?这就需要根据项目的需要,对采集到的各种原始数据进行分类整理,提取有用的信息。观 察在“中学生体质健康数据管理系统的需求分析与数据建模”数据采集中,某学校采集的
93、一组学生身高的数据如下(单位:cm):165,174,175,157,15,163,173,121,166,174,355,163,185,285,85。以小组为单位,观察这组数据是否合理,并讨论如果使用了这组数据进行后续的数据分析,会有什么影响。1噪声数据现象及其成因噪声数据(Noisy data),就是无意义的数据,就是被测量的变量的随机误差或方差,是指数据中存在着错误或异常(偏离期望值)的数据。引起噪声数据的原因有很多,比如可能是硬件故障、编程错误、语音或光学字符识别程序(OCR)中的乱码等。拼写错误、行业简称以及俚语也会阻碍机器读取,从而引起噪声数据。噪声数据可能会影响后面数据分析的结
94、果。因此,噪声数据处理是数据处理的一个重要环节。2分类数据交 流以小组为单位,交流本小组采集到的数据信息是否有用,尝试对本小组项目数据信息进行分类整理,提取有用信息。采集到的数据有不同的类别。有些数据是有结构的,可以方便地用二维表结构来表示,如数字、符号等,称为结构化数据;有些数据却不方便用二维表来表现,如所有格式的办公文档、文本、图片、图像、音频信息和视频信息等,称为非结构化数据。所谓半结构化数据,就是介于完全结构化数据和完全非结构化数据(如声音、图像文件等)之间的数据,如HTML文档就属于半结构化数据。对于不同结构的数据,管理和调用的方式是不同的。(1)结构化数据,是带有表头的表结构数据,
95、数据按行和列组织,其中第一行给出列的名字,每一列代表一个不同的事实或度量,每行表示一个已知事实集合的实例或数据。大多数公共数据都是这种格式。5Z343.indd 362019/4/1 10:05:0337 372.2 数据的采集与分类(2)非结构化数据,没有具体的数据模型,如各种文档、图片、音频、视频,通常可以建立一个包含“编号”“内容描述”和“内容(指向)”的表来实现与“数据”的对应。(3)半结构化数据,数据不总是以直接可用的格式存在,这个数据以没有表头的表格形式存储,其中的值是使用了难以理解的编码,需要使用此数据附带说明文档才能解码。分 析在“中学生体质健康数据管理系统的需求分析与数据建模
96、”案例中,登记表中的学生姓名、性别、出生日期、民族等个人信息是对管理和分析有用的,需要保留;学生测试的成绩也是有用的;但是体育老师签字和班主任签字等信息与分析学生体质健康没有很大联系。由于国家学生体质健康标准(2014年修订)不但对中学生体质健康标准给出了定义,还给出了小学生的体质健康标准的定义,所以我们只要选择与中学生标准相关的数据信息保留即可。为了管理的方便,防止学生重名带来的混淆,我们增加了学生“学籍号”,并为每所学校和测试项目设计了“学校编号”和“项目编号”。经过分析,最后我们可以将构建“中学生体质健康管理系统”项目所需的基本数据分为三类,均为结构化数据。中学生体质健康数据管理系统的需
97、求分析与数据建模 基本数据信息(1)关于学生的信息:学籍号、姓名、性别、学校名称、年级、班别、出生日期、民族、总得分、等级。(2)关于学校的信息:学校名称、地址、联系电话、电子邮箱。(3)关于测试指标项目的信息:项目编号、项目名称、项目单位、项目权重。拓 展大数据环境下的数据采集和分类在大数据环境下还可以简单地采用以上介绍的传统数据采集和分类方法吗?显然不行。大数据环境下,数据来源非常丰富而且形式多样,大数据要处理的往往是大量的非结构化数据。大数据环境下,数据采集和分类一般包括以下方法:(1)系统日志采集方法。很多互联网企业都有自己的海量数据采集工具,多用于系统日志采集,如Hadoop的Chu
98、kwa,Cloudera的Flume,Facebook的Scribe等,这些工具均采用分布式架构,能满足每秒数百MB的日志数据采集和传输需求。5Z343.indd 372019/4/1 10:05:043838第二章 需求分析与数据建模(2)网络数据采集方法:对非结构化数据的采集。网络数据采集是指通过网络爬虫或网站公开API等方式从网站上获取数据信息。该方法可以将非结构化数据从网页中抽取出来,将其存储为统一的本地数据文件,并以结构化的方式存储。它支持图片、音频、视频等文件或附件的采集,附件与正文可以自动关联。除了网络中包含的内容之外,对于网络流量的采集可以使用DPI(Deep Packet I
99、nspection,深度包检测)或DFI(Deep/Dynamic Flow Inspection,深度/动态流检测)等带宽管理技术进行处理。(3)其他数据采集方法。对于企业生产经营数据或学科研究数据等保密性要求较高的数据,可以通过与企业或研究机构合作,使用特定系统接口等相关方式采集数据。项目实施各小组根据项目选题及拟订的项目方案,结合本节所学知识,完成相应的项目数据采集和分类。1选用适当的工具进行数据采集。2选用适当的方法进行分类处理。2.3 建立关系数据模型我们知道,关系数据库是利用二维数据表来组织和存储数据以及数据之间的联系的,对应存储的是结构化数据。对于一个简单的问题,经验丰富的设计人
100、员可能很快就能设计出其数据库的结构,但是对于一个复杂的问题,则往往难以直接设计出来。因此,具体的做法是,人们在数据库设计的过程中,首先从用户的观点建立对于现实世界数据现象的概念模型,然后再把概念模型转换为某一数据管理系统支持的数据模型,这个过程也称为数据的抽象过程,如图2-5所示。图2-5 数据的抽象过程5Z343.indd 382019/4/1 10:05:0439 392.3 建立关系数据模型2.3.1 概念模型与E-R方法概念模型是从现实世界到信息世界的第一层抽象。信息世界是现实世界在人们头脑中的反映,人的思维将现实世界的数据抽象化和概念化,并用文字符号表示出来,就形成了信息世界。人们在
101、研究信息世界的过程中,常常用到以下术语:1实体客观存在且可以互相区别的事物,称为实体。如一名学生、一台电脑、一本书、一场聚会。实体是信息世界的基本单位,它与现实世界中客观存在的事物相对应。我们把拥有相同属性的实体称为同类实体,同类实体的集合称为实体集。2属性实体的特征称为属性。一个实体可以有多个特征,如姓名、性别、所在学校等都是学生的基本属性。3键能在一个实体集中唯一标识一个实体的属性称为键。键可以只包含一个属性,也可以包含多个属性。4联系在现实世界中,事物内部以及事物之间是有联系的,这些联系在信息世界中反映为实体内部的联系和实体之间的联系。实体内部的联系通常是指组成实体的各属性之间的联系,实
102、体之间的联系通常是指不同实体集之间的联系。实体之间的联系有三种:一对一联系、一对多联系、多对多联系。例如,一所学校只有一个正校长,同时一个正校长只担任一所学校的正校长职务,则学校与正校长之间具有一对一联系;一个班级有若干名学生,而每个学生只在一个班级中学习,则班级和学生之间具有一对多联系;在运动会上,一个运动员可以参加多个比赛项目,一个比赛项目也可以有多个运动员参加,则运动员与比赛项目之间具有多对多联系。探究活动讨 论以小组为单位,讨论本小组项目中包括哪些实体。它们分别是什么?各具有哪些属性?实体之间的联系是什么?把讨论、分析的结果记录下来。小组项目“实体属性”记录5Z343.indd 392
103、019/4/1 10:05:054040第二章 需求分析与数据建模 概念模型是数据库设计人员进行数据库设计的有力工具,也是数据库设计人员和用户之间进行交流的语言,因此概念模型应满足以下三个方面的要求:(1)能比较真实地模拟现实世界,具有较强的表达能力,能够方便、直接地表达应用中的各种要求。(2)简单、清晰,容易被人理解。(3)要便于在计算机上实现。概念模型的表示方法很多,其中最为著名、最为常用的是于1976年提出的实体联系模型(Entity-Relationship Model),也称为实体关系模型,简称E-R模型。建立实体关系模型(E-R模型)一般有四个步骤,如图2-6所示。E-R图就是用特
104、定的符号来描述E-R模型中实体集及实体集之间的联系,E-R图包括三个图素:(1)实体集。用矩形框表示,框内标注实体名称。(2)属性。用椭圆形表示,框内标注属性名称,并用连线与实体连接起来。(3)实体之间的联系。用菱形框表示,框内标注联系名称,用连线将菱形框分别与有关实体相连,并在连线上注明联系类型,如图2-7所示。可以用E-R图来表示实体集之间的三种联系,如图2-8所示。用E-R图表示概念模型时,人们所关心的仅仅是有哪些实体和属性,以及实体和属性之间的联系如何,而不必关心它们在计算机内是如何表示的。图2-6 建立E-R 模型的四个步骤图2-7 E-R图的基本图案图2-8 实体集的三种联系5Z3
105、43.indd 402019/4/1 10:05:0641 412.3 建立关系数据模型实 践在“中学生体质健康数据管理系统的需求分析与数据建模”项目中,我们可以初步确定数据管理系统有三个实体,分别是学生、学校和指标项目。“学生”实体的属性有学籍号、姓名、性别、年级、班别、出生日期、民族、总得分、等级等,“学校”实体的属性有学校名称、地址、联系电话、电子邮箱等,“指标项目”实体的属性有项目编号、项目名称、项目单位、项目权重等。分析这三个实体,我们可以得到它们之间有如下联系:(1)一所学校可以有多个学生参加测试,但一个学生却只能属于一所学校,因此它们之间应该是一对多联系。(2)一个学生可以参加多
106、个指标项目的测试,一个指标项目也可以由多个学生参加测试,因此它们之间应该是多对多联系。同时,作为测试结果,必定会有测试成绩,并根据标准得到该项目得分及对应等级,因此这三个属性是属于“参加”这个联系的属性。经过以上分析和综合,可以得出“中学生体质健康数据管理系统的需求分析与数据建模”的E-R图,如图2-9所示。2.3.2 从概念模型到关系数据模型的转换我们已经学会如何根据采集到的数据信息建立信息世界的概念模型,并用E-R图表示出来,但这只是第一阶段的抽象过程。那么,如何将它进一步转换为机器世界中的关系数据模型呢?机器世界又称数据世界,信息世界中的信息经过抽象和组织,以数据形式存储在计算机中,就成
107、为机器世界。与信息世界一样,机器世界也有其用来描述数据的习惯术语,这些术语与信息世界中的术语有着对应的关系。图2-9“中学生体质健康数据管理系统的需求分析与数据建模”E-R图5Z343.indd 412019/4/1 10:05:074242第二章 需求分析与数据建模 1字段字段用来标记实体的一个属性,它是可以命名的最小信息单位。例如学生有学籍号、姓名、性别、出生日期等字段,字段与信息世界的属性相对应。2记录记录是有一定逻辑关系的字段的组合。它与信息世界中的实体相对应,一条记录可以描述一个实体。例如一个学生的记录由“学籍号、姓名、性别、出生日期”等字段组成。3文件文件是同一类记录的集合。4关键
108、字关键字是可以唯一标识一条记录的字段,它可以是一个字段,也可以是多个字段。关键字与信息世界中的键相对应。思 考以小组为单位,尝试将本小组的项目概念模型转换为关系数据模型。体 验关系数据模型是采用二维表的形式表示实体以及实体之间的联系。将E-R模型转换为关系数据模型,一般可以分两步进行:(1)将每个实体集转换成一个二维表。将实体集转换成一个二维表时,实体的属性转变为二维表的字段,一个具体的实体由表中的一条记录来表示。为了方便记录某些特殊情况,可以在每个实体中增加“备注”项。由此,我们就可以得到“中学生体质健康数据管理系统的需求分析与数据建模”项目中三个实体集的关系模型,如图2-10所示。根据前面
109、所讲的关键字的定义,我们分别确定三个表的关键字为:“学籍号”作为“学生表”的关键字;“学校名称”作为“学校表”的关键字;“项目编号”作为“指标项目表”的关键字。图2-10 三个实体集的关系模型8Z343.indd 422020/5/9 17:06:5343 432.3 建立关系数据模型(2)将实体集之间的联系转换成一个二维表。用二维表来表示实体集之间的联系,通常有以下两种方法:方法一:定义一个新的二维表,该表除了包含联系本身的属性外,同时还包含其他实体集中的关键字属性,通过它们将这些实体集关联起来。按照这种方法,从“中学生体质健康数据管理系统的需求分析与数据建模”项目的E-R图,我们可以得到如
110、图2-11所示的关系数据模型。在“所在”联系表中,“学校名称”和“学籍号”分别来自“学校表”和“学生表”。在“参加”联系表中,“学籍号”和“项目编号”分别来自“学生表”和“指标项目表”,“测试成绩”“单项得分”和“单项等级”则是联系本身的属性。方法二:在一个表中,加入联系的属性以及另外一个表中的关键字属性,从而建立起它们之间的联系。如果我们要建立的数据库实体之间的联系比较简单,为了减少数据表的数目,则可以采用这种方式,即通过实体关系表中的字段属性建立起实体之间的联系。在“中学生体质健康管理系统的需求分析与数据建模”项目案例中,我们可以在“学生表”中加入“学校名称”字段,就可以建立起“学生表”和
111、“学校表”之间的联系,而不需要单独建立一个“所在”联系表。结合以上两种方法,我们可以得到“中学生体质健康管理系统的需求分析与数据建模”项目的关系数据模型,它包含学校表、学生表、参加表和指标项目表四个表,为了便于识别,我们把“参加表”的名称改为“单项成绩表”,其表结构及关联关系如图2-12所示。图2-11 关系数据模型5Z343.indd 432019/4/1 10:05:104444第二章 需求分析与数据建模 关系数据模型除了可以用上述的表格表示外,还可以用括号形式表示,如“学校表”可以写为:学校表(学校名称,地址,联系电话,电子邮箱,备注)拓 展其他数据模型简介目前成熟地应用在数据库系统中的
112、数据模型除了关系模型外,还有层次模型(Hierarchical Model)和网状模型(Network Model)。不同于关系模型是用“二维表”(或称为“关系”)来表示数据之间的联系,层次模型以“树结构”表示数据之间的联系,网状模型是以“图结构”来表示数据之间的联系。1层次模型。层次模型是数据库系统最早使用的一种模型,它的数据结构是一棵“有向树”。根结点在最上端,层次最高,子结点在下,逐层排列。层次模型的特征是:(1)有且仅有一个结点没有父结点,本节点就是树的根,称为“根结点”。(2)其他结点有且仅有一个父结点。构成层次模型的树是由结点和连线组成的,结点表示实体集,连线表示相连两个实体之间的
113、联系,这种联系只能是“一对多”的(“一对一”是“一对多”的特例)。通常把表示“一”的实体放在上方,作为父结点;把表示“多”的实体放在下方,作为子结点,如图2-13所示。图2-12 表结构及关联关系5Z343.indd 442019/4/1 10:05:1245 452.3 建立关系数据模型最有影响的层次模型的数据库系统是20世纪60年代末由IBM公司推出的IMS(Information Management System)层次模型数据库系统。2网状模型。网状模型以网状结构表示实体与实体之间的联系。网中的每一个结点代表一个记录类型,联系用链接指针来实现。网状模型可以表示多个从属关系的联系,也可以
114、表示数据间的交叉关系,即数据间的横向关系与纵向关系,它是层次模型的扩展。网状模型可以方便地表示各种类型的联系,但结构复杂,实现的算法难以规范化。其特征是:(1)允许结点有多于一个父结点。(2)可以有一个以上的结点没有父结点。例如,某医院每个医生负责治疗三个病人,不同医生负责治疗的三个病人可住同一病房。它们构成了一个网状模型,如图2-14所示。一个网状模型可以理解为多个层次模型的集合,所以网状模型和层次模型本质上是一样的。从逻辑上看,它们都是基本层次关系的集合,用结点表示实体,用连线表示实体间的关系;从物理上看,它们每一个结点都是一个存储记录,用链接指针来实现记录之间的关系。当存储数据时,由于这
115、些链接指针已经固定下来了,那么就导致数据检索时必须考虑存储路径问题;当更新数据时,涉及链接指针的调整,缺乏灵活性,系统扩张麻烦。图2-13 学校行政管理的层次模型图2-14 某医院管理数据库的网状模型5Z343.indd 452019/4/1 10:05:144646第二章 需求分析与数据建模 项目实施各小组根据项目选题及拟订的项目方案,结合本节所学知识,建立项目实体关系(E-R)模型并转换为相应的关系数据模型,参照项目范例的样式,撰写相应的项目成果报告。成果交流各小组运用数字化学习工具,将所完成的项目成果,在小组或班级上进行展示与交流,共享创造、分享快乐。活动评价各小组根据项目选题、拟订的项
116、目方案、实施情况以及所形成的项目成果,利用教科书附录2的“项目活动评价表”,开展项目学习活动评价。5Z343.indd 462019/4/1 10:05:1447 47本章扼要回顾本章扼要回顾同学们通过本章学习,根据“需求分析与数据建模”知识结构图,扼要回顾、总结、归纳学过的内容,建立自己的知识结构体系。回顾与总结6Z343.indd 472019/4/2 15:15:424848第二章 需求分析与数据建模 本章学业评价同学们完成下列测试题(更多的测试题可以在教科书的配套学习资源包中查看),并通过“本章扼要回顾”以及本章的项目活动评价,综合评价自己在信息技术知识与技能、解决实际问题的过程与方法
117、,以及相关情感态度与价值观的形成等方面,是否达到了本章的学习目标。1单选题(1)项目需求分析的目的是()。A.和用户搞好关系 B.尽可能全面了解用户的业务需求 C.大概了解用户的业务需求 D.让用户了解自己的能力(2)以下不是常用的数据采集方法的是()。A.面谈 B.实地调查 C.问卷调查 D.猜测(3)以下不是结构化数据特征的是()。A.可以用二维表结构来表示 B.没有具体的结构模型 C.每一列代表一个不同的事实或度量 D.每一行表示一个实例或数据2思考题现实生活中的数据来源可以有多种途径,谈谈你对噪声数据的认识以及如何甄别数据。3情境题某市准备以“家风传承”为主题开展一次全市中小学生电脑作
118、品比赛,鼓励全市中小学生以电脑作品的形式展现自己的家风。为更好地对收集到的作品进行登记及评奖,主办方需要为本次比赛建立一个数据库管理系统。(1)假如你是本次数据库管理系统项目的设计人员,你认为该如何为本项目进行需求分析及设计解决方案?(2)该项目将会产生哪些实体和关系?5Z343.indd 482019/4/1 10:05:1849 492.3 建立关系数据模型第三章数据管理有效地管理数据可以帮助人们存储数据信息,把原本看似杂乱无章的数据转换成可供利用的数据资源,提高记录和检索信息的效率。只有对数据进行有效的管理才能发挥数据的价值与作用。本章将通过“数据管理系统的数据管理”项目进行自主、协作、
119、探究学习,让同学们使用数据库管理系统建立关系数据库,了解数据库基本的数据查询方法(如选择、投影、排序、统计等),能使用结构化查询语言进行简单的数据查询;结合实际案例,认识数据丢失的风险,利用实时备份与定时备份、全备份、增量备份与差异备份等多种方法进行数据备份,从而将知识建构、技能培养与思维发展融入运用数字化工具解决问题和完成任务的过程中,促进信息技术学科核心素养达成,完成项目学习目标。关系数据库的建立 数据的查询 数据的备份与恢复7Z343.indd 492019/9/26 11:30:015050第三章 数据管理中学生体质健康数据管理系统的数据管理项目范例情 境以国家学生体质健康标准(201
120、4年修订)为标准记录某地区学生的体质健康数据,若以人工记录方式管理数据,数据量大容易出错。结合项目需求分析及对应的关系数据模型,为了更有效地及时跟踪和了解当前本地区中学生的体质健康情况,需要建立一个计算机数据管理系统对本地区中学生体质健康数据进行管理,这样才能更准确地记录数据并对这些数据进行统计分析,以便做出更加科学的指引。主 题中学生体质健康数据管理系统的数据管理规 划根据项目范例的主题,在小组中组织讨论,利用思维导图工具,制订项目范例的学习规划,如图3-1所示。探 究根据项目学习规划的安排,通过调查、案例分析、文献阅读和网上资料搜索,开展“中学生体质健康数据管理系统的数据管理”项目学习探究
121、活动,如表3-1所示。图3-1“中学生体质健康数据管理系统的数据管理”项目学习规划5Z343.indd 502019/4/1 10:05:2251 51中学生体质健康数据管理系统的数据管理表3-1“中学生体质健康数据管理系统的数据管理”项目学习探究活动探究活动学习内容知识技能关系数据库的建立创建数据库和数据表。在MariaDB中创建数据库和数据表。修改表的结构完善数据库。建立表之间的联系。了解数据库记录中增、删、改及导入的相关操作。使用数据库管理系统建立关系数据库。修改表的结构。建立表之间的联系。数据库事务的处理。数据的查询数据库基本的查询方法。选择查询。投影查询。排序查询。统计查询。了解数据
122、库基本的数据查 询 方 法(如 选 择、投影、排序、统计等)。能使用结构化查询语言进行简单的数据查询。使 用 结 构 化 查 询 语 言SQL查询数据。结构化查询语言SQL的简介。使用SQL语言查询数据。数据的备份与恢复数据丢失的风险及原因。常见的数据备份与恢复方法。数据丢失的风险及原因。数据备份与恢复。结合实际案例,认识数据丢失的风险。利用实时备份与定时备份、全备份、增量备份与差异备份等多种方法进行数据备份。实 施实施项目学习各项探究活动,进一步剖析中学生体质健康数据管理系统的数据管理。成 果在小组开展项目范例学习过程中,利用思维导图工具梳理小组成员在“头脑风暴”活动中的观点,建立观点结构图
123、,运用多媒体创作工具(如演示文稿、在线编辑工具等),综合加工和表达,形成项目范例可视化学习成果,并通过各种分享平台发布,共享创造、分享快乐。例如,运用在线编辑工具制作的“中学生体质健康数据管理系统的数据管理”可视化报告,可以在教科书的配套学习资源包中查看,其目录截图如图3-2所示。5Z343.indd 512019/4/1 10:05:235252第三章 数据管理评 价根据教科书附录2的“项目活动评价表”,对项目范例的学习过程和学习成果在小组或班级上进行交流,展开项目学习活动评价。项目选题同学们以36人组成一个小组,选择下面一个参考主题,或者自拟一个感兴趣的主题,开展项目学习。1校运会管理系统
124、的数据管理2图书馆图书借阅管理系统的数据管理3早餐营养搭配管理系统的数据管理项目规划各小组根据项目选题,参照项目范例的样式,利用思维导图工具,制订相应的项目方案。图3-2“中学生体质健康数据管理系统的数据管理”可视化报告的目录截图5Z343.indd 522019/4/1 10:05:2453 533.1 关系数据库的建立方案交流各小组将完成的方案在全班进行展示交流,师生共同探讨、完善相应的项目方案。3.1 关系数据库的建立数据管理的第一步是建立数据库。我们根据已经设计好的“中学生体质健康数据管理系统”关系数据模型,建立相应的数据库,以实现对数据的有效管理。3.1.1 创建数据库和数据表数据库
125、是长期储存在计算机内、有组织的、可共享的数据集合。数据库中的数据以一定的数据模型组织、描述和储存在一起,具有尽可能小的冗余度、较高的数据独立性和易扩展性的特点,并可在一定范围内为多个用户共享。这种数据集合具有如下特点:尽可能不重复,以最优方式为某个特定组织的多种应用服务;其数据结构独立于使用它的应用程序;对数据的增、删、改、查由统一软件进行管理和控制。数据表(Table)是数据库最重要的组成部分之一。数据库就像档案柜,是数据的物理存储区域。当我们使用档案柜存储资料时,会在档案柜中创建文件,然后将相关联的数据放入特定的文件中。在数据库领域中,这种文件就叫作“表”。数据表是结构化的文件,用来存储特
126、定数据类型的数据。表可能存储客户清单、产品目录或者其他信息列表。人们经常使用术语“数据库”来指代他们运行的数据库软件,这是错误的。数据库软件实际上称为数据库管理系统,数据库是通过DBMS创建和操作的容器。探究活动讨 论目前数据库管理系统软件非常多,常用的有ACCESS,SQL Server,MySQL,MariaDB,Oracle,Sqlite,PostgreSQL数据库等。请同学们查阅文献,讨论这几种常用数据库系统的应用场合及优缺点,选择自己感兴趣的数据库管理软件作为项目实现的软件基础,为小组自选项目建立数据库和数据表。5Z343.indd 532019/4/1 21:24:255454第三
127、章 数据管理目前几乎所有的主流数据库管理系统,如Oracle,Sybase,MySQL,MariaDB,Sqlite,SQL Server,PostgreSQL均支持关系数据模型。本教科书选用了开源数据库管理系统软件MariaDB(MySQL分支之一,开源免费版)作为项目范例数据库管理实现的软件基础。同时,为了操作直观和方便,教科书还选用了具有图形用户界面的HeidiSQL作为对MariaDB的操作界面。相关软件的安装程序可从教科书配套资源包中下载安装。建立关系数据库一般包括两个步骤:(1)创建数据库。(2)在数据库中创建数据表。实 践根据已经建立的“中学生体质健康数据管理系统”的关系数据模型
128、创建对应的数据库和数据表,具体操作如下:1启动MariaDB和HeidiSQL,在HeidiSQL窗口中,创建与MariaDB的连接,在会话管理窗口中按“新建”按钮,设置用户与密码,并将Unnamed重命名为“localhost”后进行保存,如图3-3所示。2在连接“localhost”中按鼠标右键弹出下拉快捷菜单,选择“创建新的”“数据库”,在创建数据库界面的“名称”后输入“中学生体质健康数据管理系统”,并将字符集选择为“utf8_general_ci”,如图3-4所示。图3-3 创建数据库连接7Z343.indd 542019/10/9 18:21:4355 553.1 关系数据库的建立3
129、创建数据表。创建数据表首先要定义数据表的结构,包括以下三个方面的内容:(1)确定数据表中各个字段的名称。(2)设置各个字段的属性,包括字段的数据类型、字段说明和对字段的约束条件等。(3)确定数据表的主键。例如,“学生表”中字段名、数据类型、主键设定如表3-2所示。表3-2“学生表”结构字段名数据类型长度是/否主键学籍号文本19是姓名文本12性别文本2年级文本8学校名称文本255班别文本255出生日期日期时间民族数字长整型总得分数字长整型等级文本6备注文本255图3-4 创建空的数据库5Z343.indd 552019/4/1 10:05:245656第三章 数据管理右键单击新建的“中学生体质健
130、康数据管理系统”数据库,在快捷菜单中选择“创建表”“表”。在表设计视图窗口中分别输入字段名称,并选择数据类型。在“学籍号”字段上点击右键选择“创建新索引”,选择“KEY”并保存,如图3-5所示。3.1.2 修改表的结构思 考有时候我们在数据分析阶段设计出来的数据表结构并不一定完善,例如,在创建“指标项目表”时,对应的关系数据模型为:指标项目表(项目编号,测试对象,项目名称,项目单位,项目权重,备注),负责录入的同学忘记了创建“项目单位”字段,而且把“备注”字段放在了“项目名称”和“项目权重”字段之间,如图3-6所示。同学们思考如何才能完善表结构,使其与关系数据模型对应。图3-5“学生表”的表结
131、构图3-6 不完善的“指标项目表”的表结构5Z343.indd 562019/4/1 10:05:2557 573.1 关系数据库的建立一般的数据库管理系统软件都允许我们在创建好数据表后,甚至输入数据后再对表的结构进行修改。一般修改数据表的结构包括添加、删除、移动字段和改变字段类型等操作。需要注意的是,在创建完数据库和数据表后,如果要继续修改数据表,必须先打开数据库和数据表。体 验为了完善“中学生体质健康数据管理系统”数据库中“指标项目表”的表结构,我们需要增加“项目单位”字段。具体操作如下:1在数据库窗口中,选中“指标项目表”,编辑数据表,如图3-7所示。2选择“项目名称”字段行,按鼠标右键
132、弹出下拉菜单,选择“添加”按钮,在该选中字段后面插入一空行,直接在空行上输入要插入的字段信息即可,如图3-8所示,完善后的“指标项目表”的表结构如图3-9所示。图3-7 编辑数据表图3-8 添加字段5Z343.indd 572019/4/1 10:05:255858第三章 数据管理3.1.3 建立表之间的联系问 题数据库是多个数据表的集合,而数据表并不是相互孤立的,有些表之间是有一定联系的。如何为这些表建立联系?在HeidiSQL中,我们可以通过添加外键的方法为数据表建立关联。实 践为“中学生体质健康数据管理系统”中“单项成绩表”“学生表”和“指标项目表”建立关联,分别添加外键,如图3-10所
133、示。3.1.4 数据库事务的处理思 考建立了数据库和数据表后,如何为数据表增加记录?对于类似“学校”“性别”和“民族”等字段的值经常会有重复,如何提高记录输入的效率?图3-9 完善后的“指标项目表”的表结构图3-10 建立关联5Z343.indd 582019/4/1 10:05:2559 593.1 关系数据库的建立编辑数据库包括对记录的增加、删除、修改等操作。其中记录的增加包括直接输入记录数据,也可以通过设置字段的查阅方式输入记录数据,还可以选择参照另一个数据表的输入方式输入记录数据。交 流为“中学生体质健康数据管理系统”中的工作表添加记录,与同学们交流并根据需要对数据记录进行删除和修改。
134、1增加记录。(1)直接在数据表中添加记录。一般情况下,我们可以直接打开数据库中的数据表,在需要增加记录的位置选择“”按钮,输入需要增加的内容并保存,如图3-11所示。(2)设置自行输入的查阅方式。有些特定的数据,比如“性别”字段只有两个值“男”和“女”,直接输入重复的工作量比较大,我们可以通过“设置字段的查阅方式”进行输入。具体操作如下:在“学生表”的编辑窗口修改性别字段类型,将varchar修改为enum,如图3-12所示。图3-11 利用“打开表”直接添加记录数据图3-12 修改“性别”字段类型5Z343.indd 592019/4/1 10:05:266060第三章 数据管理设置“性别”
135、字段的值为“男”“女”,如图3-13所示。在“学生表”的数据视图选择“性别”字段,在倒三角形上按鼠标左键出现“男”“女”,可以直接用鼠标左键选择性别,如图3-14所示。(3)设置参照另一数据表的输入方式。还有些字段数据的输入需要参照另外一个数据表的数据进行输入,比如“学生表”中的“民族代码”字段。为了让数据的输入更加简便不容易出错,我们可以新建立一个“民族代码表”,“学生表”中的“民族代码”字段数据的输入就参照“民族代码表”中的数据输入,如图3-15所示,“学生表.民族代码”与“民族代码表.民族”的数据类型要相同,若不同,要修改一致。图3-13 设置“性别”字段的值图3-14 用鼠标左键选择性
136、别图3-15“学生表.民族代码”与“民族代码表.民族”数据类型要相同5Z343.indd 602019/4/1 10:05:2661 613.1 关系数据库的建立在“学生表”中选择“外键”,出现如图3-16所示的“外键”对话框。在“外键”中按“”按钮添加,点击字段下面空白处并左键选择“民族代码”,设置关联表为“民族代码表”,设置外联字段为“民族”,设置删除时和更新时均选“CASCADE”,点击“保存”按钮,结果如图3-17所示。进入“学生表”的数据视图,点击“民族代码”字段的“”按钮,即可选择相应的代码填充,如图3-18所示。图316“外键”对话框图317 设置“学生表”外键图3-18 填充民
137、族代码5Z343.indd 612019/4/1 10:05:276262第三章 数据管理(4)导入数据。作为典型的开放型数据库,MariaDB支持与其他类型的数据库文件进行数据的交换和共享,同时也支持与其他Windows程序创建的数据文件进行数据交换。数据的导入就是将其他格式的数据合并在数据库中,并实现对导入数据的调用。比如,在“中学生体质健康数据管理系统”中,我们已经把学校信息录入一个Excel表格文件中,如何把这个Excel表格中的数据导入MariaDB管理系统中呢?为了把如图3-19所示的“学校表.xlsx”的数据导入HeidiSQL中,我们需将“学校表.xlsx”另存为csv格式的文
138、件“1.csv”(为了便于以后读取数据,需保存在英文路径下),然后用记事本打开“1.csv”并另存为utf8格式的“1.csv”文件,才能重新导入HeidiSQL的“中学生体质健康数据管理系统”数据库中。具体数据库导入操作如下:在HeidiSQL中打开“中学生体质健康数据管理系统”数据库,按鼠标左键选中“学校表”,在“工具”菜单下选中“导入CSV文件”,如图3-20所示。图3-19 Excel表格文件“学校表.xlsx”图3-20 导入CSV文件5Z343.indd 622019/4/1 10:05:2763 633.1 关系数据库的建立导入文件“1.csv”,在“导入文本文件”界面进行相关设
139、置,然后点击“导入!”按钮,完成导入CSV文件,如图3-21所示。2删除记录。如果在管理数据过程中需要删除表中的某个记录,只需要在数据视图中选择需要删除的记录,点击工具栏上的“”按钮,然后点击“确定”按钮即可完成删除记录的操作。例如,删除“陈焕荣”的记录,如图3-22所示。当然,我们也可以利用点击鼠标右键的快捷菜单来完成删除记录的操作,比如删除学生“陈焕荣”的记录,如图3-23所示。图3-21 导入扩展名为CSV的文件图3-22 删除记录5Z343.indd 632019/4/1 10:05:276464第三章 数据管理3修改记录。如果要修改已有的记录数据,只要在数据视图中双击要修改的数据,在
140、弹出的对话框中输入要修改的内容,点击按钮,即可完成修改,如图3-24所示。4插入记录。如果要插入记录,只要点击工具栏上的按钮,即可在表当前光标处插入新记录,插入完成后,点击按钮,如图3-25所示。图3-23 利用快捷菜单删除记录图3-24 修改记录数据图3-25 插入新记录7Z343.indd 642019/12/20 9:39:3965 653.2 数据的查询项目实施各小组根据项目选题及拟订的项目方案,结合本节所学知识,建立项目的关系数据库。1实践创建数据库和数据表的方法。2实践数据库的增、删、改、导入等操作。3.2 数据的查询数据库里存储着大量的数据,如果能充分利用数据库管理系统提供的各种
141、功能来检索数据及输出报表,那么我们就可以节省大量的时间和精力。从数据库中经过筛选获取满足条件数据的过程称为数据查询或查询数据库。3.2.1 数据库基本的查询方法探究活动讨 论以小组为单位,通过查阅相关资料了解数据库基本的查询方法有哪些,并和小组成员分享这些方法的使用场合。数据查询的方法有许多,包括数据的选择、投影、排序、统计等。创建查询时,我们要确定该查询涉及哪些字段,这些字段涉及哪些表,有什么约束条件以及对查询结果显示的要求等。通常可以按照如图3-26所示的顺序来创建一个查询。图3-26 查询的一般过程5Z343.indd 652019/4/1 10:05:286666第三章 数据管理1选择
142、查询选择查询是从一个关系中找出满足给定条件的记录的操作,是从行的角度进行的运算,选出满足条件的那些记录构成原关系的一个子集。思 考如何查看单项测试成绩获得优秀的学生记录?如何查看在50米跑步项目中获得优秀的学生记录?实 践在HeidiSQL中一般是通过实现查询。实现选择查询的具体方法如下:(1)在数据库中选中“单项成绩表”,选择工具栏按钮进入查询视图,从“SQL关键字”中找到“SELECT”,如图3-27所示。(2)在查询窗口中,分别在“单项成绩表 表的字段”“SQL函数”和“SQL关键字”等选项中选择相应的选项,添加查询条件,如图3-28所示。(3)按 按钮运行,查询结果如图3-29所示。图
143、3-27 进入查询视图图3-28 添加查询条件5Z343.indd 662019/4/1 10:05:2967 673.2 数据的查询如果仅仅要查看某个项目的优秀学生记录,比如50米跑步项目,由于从“指标项目表”可查到50米跑步对应的项目编号为“15”,所以需要在图3-29的基础上继续添加查询条件,其结果如图3-30所示。思 考“学生表”中记录了许多学生的属性信息,如果仅仅需要查询显示学生的总分等级该如何操作?2投影查询投影查询是从一个关系中选出若干指定字段的值的操作,是从列的角度进行的运算,所得到的字段个数通常比原来关系中少或排序顺序不同。图3-29 查询结果图3-30 增加查询条件后的结果
144、6Z343.indd 672019/4/2 10:40:116868第三章 数据管理体 验在查询视图中实现投影查询,具体方法如下:(1)打开“中学生体质健康数据管理系统”数据库,选中“学生表”,单击按钮进入查询视图,在查询窗口分别通过“SQL关键字”选择关键字“SELECT”和“FROM”,通过“学生表 表的字段”选择字段“姓名”和“总分等级”,注意字段之间要用英文的逗号间隔,最后选择“表 学生表”,如图3-31所示。(2)点击工具栏中的按钮,查询结果如图3-32所示。思 考上述实践中,通过创建查询获得了“学生表”中所有学生的总分等级。但是这些记录显示的顺序有些杂乱,能否让查询后得到的数据按某
145、个字段(比如“总分等级”)的值进行排序呢?图3-31 创建查询并设置查询条件图3-32 运行查询后的结果6Z343.indd 682019/4/2 12:25:3769 693.2 数据的查询3排序查询查询检索得到的数据如果没有排序,数据通常按照底层表中的顺序显示。然而,如果数据随后被更新或者删除,这个顺序将会受到MariaDB如何重用回收的存储空间的影响。关系数据库设计理论认为,如果没有显示指定排序,不应该认为检索的数据顺序是有意义的。若要为查询检索到的数据添加排序,则需要在查询中添加“ORDER BY”选项。交 流在如图3-31所示查询条件的基础上,与同学们交流,继续从“SQL关键字”选择
146、关键字“ORDER”和“BY”,从“学生表 表的字段”中选择字段“总分等级”,再从“SQL关键字”中选择关键字“DESC”,如图3-33所示。重新运行查询,查询结果按照“总分等级”字段值进行排序,如图3-34所示。讨 论 排序中的“ASC”和“DESC”分别代表什么含义?图3-33 为查询添加排序选项图3-34 运行排序查询后的结果6Z343.indd 692019/4/2 12:25:387070第三章 数据管理4统计查询数据录入数据库后,除了对里面的数据进行选择查询、投影查询和排序查询等操作外,还经常需要对里面的数据进行一些统计,如统计各测试指标项目的平均得分、各学校参加测试的学生人数、各
147、学校有多少学生测试的综合成绩可以达到“优秀”等级有时候,我们还需要将这些统计结果以报表的形式表现出来。思 考如何利用“中学生体质健康数据管理系统”数据库统计各测试指标项目的平均分是多少?如何利用“中学生体质健康数据管理系统”数据库中的“单项成绩表”统计出各单项等级中共有多少人(即优秀、合格等各有多少人次),他们的学籍号、测试成绩、单项得分各是多少?最后将统计结果以报表的形式输出。数据统计的目的是将表的记录予以分组后,再加以计算。实 践要计算某一个班学生各测试指标项目的平均分,就是将该班所有的测试得分按指标项目分组进行统计。这里需要用到的表是“指标项目表”和“单项成绩表”,其中约束条件是“指标项
148、目表.项目编号”=“单项成绩表.项目编号”,具体操作步骤如下:(1)打开“中学生体质健康数据管理系统”数据库,在“查询”中新建一个新的查询。(2)在“查询”视图中分别通过“SQL关键字”和“SQL函数”添加相应的关键字,并设置所需的表和字段,设置约束条件。(3)在“SELECT”行的“单项得分”前增加“SQL函数”“avg”,通过“SQL关键字”“AS”设置别名为“平均分”。(4)在“GROUP BY”行中添加“指标项目表.项目编号”,如图3-35所示。(5)运行查询,部分结果如图3-36所示。图3-35 选择汇总功能5Z343.indd 702019/4/1 10:05:3071 713.2
149、 数据的查询汇总功能的部分选项内容功能如下:分组(Group by):按某一字段对记录进行分组。合计(Sum):计算字段中值的总和。平均值(Avg):计算平均值。最小值(Min):搜索该字段的最小值。最大值(Max):搜索该字段的最大值。计数(Count):计算记录条数。3.2.2 使用结构化查询语言SQL查询数据到目前为止,我们所学习的有关数据库的查询方法都是在HeidiSQL中通过设置“SQL函数”和“SQL关键字”等方式来实现的。不同的数据库管理系统软件,其图形操作界面会有所不同。本节我们将学习使用结构化查询语言SQL实现数据库的数据查询。1结构化查询语言SQL简介结构化查询语言(Str
150、uctured Query Language,简称SQL)是关系数据库的标准语言,由于它具有功能丰富、使用方便灵活、语言简洁易学等突出的优点,因而深受计算机界和计算机用户的欢迎。1986年10月,美国国家标准局(ANSI)的数据库委员会批准将SQL作图3-36 统计的结果5Z343.indd 712019/4/1 10:05:307272第三章 数据管理为数据库语言的美国标准,同年公布了标准SQL。此后不久,国际标准化组织(ISO)也做出了同样的决定。SQL语言具有如下特点:(1)数据描述、操纵、控制等功能一体化。SQL原意为结构化查询语言,但实际具有集查询、操纵、定义和控制等四方面功能于一身
展开阅读全文
课堂库(九科星学科网)所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。


2019届人教A版数学必修二同步课后篇巩固探究:2-1-1 平面 WORD版含解析.docx
