教材:高中信息技术教材里的数据科学
张记存
高中信息技术教材引导学生通过了解如何采集、存储、组织、处理、分析与可视化表达数据,认识数据对日常生活的影响,并形成数据的安全意识。下面笔者梳理一下教材中与数据科学相关的具体内容。
数据
①定义:数据是对客观事物的符号表示。②特征:二进制、语义性、分散性、多样性与感知性。③来源:按照获取渠道,可以将数据分为两类——直接数据和间接数据。④收集方法:直接数据的收集方法,如调查法、访谈法等。间接数据的收集方法,如查阅文献资料等。
数据采集
1.模拟信号、数字信号及相互转换
模拟信号的值是随时间连续变化的,波形光滑。数字信号随时间的变化是非连续的,是离散的。通过一定的规则和方法可以实现模拟信号和数字信号的相互转换,将模拟信号转化为数字信号的过程称作模数转换,将数字信号转换成模拟信号称为数模转换。
2.进制及转换
在计算机科学中,除了使用二进制外,人们还经常使用八进制和十六进制。字母D表示十进制,字母B表示二进制,字母O表示8进制,字母H表示16进制。
3.编码
(1)文本编码
用于文本数据字符编码的方案有多种类型,其中ASCII码和Unicode是最为典型的两种编码方案。
(2)图像编码
图像文件大小的计算公式为:图像文件大小=图像宽度×图像高度×色彩深度/8(字节)。
(3)音频编码
音频文件的大小取决于采样频率、量化位数、声道数和时长,音频文件大小的计算公式为:音频文件大小=采样频率×量化位数×声道数×时长/8(字节)。
(4)视频编码
视频是由以一定的速度连续播放的一组静态图像形成的,这些静态图像被称为帧。
数据存储
计算机中存储容量最小的单位是比特(bit)。8bit为一个基本单位,称为字节(Byte)。常见的单位还有KB、MB、GB、TB等。
數据分析
数据分析是在一大批杂乱无章的数据中,运用数字化工具和技术,探索数据内在的结构和规律,构建数学模型,进行可视化表达,通过验证将模型转化为知识,为诊断过去、预测未来发挥作用。
可视化表达及数据分析报告
以图形、图像和动画等方式更加直观生动地呈现数据及数据分析结果,揭示数据之间的关系、趋势和规律等的表达方式称为数据可视化表达。
数据分析报告是项目研究结果的展示,也是数据分析结论的有效承载形式。
大数据
大数据的5Ⅴ特征:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。
数据安全
威胁数据安全的因素有很多,如硬盘驱动器损坏、操作失误等。
对于数据安全,不仅要做好防护,还应提高数据本身的安全,常见的数据校验方法有MD5等。