
13
时间 产业 教育程度 性别
2016 第一产业 大学及以上 男
2017 第二产业 中学 女
2018 第三产业 小学及文盲
2019
从表 1-1 可以看到,时间特征有 4 个值,产业特征有 3 个值,教育特征有 3
个值,性别有 2 个值。因此,由这些特征组合所形成的最多数据有 4
3
3
2=72
个。这 72 个数据可按表 1-2 的格式表示。在表 1-2 中,A 表示人口数据,并且 A
分别具有性别、职业、受教育程度和时间这 4 个方面的特征,对此也可以说 A 是
具有 4 维特征的人口数据。将这些特征综合在一起,并按时间特征(时间序列)
进行排序,由此形成了表 1-2 的数据。
表 1-2 按年份分布的产业、受教育程度和性别交叉分类的人口数据
男 女
时间 产业 大学及以上 中学 小学及文盲 大学及以上
中学 小学及文盲
2016 一产 A(1,1) A(1,2) A(1,3) A(1,4) A(1,5)
A(1,6)
二产 A(2,1) A(2,2) A(2,3) A(2,4) A(2,5)
A(2,6)
三产 A(3,1) A(3,2) A(3,3) A(3,4) A(3,5)
A(3,6)
2017 一产 A(4,1) A(4,2) A(4,3) A(4,4) A(4,5)
A(4,6)
二产 A(5,1) A(5,2) A(5,3) A(5,4) A(5,5)
A(5,6)
三产 A(6,1) A(6,2) A(6,3) A(6,4) A(6,5)
A(6,6)
2018 一产 A(7,1) A(7,2) A(7,3) A(7,4) A(7,5)
A(7,6)
二产 A(8,1) A(8,2) A(8,3) A(8,4) A(8,5)
A(8,6)
三产 A(9,1) A(9,2) A(9,3) A(9,4) A(9,5)
A(9,6)
2019 一产 A(10,1) A(10,2)
A(10,3) A(10,4) A(10,5)
A(10,6)
二产 A(11,1) A(11,2)
A(11,3) A(11,4) A(11,5)
A(11,6)
三产 A(12,1) A(12,2)
A(12,3) A(12,4) A(12,5)
A(12,6)
一般而言,表现在纸面上的数据表通常是一种二维平面表。因此,如何设计
具有多维特征的数据表并不是一件轻松的事。在表 1-1 中,行是按时间和产业特
征组合来划分,由于时间的对应值的个数为 4,产业对应值个数是 3,因此表 1-
2 中的数据行数为 4×3=12 行;列是按教育程度和性别来划分,由于教育程度对
应值的个数是 3,性别对应值个数是 2,因此表 1-2 中的数据列数为 3×2=6 列。
可见,用表格的形式表现多维特征数据时,一种可借鉴的方法是:将全部数
据辅特征划分为 2 组,即把(1-4)式中的
n
jjj
AAA ,...,,
21
分为两组,其中一组数