编者按:

中央领导曾专门指出,“科技创新、科学普及是实现创新发展的两翼,要把科学普及放在与科技创新同等重要的位置”。模型、算法,已成大众热词,但对非数学或计算机专业人员,尤其是文科出生的领导干部来说,难解其真意。另一方面,专业知识不能永远只是阳春白雪,也需祛魅。“粤有数”数字化治理专家委员会专门约请有20多年数学建模经验的业界知名专家李伟老师,用全网最通俗、最有张力的方式,为大家讲解模型。关注“粤有数”,你再也不用“本领恐慌”!

       借我借我一双慧眼吧,让我把这纷扰看得清清楚楚明明白白真真切切。一首歌这样唱道。可惜,我们没有上帝视角,无法事无巨细观察这个和认识这个世界,大道至简,作为常人,我们就简化来看看这个世界的结构并研究其演化规则。在这个过程中,将研究对象模型化是一种非常重要的手段和方法。我们就一起来走进模型的世界。

一、模型与数学模型

1.1丰富多彩的模型

模型并不复杂,我们小时候玩的航模、船模,听过的飞机风洞试验,在天文尺度上,把地球当成一个质点来看待,量子当成波粒二象性对象,引力、磁力作用使用场来描述,这些都属于物理模型。我们分析问题时,常常画图,先把重要的人和对象记下,然后把TA们的关系通过线连接起来。在做古典概率的学生房间分配、邮件投递、电子呆在不同的量子化能级上,常常使用小球装入盒子中的模式转换分析,这些属于心智模型。事实上,模型并不复杂,我们在工作、学习和生活中有意无意地一直在使用。本文讲的是另外一种非常重要的模式——数学模型。

1.2数学模型及分类

数学模型,就是简化同构复杂对象系统后,形成一套易于理解的数学符号系统。能运算模型来描述对象系统演化过程。

▼表格 1 对象系统与数学模型对应关系

        模型主要用于对象系统(社会、生物、物理)的结构描述。还可以进行预测、预警。对于复杂对象系统,通过一个简化的模型我们可以简化分析对象,并对其发展趋势进行预测,还可以得到一定的阈值从而根据预测或实际收集数据进行预警。

        数学模型展示方式一般为方程或者方程组,也可以是一些逻辑运算公式,或者是集合运算公式,或者是它们的组合应用。模型能预测对象系统的运动情况。属于应用数学中的一个重要分支。

        按照不同的标准,常见数学模型有如下分类。

1.3建模方法

建模有两种路径,一是根据先验知识进行建模,主要是根据常识或者相应理论进行建模,如微分方程、马尔可夫过程建模等。二是从数据中发现存在的知识。对于前者,判断结构是否合理、选择的因素是否恰当,尤其要估计参数,有些模型是简单的,可以得到解析解,但是对于一些复杂问题就必须用算法来计算结果估计参数了。对于后者,利用数值法来求解结果(如插值和仿真),用机器学习和统计方法来探索结构和估计参数。

无论是建模还是用算法训练模型都需要经过长期训练,必须非常熟悉业务,这是一个容易被忽略,但是又极其重要的要求。再加上有相当数学基础的专业人员,才能较好完成建模工作。

模型 ≠ 算法

因为经常是模型算法一起说的,有人以为二者是相同的,其实不然。算法是一个有限步骤内解决问题和方法集合。是求解模型的工具。

在众多的应用领域中,人口领域应用模型很多,非常具有代表性,因此,我们下面就以这个领域来介绍数学模型。由浅入深,不是很难。

二、严峻的人口问题及人口模型

2.1当前人口面临的问题,印度人口数量将超中国

我们能感到人口的影响,如号召大家生三胎,印度人口数量将超中国等。按照《世界人口展望2022》中方案对中国人口的预测,2022年7月1日中国总人口已经进入负增长。印度将在明年超过中国,成为世界上人口最多的国家。据世界人口网报道,我国面临以下重大人口问题:

面对这些严峻问题,该怎样应对,数学模型在政策建议和政策仿真中具有很重要的支持作用。

2.2人口模型类别

人口模型属于特定应用领域的模型。一是传统人口学,把人口作为一个整体,以群体为单位进行的宏观测算。二是家庭人口学,以家庭为基本单位,除可以测算传统人口学所有的信息外,还可以测算人口的家庭结构、代际结构,作为中观模型对待。三是微观仿真方法,把人作为一个主体,以个体为单位,模拟其可能出现的社会行为,然后汇总得到人口的总体信息。其中,第二、三两种方法是20世纪80年代以来新兴的分析方法,可以更好地分析、把握人口及其经济社会行为,如可计算“4-2-1”家庭数量及比例、独生子女、二胎、三胎数量等,正日益成为政策分析的有力工具。

随着研究问题的深入,我们还希望了解人口与社会、资源、经济、环境等其他领域的强相关、互作用关系。这扩大了我们的视野,并能从总体视角去动态、联动地看待人口问题,做到问题的综合平衡。这可以作为第四类人口问题,可以称为人口VS自然——社会系统宏观模型。

对以上四种类型模型分别做一定的介绍,尽量多举例,而且涉及不同的建模方法,如宏观、微观模型,微分方程、蒙特卡洛仿真、Markov模型等。让大家能尽量多地了解一些模型。挑选的模型都是非常经典的,看了这篇文章,对人口学和其对应的模型也就有了全面的了解。

介绍模型的时候,正文只出现少量公式,其他的都讲原理,对于还想了解更多的童鞋,在后文的附件中对多数不是太复杂的模型都有公式,可供参考,当然,不看这些公式完全不影响我们的介绍。

三、宏观群体数人口模型

模型预测的内容相对少一些,主要是人口的数量和结构。

3.1人口平衡模型

如果让你来预测t年后人口数量,相信我们都能凭借常识和给一个方程:

Pt – P0 = B – D  ⋯ ①

Pt :期末人口数  P0:期初人口数  B:为期内出生人口  D:期内死亡人口数。好,①式就是一个简单的人口模型,不复杂吧,一想,自己建立过许多模型的,是不是有成就感。我们继续往下走。

上式中,我们考虑的是一个封闭空间,如一个市、一个省,但是人口是迁移的,因此,把这个因素考虑进来,就得到人口平衡方程:

P= P0 + (B – D) + (I – E)  ⋯ ②

I:期内迁入人口数。E:期内迁出人口数 

人口平衡方程反映某一时期人口数量及其自然变动与机械变动影响因素相互关系的基本方程。人口平衡方式的涵义是某一时期内,总人口数的变化等于人口的自然增长与迁移增长之和。是计算人口数量的一个基础方程。看来专业的比我们业余的还是考虑要周到一些。

3.2莱斯利(Leslie)矩阵

       人口平衡模型中,对不同的人没有分类。事实上,不同年龄的人死亡率是不一样的,人类出生数量是和女性更直接相关的,而且一般认为15~49岁女性为育龄妇女,这样的人员多,出生率才高。还有,随着时间的推进,今年14(49)岁的女性,明年15(50)岁后,就有(失去)生产能力了。每一年不同年龄层的人口结构是变动的,因此考虑到这些因素,就得到了著名的莱斯利模型。这个模型最先是科学家研究海龟种群统计学的内容【见 附件 1 莱斯利矩阵】。用于人口数量预测中,也取得了很好的效果。如果把每一年的不同年龄段人员按照性别分别统计,使用莱斯利矩阵进行测算,可以得到人口金字塔,用于表现某时间点上的年龄直方图,能反映一地区人口男女比例与年龄构成。这种表示方式显示了年龄和性别资料,为一种可直接且清晰知晓人口组成的图表,可以提供下列资讯:人力资源、人口老化程度、抚养比、生育年龄人口、未来的出生率和死亡率、未来人口总数等。是各类涉及人口之发展或规划的基础。

▲图 1 中印越2016年人口金字塔

        通过软件运行,可以动态表现每一年人口金字塔的变动情况。

3.3微分方程人口模型

3.3.1马尔萨斯模型

马尔萨斯模型 (1798) 有一个基本假设 : 人口(相对)增长率 r 是常数。可以这样理解,出生率和死亡率在一个社会稳定时期,医疗水平没有大的突破时,基本是稳定的,出生率 – 死亡率 = 净增长率r 也就是一个常数。这个结论事实上在生物增长、科学技术发展、经济增长等相当多的领域都是成立的。下面我们一起来建模。

从t0→ t 时刻,人口由x0→ x,人口的变化量Δx ,对应的时间变化量为Δt,Δx = r·x0·Δt ,变形后得到   Δx/Δt = r·x0  ,当Δt非常小时,x0 ≈  x 。Δt→0 时,x=  x,于是,可以建立微分方程如下

x(t) :时刻t的人口

        这是一个简单的可分离变量的微分方程,求解后得到一个指数增长模型

以上模型在短期内是成立的,然而,任何事情都有外部约束条件,如环境压力、食物匮乏等。增长一定是有极限的,于是出现了下面的Logistic模型。

3.3.2阻滞增长模型

     连续形式的阻滞增长模型也叫做 Logistic 模型,是对马尔萨斯模型的改进,该模型环境对人口数量有限制作用,一定环境所容纳的人口数量是一定的,人口不会无限制地增加,而是最终趋近某个常数。呈现为一个S型图样。【公式见 附录 2 阻滞增长模型】这也是增长的基本模式之一,叫“寻的” 模式。

3.3.3微分方程模型改进

把人口数作为整体研究,没有体现出年龄结构、性别结构等, 无法对“老龄化”、“上学难”、“看病难”等问题提供参考意见。

可能的改进方向:参考人口统计数据, 建立新的模型,建立按年龄分组的人口模型。考虑了年龄分布对于人口预测的重要性,年龄分布及死亡率、出生率对人口的影响;又得到了新的模型。所以,通过对基础模型进行一定的修改和优化,又能得到更切合实际的模型,这是建模常用的方法。

四、中观家庭人口模型

多维的家庭人口预测模型。可同时预测家庭户以及人口的规模、结构、特征及分布,并保证人口事件(如结婚、离婚、再婚子女离家等)的发生一致性,包括男性与女性之间的一致性,父母辈与子女辈之间的一致性。只需通常的生育、死亡、婚姻等人口数据来计算。可同时预测核心与三代家庭户,既可用于中国等发展中国家,又可用于西方发达国家。这是一个得到联合国认可的模型。北大的曾毅教授有重要贡献。也是一个比较成熟的模型。过程比较复杂,就简单地说一下其计算策略的实现逻辑。 

4.1人群的状态及组合

对家庭人口的状态和取值先做一个定义。

▼表 2  家庭人口预测模型中个体状态辨识定义

        家庭人口预测模型对某一年份(t)的每一个个体都考虑了表 2 家庭人口预测模型中个体状态辨识定义中的所有8个状态。某一年份相同年龄、与相同性别的不同个体的 m、k、p、c、t、r 状态组合是不同的。记状态组合为 i。如果考虑2种居住地类型r(城、乡)、5种婚姻状态m、4种是否与父母一起居住状态k、曾生孩次数p与一起居住孩子数c最大值为5,那么,某一年相同年龄相同性别的人群的组合状态的理论可能总数是: 

下面就需要使用这个组合状态来计算了。

4.2通过状态转移测算

t 年年龄为x,性别为s,组合状态为i 的人数,到t + 1 年后,年龄为x+1,性别为s认为不变,但是组合状态绝对会有变化 (居住地类型r(城、乡)、5种婚姻状态m、4种是否与父母一起居住状态k、曾生孩次数p)。

t年的组合状态i到t+1年的组合状态 j 转移的概率pij是T×T 状态转移概率矩阵的元素。如前所述案例中T=1680,也就是说状态转移概率矩阵中共有 2 822 400 ( = 1680 × 1680 ) 个元素 。而且对于不同性别每一个年龄不同年份都必须估算一个如此巨大的状态转移概率矩阵,这是一个庞大的工程,因此在实际计算中用了一些策略简化计算。

状态转移概率是著名的Markov(马尔可夫)过程中的一个重要因素,他们构成一个一步转移矩阵【见 附件 3 Markov链中的一步转移矩阵】对于离散型对象动态分析其状态和行为有极其重要的意义和应用场景。

多维家庭人口预测模型应用于学术研究与政策性分析在实际工作中都取得了不错的成绩。联合国也推荐了这个模型。

五、微观个人仿真模型

微观仿真模型是人口模型中非常重要的一种新方法,这种方法得到的结果非常精细,还很灵活,可以方便地构造许多感兴趣的指标。受到越来越多人的重视。同时,我们在计量经济模型、运输模型、排队论模型中都大量使用仿真方法,在算法上,如MCMC方法中也都需要进行Monte Carlo (蒙特卡洛)仿真。因此,对这个方法进行一个比较详细介绍。笔者也是花了很长时间才悟明白这个方法的一些道理,今天和盘托出,所以,如果你已经读到这里了,绝对划算得很。

人口调查的属性很多,包括性别、收入、职业、年龄、居住地点等社会和生物属性,不利用起来太可惜。想预测n年后以上属性的数据已经利用这些数据来预测学校的数量、分布,铁路规划等,就需要利用蒙特卡洛仿真来得到这些结果了。

5.1Monte Carlo 仿真

     蒙特卡洛是摩洛哥著名的赌城,这种以他的名字命名的方法,我们通过一个简单的图来说明。

▲图 2 内含圆形的正方形

在图 2 内含圆形的正方形中,正方形边长为4,圆的半径为1。Monte Carlo 仿真就是在这个区域中投点,你可以投飞镖,也可以让计算机模拟投点,只是有要求投的点等可能地出现在方形的任何地方内!根据这个方法,仿真有两个应用方式。

第一种方式:如果投的点足够多(图中蓝色点),我们计算圆内的点 nc,还有总的投的点数量nT,圆的面积可以估计为 Sc = (nc /nT)Ss = 16(nc /nT) ,Ss为方形面积。当然,圆的面积可以由公式 S = πR² 计算,但是当图中圆是没有公式可以计算的异形图像时,用这个方法就可以得到面积了。

第二种方式:如果只投入了一个点(图中橙色点),而它恰巧在圆中,那我们可以知道它这次在圆中的概率为:p = Sc / Ss = π12/42 ≈ 19.63%。由于投点只能在整个方形中,所以,其概率为1。方形分为两个部分,一个是圆形,一个是方形除去圆后剩余部分。我们可以把投点在方形中的位置(一个平面坐标)与一个随机变量X之间建立起一一对应的关系(实数与平面、空间之间是能建立一一对应关系的)。0<x≤1。可以人为建立起表 2 投点和随机变量得关系中的关系。

▼表 3 投点和随机变量的关系

我们在后面进行Monte Carlo 仿真的时候,用的就是第二种方式。

5.2人口调查表的变形

     我国人口调查表有18个项目,真实的下表包括全国14亿人,经过简单的描述性统计方法,可以得到性别比、迁移情况、出生率、死亡率、民族结构、总和生育率等多个指标,是非常精细的,而且可以按照自己的要求得到多种指标。

▼表 4 一张模拟的原始人口调查表

     上表是2022年的统计数据,要是能预测出2027年5年后的一张相同的表,那就可以得到许多指标了。这个大胆的想法有戏,经过对表 4 一张模拟的原始人口调查表进行小小的修改,为保护隐私,同时,将相同年龄、相同性别的人假定其生死、迁移等概率都是一样的,于是,去掉个人标识信息,隐藏姓名和身份证号,统一从0号开始从新编辑,得到表 5 修改后的人口调查表就可以仿真至2027年。2022年 ➫ 2027年。

▼表 5 修改后的人口调查表

微观模拟模型对家庭人口个体特征分类比较精细,作为预测起点的样本人口规模与抽样比必须足够大!这样才能具有较好的代表性。我国人口的1%样本是1400多万。

按微观模拟方法对数百万成千万个体一个一个地分别就其生育、死亡、婚姻、迁移、离家等各种人口事件做精细的仿真模拟,将用去大量的算力,好在现在算法的优化和硬件的降价部分解决了这个问题。

对表 5 修改后的人口调查表实现1%等距抽样,抽取编号为0,100,200,300,…的成员,得到一个新的2022年普查数据表,规模仅为原表的1%,有1400万条记录的新表。

5.3仿真进行的原理

     以“死亡”这个属性进行仿真示例。应用的方法为 5.1 节中Monte Carlo仿真的第二种方式,即从一次仿真结果中推断其属于那个类别。表 6 生命表部分内容为生命表中截取的部分数据。

▼表 6 生命表部分内容

选择第 0 号(原始普查表编号)人员,18岁

用一个服从 U(0,1) 均匀分布的随机数进行仿真

使用程序给出一个随机数 X,18岁的青年死亡概率 p(18)=0.000981

如果 X ≤  p(18) ,则认为此人在下一年中会死去(与真实的人无关)

如果 X > p(18) ,则认为此人在下一年中任然活着。

再选择第100号(原始普查表编号)人员,?岁

重复以上过程直到结束。

1400多万人,在个人18个属性中,属性值可以改变的那几个属性(如生育等)逐年仿真, 可以得到5年后的一张填满了单元格的抽样表。

在仿真出5年后的含1400多万人的抽样表中获得详细信息。可以通过简单的统计得到需要的一些指标。这些指标是抽样的1400万人的结果,如果需要还原到14亿人的结果,给一个区间估计,可以通过t 分布来实现。

如果还有额外需求,如跨省的人员流动情况等,可以增加一些方法,如转移矩阵来实现等。

六、人口VS自然——社会系统宏观模型

这里涉及的模型都是大型模型,非常复杂,只是做一个非常简单的介绍。这些模型建立起来后,可以作为政策仿真的一个重要工具。输入政策变量,如汽油价格提高0.6元/L后,4年之后,碳排放量会降低多少等。

为制定和实施国民经济和社会发展规划提供质量较高的人口基础数据,并根据这些数据信息进行分析、预测和决策,指导人口宏观战略。

6.1CGE模型

6.1.1基本介绍

CGE 模型(Computable General Equilibrium),全称可计算的一般均衡模型,起源于西方经济学中的瓦尔拉斯一般均衡理论,是由抽象的瓦尔拉斯一般均衡理论衍变而成的关于实际经济的数学模型。CGE 模型通常是对一个经济体进行数学上的模拟,从而反映这个经济体是如何通过对商品和要素的数量和价格的调整,实现瓦尔拉斯一般均衡理论所描述的供需平衡。

一般均衡理论是经济学理论的核心,被认为是经济学的主要成就之一。它的思想来源是亚当·斯密著名的“看不见的手”的论断:在一个分散决策的经济中,追求个人最优的行为会在价格调节下实现社会最优的资源配置,或者追求个人最优的行为人的决策通过价格机制达到相互间的均衡。瓦尔拉斯在 1874年发表的《纯粹经济学要义》中正式把这样的一般均衡思想用一组方程式表达出来。然而,他所表达的结论是定性的。此后许多经济学家试图用能表示现实经济的具体方程来代替抽象的函数。最为成功的是列昂惕夫的投入产出模型,反映了部门间的关联以及产品价格与要素价格间的联系,对后来 CGE 模型的发展产生了极大的影响。

一般均衡理论把整个经济系统作为分析对象。它着眼于经济系统内的所有市场、所有价格,以及各种商品和要素的供需关系,要求所有的市场都结清。在一般均衡模型中,还存在着一些外生给定的变量。外生变量变化引起的经济系统的任何一部分的结构变化都会波及整个系统,导致商品和要素价格、数量的普遍变动,使得经济系统从一个均衡状态向另一个均衡状态过渡。对抽象的一般均衡模型给出具体的数字设定,从而判断外生变量变化会导致内生变量如何变化的模型,就是所谓的 CGE 模型。

CGE 模型是多部门模型家族中的一个分支。它是投入产出模型和线性规划模型的结合与完善。CGE 模型通过引入经济主体的优化行为,刻画了生产之间的替代关系和需求之间的转换关系,用非线性函数取代了传统的投入产出模型中的许多线性函数。并且引入了通过价格激励发挥作用的市场机制和政策工具,从而将生产、需求、国际贸易和价格有机地结合在一起,以刻画在混合经济条件下,不同产业、不同消费者对由一定政策冲击所引致的相对价格变动的反应。

6.1.1方程具有的模块

      通常,CGE模型主要包括三组方程,分别表示供给、需求和均衡关系,形成相应的三个模块,根据研究问题的不同,可以引入更多的主体和研究对象,有更多的模块。这也正体现了CGE模型处理问题的灵活性。方程数量根据设定的不同,从30多个到70多个的都有,具有比较好的扩张性。

▼表 7 具有6个模块的CGE模型

6.1.3模型原理

6.1.4模型的用处

在国外,CGE模型广泛应用于贸易政策、财政政策和收入分配、环境政策、经济改革、技术,国际商品价格、汇率和利率、工资调整和工会行为、区域发展、粮食政策等领域。

近年来,全球气候变暖、臭氧层破坏、大气污染、水土流失、生物多样性减少等环境问题日益突出,在这种背景下,旨在于减少污染、改善环境的各种国际合作与协定就应运而生,各国都在寻求一种既能保持经济增长的同时,又能有效削减污染排放的经济控制政策。环境 CGE 模型就是在这种背景下逐渐成为研究的热点。

近年来的研究更多地将CGE模型应用于各种政策效应的分析之中。而将和人口紧密相关的一些方程有机地结合进传统的CGE模型中,就形成人口CGE模型。对于仿真人口政策效应有很大帮助。

6.2系统动力学模型

6.2.1 系统动力学简介

系统动力学(syster dynamics, SD)是系统科学理论与计算机仿真紧密结合、研究系统反馈结构与行为的一门科学,是系统科学与管理科学的一个重要分支。

系统动力学认为,系统的行为模式与特性主要取决于其内部的结构。反馈是指 X影响Y,反过来Y通过一系列的因果链来影响X;我们不能通过孤立分析X与Y或Y与X的联系来分析系统的行为【公式见 附件 3 带反馈的方程组】,只有把整个系统作为一个反馈系统才能得出正确的结论。这种反馈分为正反馈和负反馈两种。马太效应就是正反馈的一个例子。一片区域假如只有草和吃草的羊。草越多,羊也越多,但是羊吃的草也越多,二者互相限制。这就是一个负反馈。

由于非线性因素的作用,高阶次复杂时变系统往往表现出反直观的、千姿百态的动态特性。系统动力学模型可作为实际系统,特别是社会、经济、生态复杂大系统的“实验室”。系统动力学研究处理复杂系统问题的方法是定性与定量结合、系统综合推理的方法,其建模过程就是一个学习、调查、研究的过程。模型的主要功用在于向人们提供一个进行学习与政策分析的工具,并使决策群体或整个组织逐步成为学习型组织。

目前在人口领域使用比较成熟的是T21模型。由于系统动力学模型涉及的背景知识非常多,因此本文只做最简单的介绍。

6.2.2 T21模型

T21模型特色

对于综合性与整合性的计划,T21 的特色可满足使用者的需求:

1.以系统方法整合经济、环境与社会要素。

2.模拟政策与策略的可能冲击,告知发展策略与政策。

3.透过训练过程与训练伙伴,建立与转移能力,该能力可建立局部且进行中的发展分析与计划程序,便于理解与使用。

4.不同国家的利害关系者与伙伴可透过一般架构、图解及便于了解的介面与方程式。

5.透过模组化设计,可增加、移除或修改各组成部分,以满足别国的个性化需求,具有弹性、可量身订做。

6. 政策文任应包含国家预算、国家发展计画、国家辅助战略(CAS)、减少贫穷战略报告(PRSP)、联合国发展辅助架构,因而可将政策以档案的形式呈现。

T21模型设计与内容

各个国家可订制自己的 T21 模型,虽然T21 可应用于许多不同国家的发展状况,但是仍有一些一般化的共同议题、目标、发展策略与政策。

T21模型包含社会、经济、环境因子,三者之间相互联系。

▲图 3 T21模型组成因子

T21 的核心模型可作为订制的基础,其包含了一些共同特质:

1. 经济面 (农业、工业与服务),以 Cobb- Douglas 生产函数为基础,资源(包括土地)、劳力、资本和技术为投入面,可利用一般均衡模型(QE)透过生产面产生相关价格与投资分配。

2.人口变动要素组成模型包含生育率和生命表的人口统计。

3. 所得分配与就业,其计算程序可用于不同的所得阶层(四分法、五分法)。

4. 环境和自然资源,在模型中其计算程序具有反馈功能,并影响其他因子。

组成的模型集群以闭环的方式形成的系统动力学模型进行预测。

七、模型的应用及局限

7.1模型主要作用

用于对象系统(社会、生物、物理)的结构描述、预测、预警。

对于复杂对象系统,通过一个简化的模型我们可以简化分析对象,并对其发展趋势进行预测,还可以得到一定的阈值从而根据预测或实际收集数据进行预警。

联合国。人口发展模型、关于人口、资源、环境、社会、经济的T21模型(属于系统动力学)等,也提供免费下载。

美国政府。决策和经济预测等都有大量模型。如美国能源信息署(EIA)的能源信息产品中对需求、供应、价格、市场的预测和预警都用到大量模型,而且在其官网上免费下载,这些模型非常详细,历次修改的都有记录。军方有大量SD模型

大型跨国企业。在管理上早就利用整数规划、库存模型等优化差旅路线、人员和库存量控制,从发达国家政府、重要国际组织和企业来看,他们对模型的应用都处于比较成熟的阶段,应用面广,深入到社会生活和工作的方方面面。而且新的方法不断出现在应用其中。

我国政府。在服务和管理方法上定性多定量少,为适应管理精细化,决策科学化,实现社会风险关口前移而进行的预测、预警工作需要,现在也开始重视模型的利用。

卫健委开始利用大量各种人口和社会经济模型来对人口的数量\结构\素质\人口、资源、环境、社会、经济强相关互作用关系进行分析。

7.2人口模型的主要作用

7.2.1生育政策辅助决策分析

在把握人口现状的基础上,通过分析与预测不同生育政策条件下,未来人口死亡、出生、迁移态势的基础上,预测未来人口数量、结构与发展变化趋势及对粮食、淡水资源的需求水平。

7.2.2经济与劳动力供需辅助决策分析

基于人口与经济社会之间的内在关系,采用系统动力学、投入-产出模型、计量经济模型等技术分析路线,对整合好的人口宏观统计数据进行综合分析和深入挖掘,形成人口就业政策和流动政策等方面的辅助决策信息,提高人口与经济社会发展综合决策的科学性。

(1)劳动力供需预测

在经济增长的大框架下,预测未来中长期的劳动力供需和失业率,进而通过不同的政策模拟找出缓解我国未来劳动力就业压力的有效途径。主要输出结果包括:未来中长期劳动力供需总量;分三次产业和六大行业的劳动力需求量;城市劳动力供需总量、失业人数和失业率;农村剩余劳动力转移数量。政策模拟部分主要输出在不同的人口政策、产业政策、宏观经济增长方式下,未来中长期的城市劳动就业压力和农村剩余劳动力转移的数量。

(2)经济总量预测

有效地分析人口政策、经济增长方式、产业政策、财政政策、对外贸易政策等要素对劳动力就业的影响,从而使决策分析可以从多个角度进行,以便最终筛选出最合适的政策方案。

7.3模型的局限

模型是对现实的简化,因此其结构有不完善的地方。还有采集数据的偏差等会造成计算的参数出错,这些都会造成模型有效性的降低。

模型是对一定时期对象系统的描述,如果对象系统发生了变化,如信息革命改变了工作社会的基础,二者的社会结构完全不一样了。这时如果用工业社会的模型来套在信息社会中,肯定是不合适的。

建模时,如果有经过验证的某个领域成功理论(如人口理论)或者明显的常识为基础,把握性就比较高。但是对于一些比较普遍方法来建模的,比如系统动力学建模,由于缺乏对一个专业领域(如人口)的认知和研究,得出的结论有时会很夸张。该模型中一个反馈环出现错误,甚至会得出非常可笑的结论。

数学模型虽然绝大多数都是定量的(有极少部分定性的),但是准确性并不是完全可以信赖的。对于大型模型,哪怕其结构(方程形式,运算关系)正确,但是参数实在太多,输入的数据也太多(如CGE模型输入变量有1500多个),那一个环节出现问题都是一个影响很大的事情。在功能性和健壮性中很难进行统一。精细不等于正确,这在微观仿真模型中就得到了很好的体现。

数学建模高度依赖模型专家的水平,同时要求模型专家还必须是业务专家,或者需要业务专家的加入。否则,很容易出错。

7.4解决问题的关键

模型是一个辅助工具,不能过度神话,解决社会问题的关键还是分析问题原因、提出对应的解决措施。如对于目前陷入“超低生育率”陷阱,与收入、抚养成本、就业环境、教育内卷等都有直接联系。还有比如出生性别比失衡,这些问题可不是模型能解决的。

无论如何,管理的精细化、决策的科学化都需要模型的参与,是一个趋势,因此,希望看到平时的工作和生活中有更多模型的身影,我们每个人也需要有这方面的一个基本素养。

附件

▼附件 1 莱斯利矩阵

若表示第个阶段持续的事件,为该阶段每年的存活率,那么在第阶段中,下一年仍然存活的比例将为

 

而下一年转移到第个阶段时,可以存活的比例为

 

若令标识阶段1年中平均的产卵量,并构造矩阵

假设初始时种群各个阶段的数量为

则 n 年后种群的数量为

▼附件 2 阻滞增长模型

连续形式的阻滞增长模型 (Logistic模型)。

t→∞ , x→N, N是环境资源能容纳的最大人口数。

▼附件 3 Markov链中的一步转移矩阵

假定根据历史数据,10000位18岁的少女,她住的地方只有两种,城镇和乡农村。居住在城镇的有4000人,居住在乡村的有6000人。又据调查,居住在城镇的的4000人中,下一年有95%的人将继续在城镇,5%的人将前往乡村;居住在农村的6000人中,下一年有45%的人将前往城镇,55%的人将继续居住在乡村

上表中的4个概率就称为状态的转移概率,而这四个转移概率组成的矩阵

就叫一步转移概率矩阵,一步转移概率矩阵的一个特点是其各行元素之和为1。这个矩阵非常有用,人类在计算连续变化时,虽然一步转移概率矩阵非常粗糙,但是却是一个非常有用的工具。关于这个矩阵的研究相关内容太多,在此不做展开。你在使用搜索引擎的时候,都会用到Markov 链和其中的一步转移概率矩阵。

▼附件 4 带反馈的方程组

状态演化方程,x(t)是状态空间RN中的系统状态向量;u(t)是控制输入向量,是输入空间Rr中的向量;w(t)是N维扰动向量,可以是随机的,也可以是确定性的,也可以不存在;f是向量状态演化映射。第二个方程是量测方程,y(t)是输出向量,是输出空间Rm中的向量;v(t)是m维量测误差向量,可以是随机的,也可以是确定性的,也可以不存在;h是向量输出映射。

(本文作者为欧亚系统科学研究会会员、民政部低收入家庭认定指导中心大数据专家、中国商业统计学会理事,曾任亚信科技公司数据科学家、人民网舆情数据中心数学建模专家。)

参考文献

[1]腾讯网.联合国最新预测2022年中国人口负增长[EB/OL](2022-7-14)[2022-11-4] https://new.qq.com/rain/a/20220714A09RYR00

[2]搜狐网.2022世界人口展望报告(附文件)[EB/OL](2022-7-12)[2022-11-4] https://www.sohu.com/a/566802180_121146140

[3]世界人口网.中国面临十大“人口问题”[EB/OL](2015-10-29)[2022-11-4] https://www.renkou.org.cn/problem/2015/4003.html

[4]搜狐网.数据观市(780):中印越人口金字塔[EB/OL](2019-2-14)[2022-11-4] https://www.sohu.com/a/294717405_313170

[5]曾毅,金沃泊,王正联.多维家庭人口预测模型的建立及应用[J].中国人口科学,1998(05):2-18.

       【粤有数专栏作者:李伟】       

       【粤有数编辑:淑鑫】

       【粤有数审核:嘉盈】