首页 / 管理动态 / 国家项目成果简介
    大数据相关关系的因果模型拟合
    2022/11/18 16:23:16    点击量:2756
  • 项目类别:国家社科基金重点项目
    项目名称:大数据相关关系和因果关系研究
    负 责 人:王天恩
    工作单位:上海大学
    批 准 号:17AZX003

       大数据浪潮的冲刷,将相关关系和因果关系问题全面展开,从而在构成对传统因果观巨大冲击的同时,为因果模型的升级提供了历史性条件。国家社科基金重点项目“大数据相关关系与因果关系研究”(批准号17AZX003)在信息层次面对这一越来越重要的问题,基于信息的感受性关系理解,从大数据作为信息数字编码发展的产物出发,展开大数据及其基本特征的哲学刻画和大数据相关关系的因果模型研究。

       大数据相关关系和因果关系问题的信息基础展开

       从传统因果观到基于当代复杂因果模型的探索,因果关系研究经历了一个曲折的发展过程。量子物理学的发展,构成对传统因果观的严峻挑战。这一挑战提供了历史性机遇,推进了因果概念的重新刻画:原因是因素的相互作用过程,结果是因素相互作用的效应及其痕迹。因素未进入相互作用不构成作为相互作用过程的原因;原因的作用和结果的形成实际上是同一过程的两个方面。原因和结果间的联系是必然的,这是事物过程的决定论方面;而因素和结果间的联系则是或然的,这是事物过程的非决定论方面;二者构成事物过程的决定性与非决定性的具体统一。而大数据的发展,则为在信息层次深化因果关系的认识,进一步展开重新刻画的因果概念提供了全新的时代条件。

       大数据相关关系和因果关系的最深层次问题是大数据的信息基础。实际上,正是大数据等信息科技的发展,使信息的感受性关系性质日益开显:信息既不是物质也不是能量,而是基于物能的感受性关系。信息的基本特性主要包括信息的创生性、涌现性、相互性和共享性。信息的感受性关系理解,意味着大数据是信息数字编码发展的产物。作为信息的数字编码,大数据意味着在相关关系和因果关系的关联中,信息具有基础性地位。

       大数据基本特征的哲学理解和刻画

       大数据相关关系和因果关系的关键问题是大数据及其基本特征的哲学层次把握。在哲学层次深化大数据特征的理解,对于大数据概念的哲学把握具有基础意义。从哲学层次看,甚至大数据的“4V”特征排序,都有更强的逻辑关联。而其涵义则更加远不只是技术意义上的大规模(volume)、多样性(variety)、高速率(velocity)和价值低密度(value),而是意味着大数据的规模整全性、实时流动性、结构开放性和价值创生性。

       数据采集方式从抽样到自然生成,使从小数据到大数据的发展意味着数据的“自然化”。数据的自然化具有重要存在论意蕴,大数据的“大”根本上不在数据量大,而在数据的完备性。正是数据的完备性,使大数据具有规模整全性。大数据的规模整全性,在直觉的整体性和概念的整体性之外,为人类认识提供了新的量化的整体性。直觉的整体性基于经验,概念的整体性基于逻辑,而大数据量化的整体性则基于数据。三种整体性意味着三种整体观照,作为整体观照的第三种形式,大数据的规模整全性具有重要量化整体观照价值,不仅为哲学研究提供了新的整体观照方式,而且为因果关系的大数据相关关系整体观照提供了新的时代条件。
    大数据只具有相互关联意义上的结构,作为数据之间的关系,大数据的数据结构具有相对于人的需要及其发展的开放性。由于数据之间不可能直接相互作用,因此所构成的只能是相关关系。大数据相关关系的丰度,与大数据的结构开放性密切相关。
    大数据与样本数据的根本不同,在于取样构成的样本数据是干枯的标本,而自然生成的大数据则是没有失活的具体数据存在,具有与对象世界过程同步的实时流动性。具有实时流动性的大数据意味着维度的充分展开,不仅从单个数据到样本数据,而且从低维大数据到高维大数据,发展出越来越深远的未来向度。

       不同于物能,信息是创生的,这使作为信息数字编码发展产物的大数据相应具有价值创生性。大数据的价值创生性,意味着存在论意义上的无中生有,这为人类创构——创生意义上的创造——提供了一个发展的无限空间。由此可见大数据价值创生性不仅具有重要价值论乃至存在论意蕴,而且将展开因果关系的价值维度。

       大数据相关关系的因果派生

       大数据相关关系和因果关系的核心问题是相关性和因果性之间的关系。大数据的信息性质及其空前凸显的相关关系,促使人们对传统因果概念进行深入的反思。在大数据中,数据化使因果关系量化为变量之间的关系,在丧失特有的必然性和方向性有的时,获得了关系强度和正负性质。由此构成质性描述向量化描述的发展,为相关性和因果性之间关系的理解创造了条件。
    正是基于大数据相关关系,可以进一步展开和深化因果概念的重新刻画:因果关系是对因素相互作用过程与其效应之间内在关联的描述;而相关关系则是对因果派生关系的描述,这是相关关系的因果性根基。相关关系及其与因果关系的关联,正是大数据时代人们关注越来越多的难题。

       作为因果派生关系,相关关系包括三种基本类型:一是因素和结果间相关关系,包括直接因素和直接结果、直接因素和间接结果、间接因素与直接结果、间接因素与间接结果间相关关系。二是结果间相关关系。包括直接结果内部要素、间接结果间相关关系。三是因素间相关关系,包括现实因素间和潜在因素间相关关系。正是潜在因素之间的相关关系,为人类创构活动提供了前所未有的新空间。
    作为未进入相互作用过程凝固为因果关系的因素关系,相关关系提供了由因素创构结果的无限空间,呈现出建立在“为什么”基础上的新的“是什么”,这正是数据物化的因果性根据;数据分析的性质是因素分析,定量分析的根基是因果关系,相关分析的依据是因果派生,这则是大数据分析的因果基础。大数据因果关系基础的廓清,晓示了其深层哲学内涵。因素关系的未来空间凸显创构认识论,因果派生关系的全数据定量分析凸显量的整体把握,而因果模型从描述到创构的发展则凸显哲学以满足人的需要为最终目的。

       从描述的因果模型到创构的因果模型

       随着人类认识的深化和实践活动层次的提升,人类因果观念经历了两次重要转换,形成了三种基本的因果观:实在论因果观、描述论因果观和模型论因果观。从实在论因果观到描述论因果观,肇因于从经典物理学到量子力学的发展;从描述论因果观到模型论因果观,则源自信息科技特别是大数据的发展。[在三种因果观念中,相互之间的认识递进关系显而易见。]实在论因果观是关于对象确定性联系的把握;描述论的因果观是将实在论因果观抽象为描述的产物;而模型论因果观则是描述论因果观发展到完全抽离具体经验条件而量化的结果,由此可以在信息层次大大拓展因果关系的理解。

       大数据相关关系具有深层因果模型意蕴,它蕴含着因果时态的维度。大数据维度提升开出的未来向度,展开了因果时态研究的空间。在因果关系研究中,大数据的实时流动性意味着因果模型的时态向度。从过去时推展到将来时,意味着追溯既往的因果关系量化把握和探向未来的新因果关系创构。在此基础上,不仅因果关系和相关关系及二者间相互关系可以达到一个更高层次的把握,而且物理因果性和心理因果性的关系可以有一个更深层次的理解,对上向因果性和下向因果性及其关联机制也可以有一个整体的透视。深入到更基本的信息层次,可以典型地看到信息更到位地理解所带来的基本范式转换。

       正是从物能范式到信息范式的更深层次理解,涉及复杂因果模型的信息层面,特别是创构的因果模型及其双向循环机制。与描述的因果模型不同,创构的因果模型根植于人的需要深处的主观能动性。在描述的因果模型基础上,系统探索创构的因果模型自然而然导向双向循环因果机制的进一步研究。这是大数据相关关系基础上因果模型研究进一步的课题,可望就此在人工智能研究领域走向通用智能核心机制圣杯。
     
  • 来源:    编辑人:
    相关导读: