<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD Journal Publishing DTD v2.3 20070202//EN" "journalpublishing.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" article-type="research-article">
<front>
<journal-meta>
<journal-id journal-id-type="publisher-id">Front. Robot. AI</journal-id>
<journal-title>Frontiers in Robotics and AI</journal-title>
<abbrev-journal-title abbrev-type="pubmed">Front. Robot. AI</abbrev-journal-title>
<issn pub-type="epub">2296-9144</issn>
<publisher>
<publisher-name>Frontiers Media S.A.</publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id pub-id-type="doi">10.3389/frobt.2016.00071</article-id>
<article-categories>
<subj-group subj-group-type="heading">
<subject>Robotics and AI</subject>
<subj-group>
<subject>Original Research</subject>
</subj-group>
</subj-group>
</article-categories>
<title-group>
<article-title>An Information Criterion for Inferring Coupling of Distributed Dynamical Systems</article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author" corresp="yes">
<name><surname>Cliff</surname> <given-names>Oliver M.</given-names></name>
<xref ref-type="aff" rid="aff1"><sup>1</sup></xref>
<xref ref-type="corresp" rid="cor1">&#x0002A;</xref>
<uri xlink:href="http://frontiersin.org/people/u/369375"/>
</contrib>
<contrib contrib-type="author">
<name><surname>Prokopenko</surname> <given-names>Mikhail</given-names></name>
<xref ref-type="aff" rid="aff2"><sup>2</sup></xref>
<uri xlink:href="http://frontiersin.org/people/u/132401"/>
</contrib>
<contrib contrib-type="author">
<name><surname>Fitch</surname> <given-names>Robert</given-names></name>
<xref ref-type="aff" rid="aff1"><sup>1</sup></xref>
<xref ref-type="aff" rid="aff3"><sup>3</sup></xref>
<uri xlink:href="http://frontiersin.org/people/u/289893"/>
</contrib>
</contrib-group>
<aff id="aff1"><sup>1</sup><institution>Australian Centre for Field Robotics, The University of Sydney</institution>, <addr-line>Sydney, NSW</addr-line>, <country>Australia</country></aff>
<aff id="aff2"><sup>2</sup><institution>Complex Systems Research Group, The University of Sydney</institution>, <addr-line>Sydney, NSW</addr-line>, <country>Australia</country></aff>
<aff id="aff3"><sup>3</sup><institution>Centre for Autonomous Systems, University of Technology Sydney</institution>, <addr-line>Sydney, NSW</addr-line>, <country>Australia</country></aff>
<author-notes>
<fn fn-type="edited-by"><p>Edited by: Michael Wibral, Goethe University Frankfurt, Germany</p></fn>
<fn fn-type="edited-by"><p>Reviewed by: Robin A. A. Ince, University of Manchester, UK; Raul Vicente, Max Planck Society, Germany</p></fn>
<corresp content-type="corresp" id="cor1">&#x0002A;Correspondence: Oliver M. Cliff, <email>o.cliff&#x00040;acfr.usyd.edu.au</email></corresp>
<fn fn-type="other" id="fn001"><p>Specialty section: This article was submitted to Computational Intelligence, a section of the journal Frontiers in Robotics and AI</p></fn>
</author-notes>
<pub-date pub-type="epub">
<day>28</day>
<month>11</month>
<year>2016</year>
</pub-date>
<pub-date pub-type="collection">
<year>2016</year>
</pub-date>
<volume>3</volume>
<elocation-id>71</elocation-id>
<history>
<date date-type="received">
<day>19</day>
<month>08</month>
<year>2016</year>
</date>
<date date-type="accepted">
<day>31</day>
<month>10</month>
<year>2016</year>
</date>
</history>
<permissions>
<copyright-statement>Copyright &#x000A9; 2016 Cliff, Prokopenko and Fitch.</copyright-statement>
<copyright-year>2016</copyright-year>
<copyright-holder>Cliff, Prokopenko and Fitch</copyright-holder>
<license xlink:href="http://creativecommons.org/licenses/by/4.0/"><p>This is an open-access article distributed under the terms of the Creative Commons Attribution License (CC BY). The use, distribution or reproduction in other forums is permitted, provided the original author(s) or licensor are credited and that the original publication in this journal is cited, in accordance with accepted academic practice. No use, distribution or reproduction is permitted which does not comply with these terms.</p></license>
</permissions>
<abstract>
<p>The behavior of many real-world phenomena can be modeled by non-linear dynamical systems whereby a latent system state is observed through a filter. We are interested in interacting subsystems of this form, which we model by a set of coupled maps as a synchronous update graph dynamical system. Specifically, we study the structure learning problem for spatially distributed dynamical systems coupled via a directed acyclic graph. Unlike established structure learning procedures that find locally maximum posterior probabilities of a network structure containing latent variables, our work exploits the properties of dynamical systems to compute globally optimal approximations of these distributions. We arrive at this result by the use of time delay embedding theorems. Taking an information-theoretic perspective, we show that the log-likelihood has an intuitive interpretation in terms of information transfer.</p>
</abstract>
<kwd-group>
<kwd>complex networks</kwd>
<kwd>structure learning</kwd>
<kwd>dynamic Bayesian networks</kwd>
<kwd>graph dynamical systems</kwd>
<kwd>information theory</kwd>
<kwd>dynamical systems</kwd>
<kwd>state space reconstruction</kwd>
</kwd-group>
<counts>
<fig-count count="1"/>
<table-count count="0"/>
<equation-count count="27"/>
<ref-count count="42"/>
<page-count count="9"/>
<word-count count="6558"/>
</counts>
</article-meta>
</front>
<body>
<sec id="S1" sec-type="introduction">
<label>1</label> <title>Introduction</title>
<p>Complex systems are broadly defined as systems that comprise interacting non-linear components (Boccaletti et al., <xref ref-type="bibr" rid="B2">2006</xref>). Discrete-time complex systems can be represented using graphical models such as <italic>graph dynamical systems (GDSs)</italic> (Mortveit and Reidys, <xref ref-type="bibr" rid="B26">2001</xref>; Wu, <xref ref-type="bibr" rid="B41">2005</xref>), where spatially distributed dynamical units are coupled via a directed graph. The task of learning the structure of such a system is to infer directed relationships between variables; in the case of dynamical systems, these variables are typically hidden (Kantz and Schreiber, <xref ref-type="bibr" rid="B19">2004</xref>). In this paper, we study the <italic>structure learning</italic> problem for complex networks of non-linear dynamical systems coupled via a directed acyclic graph (DAG). Specifically, we formulate synchronous update GDSs as dynamic Bayesian networks (DBNs) and study this problem from the perspective of information theory.</p>
<p>The structure learning problem for distributed dynamical systems is a precursor to inference in systems that are not fully observable. This case encompasses many practical problems of known artificial, biological, and chemical systems, such as neural networks (Lizier et al., <xref ref-type="bibr" rid="B22">2011</xref>; Vicente et al., <xref ref-type="bibr" rid="B40">2011</xref>; Schumacher et al., <xref ref-type="bibr" rid="B31">2015</xref>), multi-agent systems (Xu et al., <xref ref-type="bibr" rid="B42">2013</xref>; Gan et al., <xref ref-type="bibr" rid="B9">2014</xref>; Cliff et al., <xref ref-type="bibr" rid="B43">2016</xref>; Umenberger and Manchester, <xref ref-type="bibr" rid="B39">2016</xref>), and various others (Boccaletti et al., <xref ref-type="bibr" rid="B2">2006</xref>). Modeling a partially observable system as a dynamical network presents a challenge in synthesizing these models and capturing their global properties (Boccaletti et al., <xref ref-type="bibr" rid="B2">2006</xref>). In addressing this challenge, we draw on probabilistic graphical models (specifically Bayesian network (BN) structure learning) and non-linear time series analysis (differential topology).</p>
<p>In this paper, we exploit the properties of discrete-time multivariate dynamical systems in inferring coupling between latent variables in a DAG. Specifically, the main focus of this paper is to analytically derive a measure (score) for evaluating the fitness of a candidate DAG, given data. We assume the data are generated by a certain family of multivariate dynamical system and are thus able to overcome the issue of latent variables faced by established structure learning algorithms. That is, under certain assumptions of the dynamical system, we are able to employ time delay embedding theorems (Stark et al., <xref ref-type="bibr" rid="B35">2003</xref>; Deyle and Sugihara, <xref ref-type="bibr" rid="B7">2011</xref>) to compute our scores.</p>
<p>Our main result is a tractable form of the log-likelihood function for synchronous GDSs. Using this result, we are able to directly compute the <italic>Bayesian information criterion (BIC)</italic> (Schwarz, <xref ref-type="bibr" rid="B32">1978</xref>) and <italic>Akaike information criterion (AIC)</italic> (Akaike, <xref ref-type="bibr" rid="B1">1974</xref>) and thus achieve globally optimal approximations of the posterior distribution of the graph. Finally, we show that the log-likelihood and log-likelihood ratio can be expressed in terms of <italic>collective transfer entropy</italic> (Lizier et al., <xref ref-type="bibr" rid="B24">2010</xref>; Vicente et al., <xref ref-type="bibr" rid="B40">2011</xref>). This result places our work in the context of effective network analysis (Sporns et al., <xref ref-type="bibr" rid="B33">2004</xref>; Park and Friston, <xref ref-type="bibr" rid="B27">2013</xref>) based on information transfer (Honey et al., <xref ref-type="bibr" rid="B16">2007</xref>; Lizier et al., <xref ref-type="bibr" rid="B22">2011</xref>; Cliff et al., <xref ref-type="bibr" rid="B6">2013</xref>, <xref ref-type="bibr" rid="B43">2016</xref>) and relates to the information processing intrinsic to distributed computation (Lizier et al., <xref ref-type="bibr" rid="B23">2008</xref>).</p>
</sec>
<sec id="S2">
<label>2</label> <title>Related Work</title>
<p>We are interested in classes of systems whereby dynamical units are coupled via a graph structure. These types of systems have been studied under several names, including complex dynamical networks (Boccaletti et al., <xref ref-type="bibr" rid="B2">2006</xref>), spatially distributed dynamical systems (Kantz and Schreiber, <xref ref-type="bibr" rid="B19">2004</xref>; Schumacher et al., <xref ref-type="bibr" rid="B31">2015</xref>), master-slave configurations (or systems with a skew product structure) (Kocarev and Parlitz, <xref ref-type="bibr" rid="B20">1996</xref>), and coupled maps (Kaneko, <xref ref-type="bibr" rid="B18">1992</xref>). Common to each of these definitions is that the multivariate state of the system comprises individual subsystem states, the dynamics of which are given by a set of either discrete-time maps or first-order ordinary differential equations (ODEs), called a flow. We assume the discrete-time formulation, where a map can be obtained numerically by integrating differential equations or recording experimental data (observations) at discrete-time intervals (Kantz and Schreiber, <xref ref-type="bibr" rid="B19">2004</xref>). The literature on coupled dynamical systems is often focused on the analysis of characteristics such as stability and synchrony of the system. In this work, we draw on the fields of BN structure learning and non-linear time series analysis to infer coupling between spatially distributed dynamical systems.</p>
<p>BN structure learning comprises two subproblems: <italic>evaluating</italic> the fitness of a graph and <italic>identifying</italic> the optimal graph given this fitness criterion (Chickering, <xref ref-type="bibr" rid="B5">2002</xref>). The evaluation problem is particularly challenging in the case of graph dynamical systems, which include both latent and observed variables. A number of theoretically optimal techniques exist for the evaluation problem for BNs with complete data (Bouckaert, <xref ref-type="bibr" rid="B3">1994</xref>; Lam and Bacchus, <xref ref-type="bibr" rid="B21">1994</xref>; Heckerman et al., <xref ref-type="bibr" rid="B14">1995</xref>), which have been extended to DBNs (Friedman et al., <xref ref-type="bibr" rid="B8">1998</xref>). With incomplete data, however, the common approach is to resort to approximations that find local optima, e.g., expectation-maximization (EM) (Friedman et al., <xref ref-type="bibr" rid="B8">1998</xref>; Ghahramani, <xref ref-type="bibr" rid="B10">1998</xref>). An additional caveat with respect to structure learning is that algorithms find an equivalence class of networks with the same Markov structure, and not a unique solution (Chickering, <xref ref-type="bibr" rid="B5">2002</xref>).</p>
<p>In non-linear time series analysis, the problem of inferring coupling strength and causality in complex systems has received significant attention recently (Schreiber, <xref ref-type="bibr" rid="B30">2000</xref>; Hoyer et al., <xref ref-type="bibr" rid="B17">2009</xref>). Early work by Granger defined causality in terms of the predictability of one system linearly coupled to another (Granger, <xref ref-type="bibr" rid="B12">1969</xref>). Although this measure is popular for identifying coupling, it requires systems are linear statistical models and is considered insufficient for inferring coupling between dynamical systems due to inseparability (Sugihara et al., <xref ref-type="bibr" rid="B36">2012</xref>). Another method popular in neuroscience is transfer entropy, which was introduced to quantify the information transfer between non-linear (finite-order Markov) systems (Schreiber, <xref ref-type="bibr" rid="B30">2000</xref>). Transfer entropy has been used to recover interaction networks in numerous fields such as multi-agent systems (Cliff et al., <xref ref-type="bibr" rid="B43">2016</xref>) and effective networks in neuroscience (Lizier et al., <xref ref-type="bibr" rid="B22">2011</xref>; Vicente et al., <xref ref-type="bibr" rid="B40">2011</xref>; Lizier and Rubinov, <xref ref-type="bibr" rid="B25">2012</xref>). More recently, researchers have used the additive noise model (Hoyer et al., <xref ref-type="bibr" rid="B17">2009</xref>; Peters et al., <xref ref-type="bibr" rid="B28">2011</xref>) to infer unidirectional cause and effect relationships with observed random variables and find a unique DAG (as opposed to an equivalence class). These studies have been extended by exploring weakly additive noise models for learning the structure of systems of observed variables with non-linear coupling (Gretton et al., <xref ref-type="bibr" rid="B13">2009</xref>).</p>
<p>A recent approach to inferring causality is convergent cross-mapping (CCM), which is based on Takens theorem (Takens, <xref ref-type="bibr" rid="B37">1981</xref>) and tests for causation (predictability) by considering the history of observed data of a hidden variable in predicting the outcome of another (Sugihara et al., <xref ref-type="bibr" rid="B36">2012</xref>). Using a similar approach, Schumacher et al. (<xref ref-type="bibr" rid="B31">2015</xref>) used Stark&#x02019;s bundle delay embedding theorem (Stark, <xref ref-type="bibr" rid="B34">1999</xref>; Stark et al., <xref ref-type="bibr" rid="B35">2003</xref>) to predict one subsystem from another using Gaussian processes. This algorithm can thus be used to infer the driving systems in spatially distributed dynamical systems in a similar manner to our work. However, both papers do not consider the problem of inference over the entire network structure, or formally derive the measures used therein. In our work, we provide a rigorous proof based on established structure learning procedures and discuss the problem of inference within a distributed dynamical system.</p>
</sec>
<sec id="S3">
<label>3</label> <title>Background</title>
<p>This section summarizes relevant technical concepts used throughout the paper. First, a stochastic temporal process <italic>X</italic> is defined as a sequence of random variables (<italic>X</italic><sub>1</sub>, <italic>X</italic><sub>2</sub>,&#x02009;&#x02026;,&#x02009;<italic>X<sub>N</sub></italic>) with a realization (<italic>x</italic><sub>1</sub>, <italic>x</italic><sub>2</sub>, &#x02026;, <italic>x<sub>N</sub></italic>) for countable time indices <inline-formula><mml:math id="M1"><mml:mi>n</mml:mi><mml:mo class="MathClass-rel">&#x02208;</mml:mo><mml:mi mathvariant="double-struck">N</mml:mi></mml:math></inline-formula>. Consider a collection of <italic>M</italic> processes, and denote the <italic>i</italic>th process <italic>X<sup>i</sup></italic> to have associated realization <inline-formula><mml:math id="M2"><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula> at temporal index <italic>n</italic>, and <italic><bold>x</bold><sub>n</sub></italic> as all realizations at that index <inline-formula><mml:math id="M3"><mml:msub><mml:mrow><mml:mi mathvariant="bold-italic">x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mn>1</mml:mn></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:mo class="MathClass-op">&#x02026;</mml:mo><mml:mo class="MathClass-punc">,</mml:mo><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>M</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:math></inline-formula>. If <inline-formula><mml:math id="M4"><mml:msubsup><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula> is a discrete random variable, the number of values the variable can take on is denoted <inline-formula><mml:math id="M5"><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mn>&#x0007C;</mml:mn></mml:math></inline-formula>. The following sections collect results from DBN literature, attractor reconstruction, and information theory that are relevant to this work.</p>
<sec id="S3-1">
<label>3.1</label> <title>Dynamic Bayesian Networks</title>
<p>DBNs are a general graphical representation of a temporal model, representing a probability distribution over infinite trajectories of random variables (<italic><bold>Z</bold></italic><sub>1</sub>, <italic><bold>Z</bold></italic><sub>2</sub>, &#x02026;) compactly (Friedman et al., <xref ref-type="bibr" rid="B8">1998</xref>). These models are a more expressive framework than the hidden Markov model (HMM) and Kalman filter model (KFM) (or linear dynamical system) (Friedman et al., <xref ref-type="bibr" rid="B8">1998</xref>). In this work, we denote <italic><bold>Z</bold><sub>n</sub></italic>&#x02009;&#x0003D;&#x02009;{<italic><bold>X</bold><sub>n</sub></italic>, <italic><bold>Y</bold><sub>n</sub></italic>} as the set of hidden and observed variables, respectively, where <italic>n</italic> &#x02208; {1, 2, &#x02026;} is the temporal index.</p>
<p>BNs <italic>B</italic>&#x02009;&#x0003D;&#x02009;(<italic>G</italic>, &#x00398;) represent a joint distribution <italic>p</italic>(<italic><bold>z</bold></italic>) graphically and consist of: a DAG <italic>G</italic> and a set of conditional probability distribution (CPD) parameters &#x00398;. DBNs <italic>B</italic>&#x02009;&#x0003D;&#x02009;(<italic>B</italic><sub>1</sub>, <italic>B</italic><sub>&#x02192;</sub>) extend the BN to model temporal processes and comprise two parts: the prior BN <italic>B</italic><sub>1</sub>&#x02009;&#x0003D;&#x02009;(<italic>G</italic><sub>1</sub>, &#x00398;<sub>1</sub>), which defines the joint distribution <inline-formula><mml:math id="M6"><mml:msub><mml:mrow><mml:mi>p</mml:mi></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi>B</mml:mi></mml:mrow><mml:mrow><mml:mn>1</mml:mn></mml:mrow></mml:msub></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi mathvariant="bold-italic">z</mml:mi></mml:mrow><mml:mrow><mml:mn>1</mml:mn></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:math></inline-formula>; and the <italic>two-time-slice Bayesian network (2TBN) B</italic><sub>&#x02192;</sub>&#x02009;&#x0003D;&#x02009;(<italic>G</italic><sub>&#x02192;</sub>, &#x00398;<sub>&#x02192;</sub>), which defines a first-order Markov process <inline-formula><mml:math id="M7"><mml:msub><mml:mrow><mml:mi>p</mml:mi></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi>B</mml:mi></mml:mrow><mml:mrow><mml:mo class="MathClass-rel">&#x02192;</mml:mo></mml:mrow></mml:msub></mml:mrow></mml:msub></mml:math></inline-formula>(<italic><bold>z</bold><sub>n</sub></italic><sub>&#x0002B;1</sub>&#x0007C;<italic><bold>z</bold><sub>n</sub></italic>) (Friedman et al., <xref ref-type="bibr" rid="B8">1998</xref>). This formulation allows for a variable to be conditioned on its respective parent set <inline-formula><mml:math id="M8"><mml:msub><mml:mrow><mml:mn>&#x003A0;</mml:mn></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi>G</mml:mi></mml:mrow><mml:mrow><mml:mo class="MathClass-rel">&#x02192;</mml:mo></mml:mrow></mml:msub></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>Z</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:math></inline-formula> that can come from the preceding time slice or the current time slice, as long as <italic>G</italic><sub>&#x02192;</sub> forms a DAG. The 2TBN probability distribution factorizes according to <italic>G</italic><sub>&#x02192;</sub>with a local CPD <italic>p<sub>D</sub></italic> estimated from an observed dataset. That is, given a set of stochastic processes (<italic><bold>Z</bold></italic><sub>1</sub>, <italic><bold>Z</bold></italic><sub>2</sub>, &#x02026;, <italic><bold>Z</bold><sub>N</sub></italic>), the realization of which constitutes a dataset <italic>D</italic>&#x02009;&#x0003D;&#x02009;(<italic><bold>z</bold></italic><sub>1</sub>, <italic><bold>z</bold></italic><sub>2</sub>, &#x02026;, <italic><bold>z</bold><sub>N</sub></italic>), we obtain the 2TBN distribution as
<disp-formula id="E1"><label>(1)</label><mml:math id="M9"><mml:msub><mml:mrow><mml:mi>p</mml:mi></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi>B</mml:mi></mml:mrow><mml:mrow><mml:mo class="MathClass-rel">&#x02192;</mml:mo></mml:mrow></mml:msub></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi mathvariant="bold-italic">z</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow></mml:msub><mml:mn>&#x0007C;</mml:mn><mml:msub><mml:mrow><mml:mi mathvariant="bold-italic">z</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x0220F;</mml:mo><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:munder></mml:mstyle><mml:msub><mml:mrow><mml:mi>p</mml:mi></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi>B</mml:mi></mml:mrow><mml:mrow><mml:mo class="MathClass-rel">&#x02192;</mml:mo></mml:mrow></mml:msub></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>z</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mn>&#x0007C;</mml:mn><mml:msub><mml:mrow><mml:mn>&#x003C0;</mml:mn></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi>G</mml:mi></mml:mrow><mml:mrow><mml:mo class="MathClass-rel">&#x02192;</mml:mo></mml:mrow></mml:msub></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>Z</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-punc">,</mml:mo></mml:math></disp-formula>
where <inline-formula><mml:math id="M10"><mml:msub><mml:mrow><mml:mn>&#x003C0;</mml:mn></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi mathvariant="script">G</mml:mi></mml:mrow><mml:mrow><mml:mo class="MathClass-rel">&#x02192;</mml:mo></mml:mrow></mml:msub></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>Z</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:math></inline-formula> denotes the (index-ordered) set of realizations <inline-formula><mml:math id="M11"><mml:mrow><mml:mo class="MathClass-open">&#x0007B;</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>z</mml:mi></mml:mrow><mml:mrow><mml:mi>o</mml:mi></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">:</mml:mo><mml:msubsup><mml:mrow><mml:mi>Z</mml:mi></mml:mrow><mml:mrow><mml:mi>o</mml:mi></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-rel">&#x02208;</mml:mo><mml:msub><mml:mrow><mml:mn>&#x003A0;</mml:mn></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi mathvariant="script">G</mml:mi></mml:mrow><mml:mrow><mml:mo class="MathClass-rel">&#x02192;</mml:mo></mml:mrow></mml:msub></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>Z</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow><mml:mo class="MathClass-close">&#x0007D;</mml:mo></mml:mrow></mml:math></inline-formula>.</p>
</sec>
<sec id="S3-2">
<label>3.2</label> <title>Embedding Theory</title>
<p>Embedding theory refers to methods from differential topology for inferring the (hidden) state of a dynamical system from a reconstructed sequence of observations. The state of a discrete-time dynamical system is given by a point <italic><bold>x</bold><sub>n</sub></italic> confined to a <italic>d</italic>-dimensional manifold <inline-formula><mml:math id="M12"><mml:mi mathvariant="script">M</mml:mi></mml:math></inline-formula>. The time evolution of this state is described by a map <italic>f</italic> : <inline-formula><mml:math id="M13"><mml:mi mathvariant="script">M</mml:mi><mml:mo class="MathClass-rel">&#x02192;</mml:mo><mml:mi mathvariant="script">M</mml:mi></mml:math></inline-formula>, so that the sequence of states (<italic><bold>x</bold><sub>n</sub></italic>) is given by <italic><bold>x</bold><sub>n&#x0002B;</sub></italic><sub>1</sub>&#x02009;&#x0003D;&#x02009;<italic>f</italic>(<italic><bold>x</bold><sub>n</sub></italic>). In many situations, we only have access to a filtered, scalar representation of the state, i.e., the measurement <italic>y<sub>n</sub></italic>&#x02009;&#x0003D;&#x02009;<italic>&#x003C8;</italic> (<italic><bold>x</bold><sub>n</sub></italic>) given by some <italic>measurement function</italic> <inline-formula><mml:math id="M14"><mml:mn>&#x003C8;</mml:mn><mml:mo class="MathClass-punc">:</mml:mo><mml:mi mathvariant="script">M</mml:mi><mml:mo class="MathClass-rel">&#x02192;</mml:mo><mml:mi mathvariant="double-struck">R</mml:mi></mml:math></inline-formula> (Takens, <xref ref-type="bibr" rid="B37">1981</xref>; Stark, <xref ref-type="bibr" rid="B34">1999</xref>). The celebrated Takens&#x02019; theorem (Takens, <xref ref-type="bibr" rid="B37">1981</xref>) shows that for typical <italic>f</italic> and <italic>&#x003C8;</italic>, it is possible to reconstruct <italic>f</italic> from the observed time series up to some smooth coordinate change. More precisely, fix some <italic>&#x003BA;</italic> (the <italic>embedding dimension</italic>) and some <italic>&#x003C4;</italic> (the <italic>time delay</italic>), then define the <italic>delay embedding map</italic> <bold>&#x003A6;</bold><italic><sub>f</sub></italic><sub>,</sub><italic><sub>&#x003C8;</sub></italic>: <inline-formula><mml:math id="M15"><mml:mi mathvariant="script">M</mml:mi><mml:mo class="MathClass-rel">&#x02192;</mml:mo><mml:msup><mml:mi mathvariant="double-struck">R</mml:mi><mml:mrow><mml:mi>&#x003BA;</mml:mi></mml:mrow></mml:msup></mml:math></inline-formula> by
<disp-formula id="E2"><label>(2)</label><mml:math id="M16"><mml:msub><mml:mrow><mml:mi mathvariant="bold">&#x003A6;</mml:mi></mml:mrow><mml:mrow><mml:mi>f</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mn>&#x003C8;</mml:mn></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi mathvariant="bold-italic">x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msub><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mn>&#x003C4;</mml:mn></mml:mrow></mml:msub><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mn>2&#x003C4;</mml:mn></mml:mrow></mml:msub><mml:mo class="MathClass-punc">,</mml:mo><mml:mo class="MathClass-op">&#x02026;</mml:mo><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mn>&#x003BA;</mml:mn><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mn>&#x003C4;</mml:mn></mml:mrow></mml:msub></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow><mml:mo class="MathClass-punc">.</mml:mo></mml:math></disp-formula></p>
<p>In differential topology, an <italic>embedding</italic> refers to a smooth map &#x003A8;: <inline-formula><mml:math id="M17"><mml:mi mathvariant="script">M</mml:mi><mml:mo class="MathClass-rel">&#x02192;</mml:mo><mml:mi mathvariant="script">N</mml:mi></mml:math></inline-formula> between manifolds <inline-formula><mml:math id="M18"><mml:mi mathvariant="script">M</mml:mi></mml:math></inline-formula> and <inline-formula><mml:math id="M19"><mml:mi mathvariant="script">N</mml:mi></mml:math></inline-formula> if it maps <inline-formula><mml:math id="M20"><mml:mi mathvariant="script">M</mml:mi></mml:math></inline-formula> diffeomorphically onto its image; therefore, <bold>&#x003A6;</bold><italic><sub>f</sub></italic><sub>,</sub><italic><sub>&#x003C8;</sub></italic> has a smooth inverse <inline-formula><mml:math id="M21"><mml:msubsup><mml:mrow><mml:mi mathvariant="bold">&#x003A6;</mml:mi></mml:mrow><mml:mrow><mml:mi>f</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mn>1</mml:mn></mml:mrow></mml:msubsup></mml:math></inline-formula>. The implication of Takens&#x02019; theorem is that for typical <italic>f</italic> and <italic>&#x003C8;</italic>, the image <bold>&#x003A6;</bold><italic><sub>f</sub></italic><sub>,</sub><italic><sub>&#x003C8;</sub></italic>(<inline-formula><mml:math id="M126"><mml:mi mathvariant="script">M</mml:mi></mml:math></inline-formula>) of <inline-formula><mml:math id="M22"><mml:mi mathvariant="script">M</mml:mi></mml:math></inline-formula> is completely equivalent to <inline-formula><mml:math id="M23"><mml:mi mathvariant="script">M</mml:mi></mml:math></inline-formula> itself, apart from the smooth invertible change of coordinates given by the mapping <bold>&#x003A6;</bold><italic><sub>f</sub></italic><sub>,</sub><italic><sub>&#x003C8;</sub></italic>. An important consequence of this theorem is that we can define a map <inline-formula><mml:math id="M24"><mml:mi mathvariant="bold">F</mml:mi><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:msub><mml:mi mathvariant="bold">&#x003A6;</mml:mi><mml:mrow><mml:mi>f</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mn>&#x003C8;</mml:mn></mml:mrow></mml:msub><mml:mo class="MathClass-bin">&#x02218;</mml:mo><mml:mi>f</mml:mi><mml:mo class="MathClass-bin">&#x02218;</mml:mo><mml:msubsup><mml:mrow><mml:mi mathvariant="bold">&#x003A6;</mml:mi></mml:mrow><mml:mrow><mml:mi>f</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mn>1</mml:mn></mml:mrow></mml:msubsup></mml:math></inline-formula> on <bold>&#x003A6;</bold><italic><sub>f</sub></italic><sub>,</sub><italic><sub>&#x003C8;</sub></italic>, such that <inline-formula><mml:math id="M25"><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mi mathvariant="bold">F</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:math></inline-formula> (Stark, <xref ref-type="bibr" rid="B34">1999</xref>).</p>
<p>There are technical assumptions for Takens&#x02019; theorem (and the generalized versions employed herein) to hold. These assumptions require: (<italic>f</italic>, <italic>&#x003C8;</italic>) to be generic functions (in terms of Baire space), a restricted number of periodic points, and distinct eigenvalues at each neighborhood of these points (Takens, <xref ref-type="bibr" rid="B37">1981</xref>; Stark, <xref ref-type="bibr" rid="B34">1999</xref>; Stark et al., <xref ref-type="bibr" rid="B35">2003</xref>; Deyle and Sugihara, <xref ref-type="bibr" rid="B7">2011</xref>).</p>
</sec>
<sec id="S3-3">
<label>3.3</label> <title>Information Theoretic Measures</title>
<p><italic>Conditional entropy</italic> represents the uncertainty of a random variable <italic>X</italic> after taking into account the outcomes of another random variable <italic>Y</italic> by
<disp-formula id="E3"><label>(3)</label><mml:math id="M26"><mml:mi>H</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mi>X</mml:mi><mml:mn>&#x0007C;</mml:mn><mml:mi>Y</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>x</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mi>y</mml:mi></mml:mrow></mml:munder></mml:mstyle><mml:mi>p</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mi>x</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mi>y</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:msub><mml:mrow><mml:mtext>log</mml:mtext></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msub><mml:mi mathvariant="italic">&#x000A0;p</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mi>x</mml:mi><mml:mn>&#x0007C;</mml:mn><mml:mi>y</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-punc">.</mml:mo></mml:math></disp-formula></p>
<p>Multivariate <italic>transfer entropy</italic> is a measure that computes the information transfer from a set of source processes to a set of destination process (Lizier et al., <xref ref-type="bibr" rid="B22">2011</xref>). In this work, we use the formulation of collective transfer entropy (Lizier et al., <xref ref-type="bibr" rid="B24">2010</xref>), where the information transfer from <italic>m</italic> source processes <bold><italic>V</italic></bold>&#x02009;&#x0003D;&#x02009;{<italic>Y</italic><sup>1</sup>, <italic>Y</italic><sup>2</sup>, &#x02026;, <italic>Y<sup>m</sup></italic>} to a single destination process <italic>Y</italic> can be decomposed as a sum of conditional entropy terms:
<disp-formula id="E4"><label>(4)</label><mml:math id="M27"><mml:msub><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="bold-italic">V</mml:mi><mml:mo class="MathClass-rel">&#x02192;</mml:mo><mml:mi>Y</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mi>H</mml:mi><mml:mfenced separators="" open="(" close=")"><mml:mrow><mml:msub><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow></mml:msub><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow></mml:mfenced><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mi>H</mml:mi><mml:mfenced separators="" open="(" close=")"><mml:mrow><mml:msub><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow></mml:msub><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow></mml:mfenced><mml:mo class="MathClass-punc">,</mml:mo></mml:math></disp-formula>
where <inline-formula><mml:math id="M28"><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:msup><mml:mrow><mml:mn>&#x003C4;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mn>2</mml:mn><mml:msup><mml:mrow><mml:mn>&#x003C4;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:mo class="MathClass-op">&#x02026;</mml:mo><mml:mo class="MathClass-punc">,</mml:mo><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003C4;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:math></inline-formula> for some <italic>&#x003BA;<sup>i</sup></italic> and <italic>&#x003C4;<sup>i</sup></italic>, and similarly for <inline-formula><mml:math id="M29"><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:math></inline-formula>.</p>
</sec>
</sec>
<sec id="S4">
<label>4</label> <title>Representing Non-Linear Dynamical Networks as DBNs</title>
<p>We express multivariate dynamical systems as a synchronous update GDS to allow for generic maps. With this model, we can express the time evolution of the GDS as a stationary DBN, and perform inference and learning on the subsequent graph. We formally state the network of dynamical systems as a special case of the sequential GDS (Mortveit and Reidys, <xref ref-type="bibr" rid="B26">2001</xref>) with an observation function for each vertex.</p>
<p>Definition 1. Synchronous graph dynamical system (GDS). <italic>A synchronous GDS is a tuple</italic> (<italic>G</italic>, <italic><bold>x</bold><sub>n</sub></italic>, <italic><bold>y</bold><sub>n</sub></italic>, {<italic>f<sup>i</sup></italic>}, {<italic>&#x003C8;<sup>i</sup></italic>}) <italic>that consists of:</italic>
<list list-type="bullet">
<list-item><p><italic>a finite, directed graph</italic> <inline-formula><mml:math id="M30"><mml:mi>G</mml:mi><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mi mathvariant="script">V</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mi mathvariant="script">E</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:math></inline-formula> <italic>with edge-set</italic> <inline-formula><mml:math id="M31"><mml:mi mathvariant="script">E</mml:mi><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mrow><mml:mo class="MathClass-open">&#x0007B;</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mi>E</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">&#x0007D;</mml:mo></mml:mrow></mml:math></inline-formula> <italic>and M vertices comprising the vertex set</italic> <inline-formula><mml:math id="M32"><mml:mi mathvariant="script">V</mml:mi><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mrow><mml:mo class="MathClass-open">&#x0007B;</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mi>V</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">&#x0007D;</mml:mo></mml:mrow></mml:math></inline-formula><italic>;</italic></p></list-item>
<list-item><p><italic>a multivariate state</italic> <inline-formula><mml:math id="M33"><mml:msub><mml:mrow><mml:mi mathvariant="bold-italic">x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:math></inline-formula>, <italic>composed of states for each vertex V<sup>i</sup> confined to a d<sup>i</sup>-dimensional manifold</italic> <inline-formula><mml:math id="M34"><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-rel">&#x02208;</mml:mo><mml:msup><mml:mrow><mml:mi mathvariant="script">M</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:math></inline-formula><italic>;</italic></p></list-item>
<list-item><p><italic>an M-variate observation</italic> <inline-formula><mml:math id="M35"><mml:msub><mml:mrow><mml:mi mathvariant="bold-italic">y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:math></inline-formula>, <italic>composed of scalar observations for each vertex</italic> <inline-formula><mml:math id="M36"><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-rel">&#x02208;</mml:mo><mml:mi mathvariant="double-struck">R</mml:mi></mml:math></inline-formula><italic>;</italic></p></list-item>
<list-item><p><italic>a set of local maps</italic> {<italic>f</italic><sup><italic>i</italic></sup>} <italic>of the form</italic> <inline-formula><mml:math id="M37"><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mo class="MathClass-punc">:</mml:mo><mml:mi mathvariant="script">M</mml:mi><mml:mo class="MathClass-rel">&#x02192;</mml:mo><mml:msup><mml:mrow><mml:mi mathvariant="script">M</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:math></inline-formula>, <italic>which update synchronously and induce a global map</italic> <inline-formula><mml:math id="M38"><mml:mi>f</mml:mi><mml:mo class="MathClass-punc">:</mml:mo><mml:mi mathvariant="script">M</mml:mi><mml:mo class="MathClass-rel">&#x02192;</mml:mo><mml:mi mathvariant="script">M</mml:mi></mml:math></inline-formula><italic>; and</italic></p></list-item>
<list-item><p><italic>a set of local observation functions</italic> {<italic>&#x003C8;</italic><sup>1</sup>, <italic>&#x003C8;</italic><sup>2</sup>, &#x02026;, <italic>&#x003C8;<sup>M</sup></italic>} <italic>of the form</italic> <inline-formula><mml:math id="M39"><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mo class="MathClass-punc">:</mml:mo><mml:msup><mml:mrow><mml:mi mathvariant="script">M</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mo class="MathClass-rel">&#x02192;</mml:mo><mml:mi mathvariant="double-struck">R</mml:mi></mml:math></inline-formula>.</p></list-item>
</list></p>
<p>Without loss of generality, we can use local functions to describe the time evolution of the subsystems:
<disp-formula id="E5"><label>(5)</label><mml:math id="M40"><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:msub><mml:mrow><mml:mn>&#x003C5;</mml:mn></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msub></mml:math></disp-formula>
<disp-formula id="E6"><label>(6)</label><mml:math id="M41"><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:msub><mml:mrow><mml:mn>&#x003C5;</mml:mn></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msub><mml:mo class="MathClass-punc">.</mml:mo></mml:math></disp-formula></p>
<p>Here, <inline-formula><mml:math id="M42"><mml:msub><mml:mrow><mml:mn>&#x003C5;</mml:mn></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msub></mml:math></inline-formula> is i.i.d. additive noise and <inline-formula><mml:math id="M43"><mml:msub><mml:mrow><mml:mn>&#x003C5;</mml:mn></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msub></mml:math></inline-formula> is noise that is either i.i.d. or dependent on the state, i.e., <inline-formula><mml:math id="M44"><mml:msub><mml:mrow><mml:mn>&#x003C5;</mml:mn></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:math></inline-formula>. The subsystem dynamics [equation (<xref ref-type="disp-formula" rid="E5">5</xref>)] are therefore a function of the subsystem state <inline-formula><mml:math id="M45"><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula> and the subsystem parents&#x02019; state <inline-formula><mml:math id="M46"><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> at the previous time index such that <inline-formula><mml:math id="M47"><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mo class="MathClass-punc">:</mml:mo><mml:msup><mml:mrow><mml:mi mathvariant="script">M</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:msub><mml:mrow><mml:mo class="MathClass-bin">&#x000D7;</mml:mo></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub><mml:msup><mml:mrow><mml:mi mathvariant="script">M</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup><mml:mo class="MathClass-rel">&#x02192;</mml:mo><mml:msup><mml:mrow><mml:mi mathvariant="script">M</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:math></inline-formula>. Each subsystem observation is given by equation (<xref ref-type="disp-formula" rid="E6">6</xref>). We assume the functions {<italic>f<sup>i</sup></italic>} and {<italic>&#x003C8;<sup>i</sup></italic>} are invariant w.r.t. time and thus the graph <italic>G</italic> is stationary.</p>
<p>The time evolution of a synchronous GDS can be modeled as a DBN. First, each subsystem vertex <italic>V</italic><sup>i</sup>&#x02009;&#x0003D;&#x02009;<inline-formula><mml:math id="M48"><mml:mfenced separators="" open="{" close=""><mml:mrow><mml:msubsup><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow></mml:mfenced></mml:math></inline-formula>, <inline-formula><mml:math id="M49"><mml:mfenced separators="" open="" close="}"><mml:mrow><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow></mml:mfenced></mml:math></inline-formula> has an associated state variable <inline-formula><mml:math id="M50"><mml:msubsup><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula> and observation variable <inline-formula><mml:math id="M51"><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula>; the parents of subsystem <italic>V</italic><sup>i</sup> are denoted &#x003A0;<italic><sub>G</sub></italic>(<italic>V<sup>&#x02009;i</sup></italic>). Since the graph <italic>G</italic><sub>&#x02192;</sub> is stationary and synchronous, parents of <inline-formula><mml:math id="M52"><mml:mrow><mml:msubsup><mml:mi>X</mml:mi><mml:mrow><mml:mi>n</mml:mi><mml:mo>+</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mi>i</mml:mi></mml:msubsup></mml:mrow></mml:math></inline-formula> come strictly from the preceding time slice, and additionally <inline-formula><mml:math id="M53"><mml:msub><mml:mrow><mml:mn>&#x003A0;</mml:mn></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi>G</mml:mi></mml:mrow><mml:mrow><mml:mo class="MathClass-rel">&#x02192;</mml:mo></mml:mrow></mml:msub></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:msubsup><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula>. Thus, we can build the edge set <inline-formula><mml:math id="M54"><mml:mi mathvariant="script">E</mml:mi><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mrow><mml:mo class="MathClass-open">&#x0007B;</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mi>E</mml:mi></mml:mrow><mml:mrow><mml:mn>1</mml:mn></mml:mrow></mml:msup><mml:mo class="MathClass-punc">,</mml:mo><mml:msup><mml:mrow><mml:mi>E</mml:mi></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msup><mml:mo class="MathClass-punc">,</mml:mo><mml:mo class="MathClass-op">&#x02026;</mml:mo><mml:mo class="MathClass-punc">,</mml:mo><mml:msup><mml:mrow><mml:mi>E</mml:mi></mml:mrow><mml:mrow><mml:mi>M</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">&#x0007D;</mml:mo></mml:mrow></mml:math></inline-formula> in the GDS by means of the DBN. That is, each edge subset <italic>E<sup>i</sup></italic> is built by the DBN edges
<disp-formula><mml:math id="M55"><mml:msup><mml:mrow><mml:mi>E</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mrow><mml:mo class="MathClass-open">&#x0007B;</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mi>V</mml:mi></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msup><mml:mo class="MathClass-rel">&#x02192;</mml:mo><mml:msup><mml:mrow><mml:mi>V</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mo class="MathClass-punc">:</mml:mo><mml:msubsup><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-rel">&#x02208;</mml:mo><mml:msub><mml:mrow><mml:mn>&#x003A0;</mml:mn></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi>G</mml:mi></mml:mrow><mml:mrow><mml:mo class="MathClass-rel">&#x02192;</mml:mo></mml:mrow></mml:msub></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-bin">&#x02227;</mml:mo><mml:msup><mml:mrow><mml:mi>V</mml:mi></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msup><mml:mo class="MathClass-rel">&#x02208;</mml:mo><mml:mi mathvariant="script">V</mml:mi><mml:mo class="MathClass-bin">\</mml:mo><mml:msup><mml:mrow><mml:mi>V</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">&#x0007D;</mml:mo></mml:mrow><mml:mo class="MathClass-punc">,</mml:mo></mml:math></disp-formula>
so long as <italic>G</italic> forms a DAG. As an example, consider the synchronous GDS in Figure <xref ref-type="fig" rid="F1">1</xref>A. The subsystem <italic>V</italic><sup>3</sup> is coupled to both subsystem <italic>V</italic><sup>1</sup> and <italic>V</italic><sup>2</sup> through the edge set <inline-formula><mml:math id="M56"><mml:mi mathvariant="script">E</mml:mi><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mrow><mml:mo class="MathClass-open">&#x0007B;</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mi>V</mml:mi></mml:mrow><mml:mrow><mml:mn>1</mml:mn></mml:mrow></mml:msup><mml:mo class="MathClass-rel">&#x02192;</mml:mo><mml:msup><mml:mrow><mml:mi>V</mml:mi></mml:mrow><mml:mrow><mml:mn>3</mml:mn></mml:mrow></mml:msup><mml:mo class="MathClass-punc">,</mml:mo><mml:msup><mml:mrow><mml:mi>V</mml:mi></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msup><mml:mo class="MathClass-rel">&#x02192;</mml:mo><mml:msup><mml:mrow><mml:mi>V</mml:mi></mml:mrow><mml:mrow><mml:mn>3</mml:mn></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">&#x0007D;</mml:mo></mml:mrow></mml:math></inline-formula>. The time-evolution of this network is shown in Figure <xref ref-type="fig" rid="F1">1</xref>B, where the top two rows (processes <italic>X</italic><sup>1</sup> and <italic>Y</italic><sup>1</sup>) are associated with subsystem <italic>V</italic><sup>1</sup>, and similarly for <italic>V</italic><sup>2</sup> and <italic>V</italic><sup>3</sup>. The distributions for the state [equation (<xref ref-type="disp-formula" rid="E5">5</xref>)] and observation [equation (<xref ref-type="disp-formula" rid="E6">6</xref>)] of <italic>M</italic> arbitrary subsystems can therefore be factorized according to equation (<xref ref-type="disp-formula" rid="E1">1</xref>):
<disp-formula id="E7"><label>(7)</label><mml:math id="M57"><mml:msub><mml:mrow><mml:mi>p</mml:mi></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi>B</mml:mi></mml:mrow><mml:mrow><mml:mo class="MathClass-rel">&#x02192;</mml:mo></mml:mrow></mml:msub></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi>z</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow></mml:msub><mml:mn>&#x0007C;</mml:mn><mml:msub><mml:mrow><mml:mi>z</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x0220F;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>M</mml:mi></mml:mrow></mml:munderover></mml:mstyle><mml:msub><mml:mrow><mml:mi>p</mml:mi></mml:mrow><mml:mrow><mml:mi>D</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-bin">&#x022C5;</mml:mo><mml:msub><mml:mrow><mml:mi>p</mml:mi></mml:mrow><mml:mrow><mml:mi>D</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-punc">.</mml:mo></mml:math></disp-formula></p>
<fig id="F1" position="float">
<label>Figure 1</label>
<caption><p><bold>Representation of (A) the synchronous GDS with three vertices (<italic>V</italic><sup>1</sup>, <italic>V</italic><sup>2</sup> and <italic>V</italic><sup>3</sup>), and (B) the rolled-out DBN of the equivalent structure</bold>. Subsystem <italic>V</italic><sup>3</sup> is coupled to both subsystems <italic>V</italic><sup>1</sup> and <italic>V</italic><sup>2</sup> by means of the edges between latent variables <inline-formula><mml:math id="M58"><mml:msubsup><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mn>1</mml:mn></mml:mrow></mml:msubsup><mml:mo class="MathClass-rel">&#x02192;</mml:mo><mml:msubsup><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mn>3</mml:mn></mml:mrow></mml:msubsup></mml:math></inline-formula> and <inline-formula><mml:math id="M59"><mml:msubsup><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msubsup><mml:mo class="MathClass-rel">&#x02192;</mml:mo><mml:msubsup><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mn>3</mml:mn></mml:mrow></mml:msubsup></mml:math></inline-formula>.</p></caption>
<graphic xlink:href="frobt-03-00071-g001.tif"/>
</fig>
<p>In the rest of the paper, we use simplified notation, given this constrained graph structure. First, since our focus is on learning coupling between distributed systems, the superscripts refer to individual <italic>subsystems</italic>, not variables. Thus, although the 2TBN <italic>B</italic><sub>&#x02192;</sub>is constrained such that <inline-formula><mml:math id="M60"><mml:msub><mml:mrow><mml:mn>&#x003A0;</mml:mn></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi>G</mml:mi></mml:mrow><mml:mrow><mml:mo class="MathClass-rel">&#x02192;</mml:mo></mml:mrow></mml:msub></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:msubsup><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula>, the notation <inline-formula><mml:math id="M61"><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula> denotes the <italic>measurement variable</italic> of the <italic>j</italic>th parent of subsystem <italic>i</italic>, e.g., in Figure <xref ref-type="fig" rid="F1">1</xref>, an arbitrary ordering of the parents gives <inline-formula><mml:math id="M62"><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mn>3</mml:mn><mml:mo class="MathClass-punc">,</mml:mo><mml:mn>1</mml:mn></mml:mrow></mml:msubsup><mml:mo>&#x0003D;</mml:mo><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mn>1</mml:mn></mml:mrow></mml:msubsup></mml:math></inline-formula> and <inline-formula><mml:math id="M63"><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mn>3</mml:mn><mml:mo class="MathClass-punc">,</mml:mo><mml:mn>2</mml:mn></mml:mrow></mml:msubsup><mml:mo>&#x0003D;</mml:mo><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msubsup></mml:math></inline-formula>. Second, the scoring functions for the 2TBN network <italic>B</italic><sub>&#x02192;</sub>can be computed independently of the prior network <italic>B</italic><sub>1</sub> (Friedman et al., <xref ref-type="bibr" rid="B8">1998</xref>). We will assume the prior network is given, and focus on learning the 2TBN. As a result, we drop the subscript and note that all references to the network <italic>B</italic> are to the 2TBN. Since <italic>B</italic><sub>&#x02192;</sub>is stationary, learning <italic>B</italic><sub>&#x02192;</sub>is equivalent to learning the synchronous GDS.</p>
</sec>
<sec id="S5">
<label>5</label> <title>Learning Synchronous GDSs from Data</title>
<p>In this section, we develop the theory for learning the synchronous update GDS from data. We will focus on techniques for learning graphical models using the <italic>score and search</italic> paradigm, the objective of which is to find a DAG <italic>G</italic>&#x0002A; that maximizes a score <italic>g</italic>(<italic>B</italic>&#x02009;:&#x02009;<italic>D</italic>). Given such a score, we can then employ established search procedures to find the optimal graph <italic>G</italic>&#x0002A;. Thus, we can state that our main goal is to derive a tractable scoring function <italic>g</italic>(<italic>B</italic> : <italic>D</italic>) for synchronous GDSs that gives a parsimonious model for describing the data.</p>
<p>To derive the score, we use the DBN formulation of synchronous GDSs (Sec. <xref ref-type="sec" rid="S4">4</xref>) to show that we cannot directly compute the posterior probability of the network structure (Sec. <xref ref-type="sec" rid="S5-4">5.1</xref>). By making some assumptions about the system, however, we are able to compute scores for GDSs by use of attractor reconstruction methods (Sec. <xref ref-type="sec" rid="S5-5">5.2</xref>). We conclude this section by giving an interpretation of the log-likelihood in terms of information transfer (Sec. <xref ref-type="sec" rid="S5-6">5.3</xref>).</p>
<sec id="S5-4">
<label>5.1</label> <title>Structure Learning for DBNs</title>
<p>Ideally, we want to be able to compute the posterior probability of the network structure <italic>G</italic>, given data <italic>D</italic>. Using Bayes&#x02019; rule, we can express this distribution as <inline-formula><mml:math id="M64"><mml:mi>p</mml:mi><mml:mfenced separators="" open="(" close=")"><mml:mrow><mml:mi>G</mml:mi><mml:mn>&#x0007C;</mml:mn><mml:mi>D</mml:mi></mml:mrow></mml:mfenced><mml:mo class="MathClass-rel">&#x0221D;</mml:mo><mml:mi>p</mml:mi><mml:mfenced separators="" open="(" close=")"><mml:mrow><mml:mi>D</mml:mi><mml:mn>&#x0007C;</mml:mn><mml:mi>G</mml:mi></mml:mrow></mml:mfenced><mml:mi>p</mml:mi><mml:mfenced separators="" open="(" close=")"><mml:mrow><mml:mi>G</mml:mi></mml:mrow></mml:mfenced></mml:math></inline-formula>, where <italic>p</italic>(<italic>G</italic>) encodes any prior assumptions we want to make about the network <italic>G</italic>. Thus, the problem becomes that of computing the likelihood of the data, given the model, <italic>p</italic>(<italic>D</italic>&#x0007C;<italic>G</italic>). The likelihood can be written in terms of distributions over network parameters (Friedman et al., <xref ref-type="bibr" rid="B8">1998</xref>):
<disp-formula id="E8"><label>(8)</label><mml:math id="M65"><mml:mi>p</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mi>D</mml:mi><mml:mn>&#x0007C;</mml:mn><mml:mi>G</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mo class="MathClass-op">&#x0222B;</mml:mo><mml:mi>p</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mi>D</mml:mi><mml:mn>&#x0007C;</mml:mn><mml:mi>G</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mn>&#x00398;</mml:mn></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mi>p</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mn>&#x00398;</mml:mn><mml:mo>&#x0007C;</mml:mo><mml:mi>G</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mi>d</mml:mi><mml:mn>&#x00398;</mml:mn><mml:mo class="MathClass-punc">,</mml:mo></mml:math></disp-formula>
where we denote <inline-formula><mml:math id="M66"><mml:mi>&#x02113;</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mover accent='true'><mml:mi>&#x00398;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>G</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-punc">:</mml:mo><mml:mi>D</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mtext>log&#x000A0;</mml:mtext><mml:mi>p</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mi>D</mml:mi><mml:mn>&#x0007C;</mml:mn><mml:mi>G</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mover accent='true'><mml:mi>&#x00398;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>G</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:math></inline-formula> as the log-likelihood function for a choice of parameters <inline-formula><mml:math id="M67"><mml:msub><mml:mrow><mml:mover accent='true'><mml:mi>&#x00398;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>G</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> that maximize <italic>p</italic>(<italic>D</italic>&#x0007C;<italic>G</italic>, &#x00398;), given a graph <italic>G</italic>.</p>
<p>A common approach to compute equation (<xref ref-type="disp-formula" rid="E8">8</xref>) in closed form is by using Dirichlet priors. This leads to the BD (Bayesian&#x02013;Dirichlet) score and variants (Heckerman et al., <xref ref-type="bibr" rid="B14">1995</xref>; Friedman et al., <xref ref-type="bibr" rid="B8">1998</xref>). However, to obtain this analytic solution, we require counts of the tuples <inline-formula><mml:math id="M68"><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>z</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mn>&#x003C0;</mml:mn></mml:mrow><mml:mrow><mml:mi>G</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>Z</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:math></inline-formula>, which involve hidden variables. We will instead use Schwarz&#x02019;s (Schwarz, <xref ref-type="bibr" rid="B32">1978</xref>) asymptotic approximation of the posterior distribution, which states that
<disp-formula id="E9"><label>(9)</label><mml:math id="M69"><mml:munder accentunder="true"><mml:mrow><mml:mi mathvariant="italic">lim</mml:mi></mml:mrow><mml:mrow><mml:mi>N</mml:mi><mml:mo class="MathClass-rel">&#x02192;</mml:mo><mml:mo class="MathClass-rel">&#x0221E;</mml:mo></mml:mrow></mml:munder><mml:mtext>log&#x000A0;</mml:mtext><mml:mi>p</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mi>D</mml:mi><mml:mn>&#x0007C;</mml:mn><mml:mi>G</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x02248;</mml:mo><mml:mi>&#x02113;</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mover accent='true'><mml:mi>&#x00398;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>G</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-punc">:</mml:mo><mml:mi>D</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mfrac><mml:mrow><mml:mtext>log&#x000A0;</mml:mtext><mml:mi>N</mml:mi></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:mfrac><mml:mi>C</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mi>G</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mi mathvariant="script">O</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mn>1</mml:mn></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-punc">,</mml:mo></mml:math></disp-formula>
where <italic>C</italic>(<italic>G</italic>) is the model dimension (i.e., number of parameters needed for the graph <italic>G</italic> (Friedman et al., <xref ref-type="bibr" rid="B8">1998</xref>)) and <inline-formula><mml:math id="M70"><mml:mi mathvariant="script">O</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mn>1</mml:mn></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:math></inline-formula> is a constant bounded by the number of potential models. The approximation of the posterior [equation (<xref ref-type="disp-formula" rid="E9">9</xref>)] requires that data come from an exponential family of likelihood functions with conjugate priors over the model <italic>G</italic>, and the parameters given the model <inline-formula><mml:math id="M71"><mml:msub><mml:mrow><mml:mn>&#x00398;</mml:mn></mml:mrow><mml:mrow><mml:mi>G</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> (Schwarz, <xref ref-type="bibr" rid="B32">1978</xref>).</p>
<p>Akaike (<xref ref-type="bibr" rid="B1">1974</xref>) gives a similar criterion by approximating the KL-divergence of any model from the data. We can compute both criteria in terms of the log-likelihood function <inline-formula><mml:math id="M72"><mml:mi>&#x02113;</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mover accent='true'><mml:mi>&#x00398;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>G</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-punc">:</mml:mo><mml:mi>D</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:math></inline-formula> and the model dimension <italic>C</italic>(<italic>G</italic>), and thus the problem can be generalized to that of deriving an information criterion for scoring the graph of the form
<disp-formula id="E10"><label>(10)</label><mml:math id="M73"><mml:mi>g</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mi>B</mml:mi><mml:mo class="MathClass-punc">:</mml:mo><mml:mi>D</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mi>&#x02113;</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mover accent='true'><mml:mi>&#x00398;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>G</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-punc">:</mml:mo><mml:mi>D</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mi>f</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mi>N</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-bin">&#x022C5;</mml:mo><mml:mi>C</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mi>G</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-punc">.</mml:mo></mml:math></disp-formula></p>
<p>When <italic>f</italic> (<italic>N</italic>)&#x02009;&#x0003D;&#x02009;1, we have the AIC score (Akaike, <xref ref-type="bibr" rid="B1">1974</xref>); <italic>f</italic> (<italic>N</italic>)&#x02009;&#x0003D;&#x02009;log (<italic>N</italic>)/2 yields the BIC score (Schwarz, <xref ref-type="bibr" rid="B32">1978</xref>), and <italic>f</italic> (<italic>N</italic>)&#x02009;&#x0003D;&#x02009;0 gives the maximum likelihood score.</p>
</sec>
<sec id="S5-5">
<label>5.2</label> <title>Deriving the Scores for Synchronous GDSs</title>
<p>To calculate the information criterion [equation (<xref ref-type="disp-formula" rid="E10">10</xref>)], we require tractable expressions for the log-likelihood function <inline-formula><mml:math id="M74"><mml:mi>&#x02113;</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mover accent='true'><mml:mi>&#x00398;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>G</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-punc">:</mml:mo><mml:mi>D</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:math></inline-formula> and the model dimension <italic>C</italic>(<italic>G</italic>). The form of the CPD in equation (<xref ref-type="disp-formula" rid="E7">7</xref>) specifies these functions, and for equation (<xref ref-type="disp-formula" rid="E9">9</xref>) to hold, this distribution must come from an exponential family (Schwarz, <xref ref-type="bibr" rid="B32">1978</xref>). We do not assume the underlying model is linear-Gaussian or other known distributions, and thus express the log-likelihood as the maximum likelihood estimate for multinomial distributions (Friedman et al., <xref ref-type="bibr" rid="B8">1998</xref>). From equation (<xref ref-type="disp-formula" rid="E7">7</xref>), the log-likelihood then decomposes as
<disp-formula id="E11"><label>(11)</label><mml:math id="M75"><mml:mtable columnalign="left" class="align"><mml:mtr><mml:mtd columnalign="left" class="align-odd"><mml:mi>&#x02113;</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mover accent='true'><mml:mi>&#x00398;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>G</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-punc">:</mml:mo><mml:mi>D</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mi>N</mml:mi><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>M</mml:mi></mml:mrow></mml:munderover></mml:mstyle><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow></mml:munder></mml:mstyle><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:munder></mml:mstyle><mml:msub><mml:mrow><mml:mi>p</mml:mi></mml:mrow><mml:mrow><mml:mi>D</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mtext>log&#x000A0;</mml:mtext><mml:msub><mml:mrow><mml:mi>p</mml:mi></mml:mrow><mml:mrow><mml:mi>D</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mtd></mml:mtr><mml:mtr><mml:mtd columnalign="left" class="align-odd"><mml:mspace width="5em" class="thinspace"/><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mi>N</mml:mi><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>M</mml:mi></mml:mrow></mml:munderover></mml:mstyle><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow></mml:munder></mml:mstyle><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow></mml:munder></mml:mstyle><mml:msub><mml:mrow><mml:mi>p</mml:mi></mml:mrow><mml:mrow><mml:mi>D</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mtext>log&#x000A0;</mml:mtext><mml:msub><mml:mrow><mml:mi>p</mml:mi></mml:mrow><mml:mrow><mml:mi>D</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula></p>
<p>Note that although we describe the states and observations as discrete in equation (<xref ref-type="disp-formula" rid="E11">11</xref>), we assume the data are generated by a continuous and stationary process. In theory, it is conceivable to have access to an infinite dataset containing realizations of all potential states and observations. In practice, we have a limited dataset and therefore must implement a discretization scheme. Modeling the dynamical systems with non-parametric techniques requires that the number of parameters scales linearly in the size of the data, and thus <italic>C</italic>(<italic>G</italic>) scales linearly with <italic>N</italic>. Instead, later, we will assume the observation data are discretized, such that there are <inline-formula><mml:math id="M76"><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mn>&#x0007C;</mml:mn></mml:math></inline-formula> possible outcomes for an observed random variable <inline-formula><mml:math id="M77"><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula>.</p>
<p>The log-likelihood function [equation (<xref ref-type="disp-formula" rid="E11">11</xref>)] involves distributions over latent variables, and thus we resort to state-space (attractor) reconstruction. First, Lemma 1 shows that a future observation from a given subsystem can be predicted from a sequence of past observations. Building on this result, we present a computable formulation of the 2TBN distribution <inline-formula><mml:math id="M78"><mml:msub><mml:mrow><mml:mi>p</mml:mi></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi>B</mml:mi></mml:mrow><mml:mrow><mml:mo class="MathClass-rel">&#x02192;</mml:mo></mml:mrow></mml:msub></mml:mrow></mml:msub></mml:math></inline-formula>(<italic><bold>z</bold></italic><sub><italic>n</italic>&#x0002B;1</sub>&#x0007C;<italic><bold>z</bold><sub>n</sub></italic>) via Lemma 2. We then derive a tractable form of the log-likelihood function, presented in Lemma 1. It is then shown in Theorem 2 that these lemmas allow us to compute the information criterion equation (<xref ref-type="disp-formula" rid="E10">10</xref>).</p>
<p>Lemma 1. <italic>Consider a synchronous GDS</italic> (<italic>G</italic>, <italic><bold>x</bold><sub>n</sub></italic>, <italic><bold>y</bold><sub>n</sub></italic>, {<italic>f<sup>i</sup></italic>}, {<italic>&#x003C8;<sup>i</sup></italic>}), <italic>where the graph G is a DAG</italic>. <italic>Each subsystem state follows the dynamics</italic> <inline-formula><mml:math id="M79"><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:math></inline-formula> <italic>and emits an observation</italic> <inline-formula><mml:math id="M80"><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:math></inline-formula><italic>; the subsystem observation can be estimated, for some map</italic> <bold>G</bold><italic><sup>i</sup></italic>, <italic>by</italic>
<disp-formula id="E12"><label>(12)</label><mml:math id="M81"><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:msup><mml:mrow><mml:mi mathvariant="bold">G</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mfenced separators="" open="(" close=")"><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:mfenced><mml:mo class="MathClass-punc">.</mml:mo></mml:math></disp-formula>
Proof. Consider a forced system <italic><bold>x</bold><sub>n</sub></italic><sub>&#x0002B;1</sub>&#x02009;&#x0003D;&#x02009;<italic>f</italic>(<italic><bold>x</bold><sub>n</sub></italic>, <italic>w<sub>n</sub></italic>) with forcing dynamics <italic><bold>w</bold><sub>n</sub></italic><sub>&#x0002B;1</sub> &#x0003D; <italic>h</italic>(<italic><bold>w</bold><sub>n</sub></italic>) and observation <italic>y<sub>n</sub></italic>&#x02009;&#x0003D;&#x02009;<italic>&#x003C8;</italic>(<italic><bold>x</bold><sub>n</sub></italic><sub>&#x0002B;1</sub>). Given this type of forced system, the bundle delay embedding theorem (Stark, <xref ref-type="bibr" rid="B34">1999</xref>; Stark et al., <xref ref-type="bibr" rid="B35">2003</xref>) states that the delay map <inline-formula><mml:math id="M82"><mml:msub><mml:mrow><mml:mi mathvariant="bold">&#x003A6;</mml:mi></mml:mrow><mml:mrow><mml:mi>f</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mi>h</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mn>&#x003C8;</mml:mn></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi mathvariant="bold-italic">x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mi mathvariant="bold-italic">w</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:math></inline-formula> is an embedding for generic <italic>f</italic>, <italic>&#x003C8;</italic>, and <italic>h</italic>. Stark (<xref ref-type="bibr" rid="B34">1999</xref>) proved this result in the case of forcing dynamics <italic>h</italic> that are independent of the state <italic>x</italic>.<xref ref-type="fn" rid="fn1"><sup>1</sup></xref> For notational simplicity, we omit dependence on the noise process for the map <inline-formula><mml:math id="M83"><mml:msub><mml:mi mathvariant="bold">&#x003A6;</mml:mi><mml:mrow><mml:mi>f</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mi>h</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mn>&#x003C8;</mml:mn></mml:mrow></mml:msub></mml:math></inline-formula>; the noise can be considered an additional forcing system so long as &#x003C5;<italic><sub>f</sub></italic> is i.i.d and <inline-formula><mml:math id="M84"><mml:msub><mml:mrow><mml:mn>&#x003C5;</mml:mn></mml:mrow><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow></mml:msub></mml:math></inline-formula> is either i.i.d or dependent on the state (Stark et al., <xref ref-type="bibr" rid="B35">2003</xref>).</p>
<p>Given a DAG <italic>G</italic>, any ancestor of the subsystem <italic>V<sup>&#x02009;i</sup></italic> is not dependent on <italic>V<sup>&#x02009;i</sup></italic>. As such, the sequence
<disp-formula id="E13"><label>(13)</label><mml:math id="M85"><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:msub><mml:mrow><mml:mi mathvariant="bold">&#x003A6;</mml:mi></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-punc">,</mml:mo><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msub><mml:mfenced separators="" open="(" close=")"><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:mfenced></mml:math></disp-formula>
is an embedding, since <inline-formula><mml:math id="M86"><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> is independent of <inline-formula><mml:math id="M87"><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula>. Let <inline-formula><mml:math id="M88"><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ijk</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>k</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> be the index-ordered set of parents of node <inline-formula><mml:math id="M89"><mml:msubsup><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula> (which itself is the <italic>j</italic>th parent of the node <inline-formula><mml:math id="M90"><mml:msubsup><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:math></inline-formula>). Under the constraint that <italic>G</italic> is a DAG, where the state <inline-formula><mml:math id="M91"><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:msub><mml:mrow><mml:mn>&#x003C5;</mml:mn></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msub></mml:math></inline-formula>, it follows from the bundle delay embedding theorem (Stark, <xref ref-type="bibr" rid="B34">1999</xref>; Stark et al., <xref ref-type="bibr" rid="B35">2003</xref>) that there exists a map <bold>F</bold><italic><sup>i</sup></italic> that is well defined and a diffeomorphism between observation sequences. From equation (<xref ref-type="disp-formula" rid="E13">13</xref>), we can write this map
<disp-formula id="E14"><label>(14)</label><mml:math id="M92"><mml:mtable columnalign="left" class="align"><mml:mtr><mml:mtd columnalign="left" class="align-odd"><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:msub><mml:mrow><mml:mi mathvariant="bold">&#x003A6;</mml:mi></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-punc">,</mml:mo><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msub><mml:mfenced separators="" open="(" close=")"><mml:mrow><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mfenced separators="" open="(" close=")"><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:mfenced><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mfenced separators="" open="&#x027E8;" close="&#x027E9;"><mml:mrow><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup><mml:mfenced separators="" open="(" close=")"><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ijk</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>k</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:mfenced></mml:mrow></mml:mfenced></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:mfenced></mml:mtd></mml:mtr><mml:mtr><mml:mtd columnalign="left" class="align-label"><mml:mspace width="2.5em"/><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:msub><mml:mrow><mml:mi mathvariant="bold">&#x003A6;</mml:mi></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-punc">,</mml:mo><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msub><mml:mfenced separators="" open="(" close=")"><mml:mrow><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mfenced separators="" open="(" close=")"><mml:mrow><mml:mrow><mml:msubsup><mml:mi mathvariant="bold">&#x003A6;</mml:mi><mml:mrow><mml:msup><mml:mi>f</mml:mi><mml:mi>i</mml:mi></mml:msup><mml:mo>,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mo>&#x027E8;</mml:mo><mml:mrow><mml:msup><mml:mi>f</mml:mi><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo>&#x027E9;</mml:mo></mml:mrow></mml:mrow><mml:mi>j</mml:mi></mml:msub><mml:mo>,</mml:mo><mml:msup><mml:mi>&#x003C8;</mml:mi><mml:mi>i</mml:mi></mml:msup></mml:mrow><mml:mrow><mml:mo>&#x02212;</mml:mo><mml:mn>1</mml:mn></mml:mrow></mml:msubsup></mml:mrow><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mfenced separators="" open="&#x027E8;" close="&#x027E9;"><mml:mrow><mml:msubsup><mml:mi mathvariant="bold">&#x003A6;</mml:mi><mml:mrow><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ijk</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>k</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-punc">,</mml:mo><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mrow><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mn>1</mml:mn></mml:mrow></mml:msubsup><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:mfenced></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:mfenced></mml:mrow></mml:mfenced><mml:mo class="MathClass-punc">.</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula></p>
<p>Denote the RHS of equation (<xref ref-type="disp-formula" rid="E14">14</xref>) as <inline-formula><mml:math id="M93"><mml:msup><mml:mrow><mml:mi mathvariant="bold">F</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:math></inline-formula>; the last <inline-formula><mml:math id="M94"><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:msub><mml:mrow><mml:mo class="MathClass-op">&#x02211;</mml:mo></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup></mml:math></inline-formula> components of <bold>F</bold><italic><sup>i</sup></italic> are trivial. Denote the first component as <inline-formula><mml:math id="M95"><mml:msup><mml:mrow><mml:mi mathvariant="bold">G</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mo class="MathClass-punc">:</mml:mo><mml:msup><mml:mrow><mml:mi mathvariant="double-struck">R</mml:mi></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msup><mml:msub><mml:mrow><mml:mo class="MathClass-bin">&#x000D7;</mml:mo></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub><mml:msup><mml:mrow><mml:mi mathvariant="double-struck">R</mml:mi></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msup><mml:mo class="MathClass-rel">&#x02192;</mml:mo><mml:mi mathvariant="double-struck">R</mml:mi></mml:math></inline-formula>, then we arrive at equation (<xref ref-type="disp-formula" rid="E12">12</xref>).</p>
<p>Lemma 2. <italic>Given an observed dataset D</italic>&#x02009;&#x0003D;&#x02009;(<italic><bold>y</bold></italic><sub>1</sub>, <italic><bold>y</bold></italic><sub>2</sub>, &#x02026;, <italic><bold>y</bold><sub>N</sub></italic>) <italic>where</italic> <inline-formula><mml:math id="M96"><mml:mrow><mml:msub><mml:mi mathvariant="bold-italic">y</mml:mi><mml:mi>n</mml:mi></mml:msub><mml:mo>&#x02208;</mml:mo><mml:msub><mml:mi mathvariant="double-struck">R</mml:mi><mml:mrow><mml:mi>M</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:math></inline-formula> <italic>are generated by a directed and acyclic synchronous GDS</italic> <inline-formula><mml:math id="M97"><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mi>G</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mi mathvariant="bold-italic">x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mi mathvariant="bold-italic">y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">&#x0007B;</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">&#x0007D;</mml:mo></mml:mrow><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">&#x0007B;</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">&#x0007D;</mml:mo></mml:mrow></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:math></inline-formula>, <italic>the 2TBN distribution can be written as</italic>
<disp-formula id="E15"><label>(15)</label><mml:math id="M98"><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x0220F;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>M</mml:mi></mml:mrow></mml:munderover></mml:mstyle><mml:msub><mml:mrow><mml:mi>p</mml:mi></mml:mrow><mml:mrow><mml:mi>D</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-bin">&#x022C5;</mml:mo><mml:msub><mml:mrow><mml:mi>p</mml:mi></mml:mrow><mml:mrow><mml:mi>D</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mfrac><mml:mrow><mml:msubsup><mml:mrow><mml:mo class="MathClass-op">&#x0220F;</mml:mo></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>M</mml:mi></mml:mrow></mml:msubsup><mml:msub><mml:mrow><mml:mi>p</mml:mi></mml:mrow><mml:mrow><mml:mi>D</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi>p</mml:mi></mml:mrow><mml:mrow><mml:mi>D</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mn>&#x0007C;</mml:mn><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:mfrac><mml:mo class="MathClass-punc">.</mml:mo></mml:math></disp-formula>
Proof. The generalized time delay embedding theorem (Deyle and Sugihara, <xref ref-type="bibr" rid="B7">2011</xref>) states that, under certain technical assumptions, and given <italic>M</italic> inhomogeneous observation functions <inline-formula><mml:math id="M99"><mml:mrow><mml:mo class="MathClass-open">&#x0007B;</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mn>1</mml:mn></mml:mrow></mml:msup><mml:mo class="MathClass-punc">,</mml:mo><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msup><mml:mo class="MathClass-punc">,</mml:mo><mml:mo class="MathClass-op">&#x02026;</mml:mo><mml:mo class="MathClass-punc">,</mml:mo><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mi>M</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">&#x0007D;</mml:mo></mml:mrow></mml:math></inline-formula>, the map
<disp-formula id="E16"><label>(16)</label><mml:math id="M100"><mml:msub><mml:mrow><mml:mi mathvariant="bold">&#x003A6;</mml:mi></mml:mrow><mml:mrow><mml:mi>f</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mn>&#x003C8;</mml:mn></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mi mathvariant="bold-italic">x</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msub><mml:mrow><mml:mi mathvariant="bold">&#x003A6;</mml:mi></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mn>1</mml:mn></mml:mrow></mml:msup><mml:mo class="MathClass-punc">,</mml:mo><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mn>1</mml:mn></mml:mrow></mml:msup></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mi mathvariant="bold-italic">x</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mi mathvariant="bold">&#x003A6;</mml:mi></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msup><mml:mo class="MathClass-punc">,</mml:mo><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msup></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mi mathvariant="bold-italic">x</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-punc">,</mml:mo><mml:mo class="MathClass-op">&#x02026;</mml:mo><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mi mathvariant="bold">&#x003A6;</mml:mi></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi>M</mml:mi></mml:mrow></mml:msup><mml:mo class="MathClass-punc">,</mml:mo><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mi>M</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mi mathvariant="bold-italic">x</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:math></disp-formula>
is an embedding where each subsystem (local) map <inline-formula><mml:math id="M101"><mml:msub><mml:mrow><mml:mi mathvariant="bold">&#x003A6;</mml:mi></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mo class="MathClass-punc">,</mml:mo><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msub><mml:mo class="MathClass-punc">:</mml:mo><mml:mi mathvariant="script">M</mml:mi><mml:mo class="MathClass-rel">&#x02192;</mml:mo><mml:msup><mml:mrow><mml:mi mathvariant="double-struck">R</mml:mi></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msup></mml:math></inline-formula>, and, at time index <italic>n</italic> is described by
<disp-formula><mml:math id="M102"><mml:msub><mml:mrow><mml:mi mathvariant="bold">&#x003A6;</mml:mi></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mo class="MathClass-punc">,</mml:mo><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi mathvariant="bold-italic">x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mfenced separators="" open="(" close=")"><mml:mrow><mml:msub><mml:mrow><mml:mi mathvariant="bold-italic">x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:mfenced><mml:mo class="MathClass-punc">,</mml:mo><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi mathvariant="bold-italic">x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:msup><mml:mrow><mml:mn>&#x003C4;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-punc">,</mml:mo><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi mathvariant="bold-italic">x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mn>2</mml:mn><mml:msup><mml:mrow><mml:mn>&#x003C4;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-punc">,</mml:mo><mml:mo class="MathClass-op">&#x02026;</mml:mo><mml:mo class="MathClass-punc">,</mml:mo><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi mathvariant="bold-italic">x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003C4;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:math></disp-formula>
where <inline-formula><mml:math id="M103"><mml:msub><mml:mrow><mml:mo class="MathClass-op">&#x02211;</mml:mo></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msub><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mn>2</mml:mn><mml:mi>d</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:math></inline-formula> (Deyle and Sugihara, <xref ref-type="bibr" rid="B7">2011</xref>).<xref ref-type="fn" rid="fn2"><sup>2</sup></xref> Therefore, the global map equation (<xref ref-type="disp-formula" rid="E16">16</xref>) is given by <inline-formula><mml:math id="M104"><mml:msub><mml:mrow><mml:mi mathvariant="bold">&#x003A6;</mml:mi></mml:mrow><mml:mrow><mml:mi>f</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mn>&#x003C8;</mml:mn></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi mathvariant="bold-italic">x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:math></inline-formula> and there must exist an inverse map <inline-formula><mml:math id="M105"><mml:msub><mml:mrow><mml:mi mathvariant="bold-italic">x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:msubsup><mml:mrow><mml:mi mathvariant="bold">&#x003A6;</mml:mi></mml:mrow><mml:mrow><mml:mi>f</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mn>1</mml:mn></mml:mrow></mml:msubsup><mml:mfenced separators="" open="(" close=")"><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow></mml:mfenced></mml:math></inline-formula>. Given Lemma 1, the existence of <inline-formula><mml:math id="M106"><mml:msubsup><mml:mrow><mml:mi mathvariant="bold">&#x003A6;</mml:mi></mml:mrow><mml:mrow><mml:mi>f</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mn>1</mml:mn></mml:mrow></mml:msubsup></mml:math></inline-formula>, and since <inline-formula><mml:math id="M107"><mml:mo class="MathClass-rel">&#x02200;</mml:mo><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">&#x0007B;</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">&#x0007D;</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x02286;</mml:mo><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:math></inline-formula>, we arrive at the following equation:
<disp-formula id="E17"><label>(17)</label><mml:math id="M108"><mml:mtable columnalign="left" class="align"><mml:mtr><mml:mtd columnalign="left" class="align-odd"><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x0220F;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>M</mml:mi></mml:mrow></mml:munderover></mml:mstyle><mml:msub><mml:mrow><mml:mi>p</mml:mi></mml:mrow><mml:mrow><mml:mi>D</mml:mi></mml:mrow></mml:msub><mml:mfenced separators="" open="(" close=")"><mml:mrow><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:msup><mml:mrow><mml:mi mathvariant="bold">G</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mfenced separators="" open="(" close=")"><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:mfenced><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:mfenced></mml:mtd></mml:mtr><mml:mtr><mml:mtd columnalign="left" class="align-odd"><mml:mspace width="3em" class="thinspace"/><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:msub><mml:mrow><mml:mi>p</mml:mi></mml:mrow><mml:mrow><mml:mi>D</mml:mi></mml:mrow></mml:msub><mml:mfenced separators="" open="(" close=")"><mml:mrow><mml:msub><mml:mrow><mml:mi mathvariant="bold-italic">X</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:msubsup><mml:mi mathvariant="bold">&#x003A6;</mml:mi><mml:mrow><mml:mi>f</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mn>1</mml:mn></mml:mrow></mml:msubsup><mml:mfenced separators="" open="(" close=")"><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow></mml:mfenced><mml:mn>&#x0007C;</mml:mn><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow></mml:mfenced></mml:mtd></mml:mtr><mml:mtr><mml:mtd columnalign="left" class="align-odd"><mml:mspace width="3em" class="thinspace"/><mml:mo class="MathClass-bin">&#x000D7;</mml:mo><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x0220F;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>M</mml:mi></mml:mrow></mml:munderover></mml:mstyle><mml:msub><mml:mrow><mml:mi>p</mml:mi></mml:mrow><mml:mrow><mml:mi>D</mml:mi></mml:mrow></mml:msub><mml:mfenced separators="" open="(" close=")"><mml:mrow><mml:msubsup><mml:mrow><mml:mi>X</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:mfenced></mml:mtd></mml:mtr><mml:mtr><mml:mtd columnalign="left" class="align-odd"><mml:mspace width="3em" class="thinspace"/><mml:mo class="MathClass-bin">&#x000D7;</mml:mo><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x0220F;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>M</mml:mi></mml:mrow></mml:munderover></mml:mstyle><mml:msub><mml:mrow><mml:mi>p</mml:mi></mml:mrow><mml:mrow><mml:mi>D</mml:mi></mml:mrow></mml:msub><mml:mfenced separators="" open="(" close=")"><mml:mrow><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow></mml:mfenced><mml:mo class="MathClass-punc">.</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula></p>
<p>Rearranging equation (<xref ref-type="disp-formula" rid="E17">17</xref>) gives the equality in equation (<xref ref-type="disp-formula" rid="E15">15</xref>).</p>
<p>Lemma 2 shows that the distributions can be reformulated by conditioning on delay vectors. The RHS of equation (<xref ref-type="disp-formula" rid="E15">15</xref>) can be used to perform inference in the 2TBN (7). The numerator is a product of local CPDs of scalar variables, and can thus be computed by either counting (for discrete variables) or density estimation (for continuous variables). The denominator is used to compute the probability that the hidden state occured, given an observed delay vector; fortunately, Casdagli et al. (<xref ref-type="bibr" rid="B4">1991</xref>) established methods to compute this CPDs for a variety of practical scenarios. Therefore, Lemma 2 provides a method to perform exact inference. Using this delay vector representation, we arrive at the following theorem.</p>
<p>Theorem 1. <italic>Consider a synchronous GDS</italic> <inline-formula><mml:math id="M109"><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mi>G</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mi mathvariant="bold-italic">x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mi mathvariant="bold-italic">y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">&#x0007B;</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">&#x0007D;</mml:mo></mml:mrow><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">&#x0007B;</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">&#x0007D;</mml:mo></mml:mrow></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:math></inline-formula>, <italic>where the graph G is a DAG. Each subsystem state follows the dynamics</italic> <inline-formula><mml:math id="M110"><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:msup><mml:mrow><mml:mi>f</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:math></inline-formula> <italic>and generates an observation</italic> <inline-formula><mml:math id="M111"><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:msup><mml:mrow><mml:mn>&#x003C8;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:math></inline-formula><italic>; a complete dataset is given by the sequence of observations D</italic>&#x02009;&#x0003D;&#x02009;(<italic><bold>y</bold></italic><sub>1</sub>, <italic><bold>y</bold></italic><sub>2</sub>, &#x02026;, <italic><bold>y</bold><sub>N</sub></italic>). T<italic>he log-likelihood of the data given a network structure can be computed in terms of conditional entropy:</italic>
<disp-formula id="E18"><label>(18)</label><mml:math id="M112"><mml:mi>&#x02113;</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mover accent='true'><mml:mi>&#x00398;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>G</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-punc">:</mml:mo><mml:mi>D</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mi>N</mml:mi><mml:mo class="MathClass-bin">&#x022C5;</mml:mo><mml:mi>H</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi mathvariant="bold-italic">X</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mn>&#x0007C;</mml:mn><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mi>N</mml:mi><mml:mo class="MathClass-bin">&#x022C5;</mml:mo><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>M</mml:mi></mml:mrow></mml:munderover></mml:mstyle><mml:mi>H</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:math></disp-formula>
Proof. Substituting equation (<xref ref-type="disp-formula" rid="E15">15</xref>) into equation (<xref ref-type="disp-formula" rid="E11">11</xref>) gives the log-likelihood <inline-formula><mml:math id="M113"><mml:mi>&#x02113;</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mover accent='true'><mml:mi>&#x00398;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>G</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-punc">:</mml:mo><mml:mi>D</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:math></inline-formula> as
<disp-formula id="E19"><label>(19)</label><mml:math id="M114"><mml:mtable columnalign="left" class="align"><mml:mtr><mml:mtd columnalign="left" class="align-odd"><mml:mi>N</mml:mi><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>M</mml:mi></mml:mrow></mml:munderover></mml:mstyle><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup></mml:mrow></mml:munder></mml:mstyle><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow></mml:munder></mml:mstyle><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:munder></mml:mstyle><mml:msub><mml:mrow><mml:mi>p</mml:mi></mml:mrow><mml:mrow><mml:mi>D</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-bin">&#x000D7;</mml:mo><mml:mtext>log&#x000A0;</mml:mtext><mml:msub><mml:mrow><mml:mi>p</mml:mi></mml:mrow><mml:mrow><mml:mi>D</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mtd></mml:mtr><mml:mtr><mml:mtd columnalign="left" class="align-odd"><mml:mspace width="3em" class="thinspace"/><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mi>N</mml:mi><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>M</mml:mi></mml:mrow></mml:munderover></mml:mstyle><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi mathvariant="bold">x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:munder></mml:mstyle><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow></mml:munder></mml:mstyle><mml:msub><mml:mrow><mml:mi>p</mml:mi></mml:mrow><mml:mrow><mml:mi>D</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mtext>log&#x000A0;</mml:mtext><mml:msub><mml:mrow><mml:mi>p</mml:mi></mml:mrow><mml:mrow><mml:mi>D</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi>x</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mn>&#x0007C;</mml:mn><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-punc">.</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula></p>
<p>In equation (<xref ref-type="disp-formula" rid="E19">19</xref>), we have removed arguments of the joint distributions that will be nullified when multiplied with the CPD. Expressing equation (<xref ref-type="disp-formula" rid="E19">19</xref>) in terms of conditional entropy [equation (<xref ref-type="disp-formula" rid="E3">3</xref>)], we arrive at equation (<xref ref-type="disp-formula" rid="E18">18</xref>).</p>
<p>Theorem 2. <italic>The information criterion</italic> [equation (<xref ref-type="disp-formula" rid="E10">10</xref>)] <italic>for synchronous GDS can be computed as</italic>:
<disp-formula id="E20"><label>(20)</label><mml:math id="M115"><mml:mtable columnalign="left" class="align"><mml:mtr><mml:mtd columnalign="left" class="align-odd"><mml:mi>g</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mi>B</mml:mi><mml:mo class="MathClass-punc">:</mml:mo><mml:mi>D</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mi>N</mml:mi><mml:mo class="MathClass-bin">&#x022C5;</mml:mo><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>M</mml:mi></mml:mrow></mml:munderover></mml:mstyle><mml:mi>H</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mtd></mml:mtr><mml:mtr><mml:mtd columnalign="left" class="align-odd"><mml:mspace width="3em" class="thinspace"/><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mi>f</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mi>N</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-bin">&#x022C5;</mml:mo><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>M</mml:mi></mml:mrow></mml:munderover></mml:mstyle><mml:mfenced separators="" open="(" close=")"><mml:mrow><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:msup><mml:mrow><mml:mn>&#x0007C;</mml:mn></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msup><mml:mo class="MathClass-bin">&#x022C5;</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mn>&#x0007C;</mml:mn><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-bin">&#x022C5;</mml:mo><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x0220F;</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mi>V</mml:mi></mml:mrow><mml:mrow><mml:mi>p</mml:mi></mml:mrow></mml:msup><mml:mo class="MathClass-rel">&#x02208;</mml:mo><mml:msub><mml:mrow><mml:mn>&#x003A0;</mml:mn></mml:mrow><mml:mrow><mml:mi>G</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mi>V</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:munder></mml:mstyle><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>p</mml:mi></mml:mrow></mml:msubsup><mml:msup><mml:mrow><mml:mn>&#x0007C;</mml:mn></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>p</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msup></mml:mrow></mml:mfenced><mml:mo class="MathClass-punc">.</mml:mo></mml:mtd></mml:mtr></mml:mtable></mml:math></disp-formula>
Proof. The distributions for the first term in equation (<xref ref-type="disp-formula" rid="E18">18</xref>) do not depend on the parents of a subsystem and thus are independent of the graph <italic>G</italic> being considered. Therefore, we have the following equation for maximum log-likelihood:
<disp-formula id="E21"><label>(21)</label><mml:math id="M116"><mml:munder accentunder="true"><mml:mrow><mml:mtext>max&#x000A0;</mml:mtext></mml:mrow><mml:mrow><mml:mi>G</mml:mi></mml:mrow></mml:munder><mml:mi>&#x02113;</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mover accent='true'><mml:mi>&#x00398;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>G</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-punc">:</mml:mo><mml:mi>D</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mi mathvariant="script">O</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mi>N</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mi>N</mml:mi><mml:mo class="MathClass-bin">&#x022C5;</mml:mo><mml:munder accentunder="true"><mml:mrow><mml:mtext>min</mml:mtext></mml:mrow><mml:mrow><mml:mi>G</mml:mi></mml:mrow></mml:munder><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>M</mml:mi></mml:mrow></mml:munderover></mml:mstyle><mml:mi>H</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-punc">.</mml:mo></mml:math></disp-formula></p>
<p>We can now compute the number of parameters needed to specify the model as (Friedman et al., <xref ref-type="bibr" rid="B8">1998</xref>)
<disp-formula id="E22"><label>(22)</label><mml:math id="M117"><mml:mi>C</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mi>G</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>M</mml:mi></mml:mrow></mml:munderover></mml:mstyle><mml:mfenced separators="" open="(" close=")"><mml:mrow><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:msup><mml:mrow><mml:mn>&#x0007C;</mml:mn></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msup><mml:mo class="MathClass-bin">&#x022C5;</mml:mo><mml:mfenced separators="" open="(" close=")"><mml:mrow><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mn>&#x0007C;</mml:mn><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mn>1</mml:mn></mml:mrow></mml:mfenced><mml:mo class="MathClass-bin">&#x022C5;</mml:mo><mml:mstyle displaystyle='true'><mml:munder><mml:mo>&#x0220F;</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mi>V</mml:mi></mml:mrow><mml:mrow><mml:mi>p</mml:mi></mml:mrow></mml:msup><mml:mo class="MathClass-rel">&#x02208;</mml:mo><mml:msub><mml:mrow><mml:mn>&#x003A0;</mml:mn></mml:mrow><mml:mrow><mml:mi>G</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mi>V</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:munder></mml:mstyle><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>p</mml:mi></mml:mrow></mml:msubsup><mml:msup><mml:mrow><mml:mn>&#x0007C;</mml:mn></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>p</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msup></mml:mrow></mml:mfenced><mml:mo class="MathClass-punc">.</mml:mo></mml:math></disp-formula></p>
<p>Since we are searching for the graph <italic>G</italic>&#x0002A;&#x02009;&#x0003D;&#x02009;max<italic><sub>G</sub> g</italic>(<italic>B</italic>&#x02009;:&#x02009;<italic>D</italic>), holding <italic>N</italic> constant, we can substitute equation (<xref ref-type="disp-formula" rid="E21">21</xref>) and equation (<xref ref-type="disp-formula" rid="E22">22</xref>) into equation (<xref ref-type="disp-formula" rid="E10">10</xref>) and ignore the constant term <inline-formula><mml:math id="M118"><mml:mi mathvariant="script">O</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mi>N</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:math></inline-formula> in (21).</p>
</sec>
<sec id="S5-6">
<label>5.3</label> <title>The Log-Likelihood and Information Transfer</title>
<p>To conclude our study of the scores, we look at the log-likelihood in the context of information transfer. First, rearranging the terms of collective transfer entropy [equation (<xref ref-type="disp-formula" rid="E4">4</xref>)], we can rewrite the log-likelihood function [equation (<xref ref-type="disp-formula" rid="E18">18</xref>)], leading to the following result.</p>
<p>Proposition 1. <italic>The log-likelihood function for the synchronous GDS</italic> [equation (<xref ref-type="disp-formula" rid="E18">18</xref>)] <italic>decomposes as follows</italic>:
<disp-formula id="E23"><label>(23)</label><mml:math id="M119"><mml:mi>&#x02113;</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mover accent='true'><mml:mi>&#x00398;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>G</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-punc">:</mml:mo><mml:mi>D</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mi>N</mml:mi><mml:mo class="MathClass-bin">&#x022C5;</mml:mo><mml:mi>H</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi mathvariant="bold-italic">X</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow></mml:msub><mml:mn>&#x0007C;</mml:mn><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mi>N</mml:mi><mml:mo class="MathClass-bin">&#x022C5;</mml:mo><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>M</mml:mi></mml:mrow></mml:munderover></mml:mstyle><mml:mi>H</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msubsup><mml:mn>&#x0007C;</mml:mn><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-bin">&#x0002B;</mml:mo><mml:mi>N</mml:mi><mml:mo class="MathClass-bin">&#x022C5;</mml:mo><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>M</mml:mi></mml:mrow></mml:munderover><mml:msub><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-rel">&#x02192;</mml:mo><mml:msup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msub><mml:mo class="MathClass-punc">.</mml:mo></mml:mstyle></mml:math></disp-formula></p>
<p>Again, the first two terms in equation (<xref ref-type="disp-formula" rid="E23">23</xref>) do not depend on the proposed graph structure, and thus maximizing log-likelihood is equivalent to maximizing collective transfer entropy. This becomes clear when we consider the <italic>log-likelihood ratio</italic>. This ratio quantifies the gain in likelihood by modeling the data <italic>D</italic> by a candidate network <italic>B</italic> instead of the empty network <inline-formula><mml:math id="M120"><mml:msub><mml:mrow><mml:mi>B</mml:mi></mml:mrow><mml:mrow><mml:mi>&#x02205;</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula>, i.e.,
<disp-formula><mml:math id="M121"><mml:mi>&#x02113;</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mover accent='true'><mml:mi>&#x00398;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>G</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-punc">:</mml:mo><mml:mi>D</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mi>&#x02113;</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mover accent='true'><mml:mi>&#x00398;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi>G</mml:mi></mml:mrow><mml:mrow><mml:mi>&#x02205;</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:msub><mml:mo class="MathClass-punc">:</mml:mo><mml:mi>D</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x0221D;</mml:mo><mml:mtext>log&#x000A0;</mml:mtext><mml:mfrac><mml:mrow><mml:mi>p</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:mi>B</mml:mi><mml:mn>&#x0007C;</mml:mn><mml:mi>D</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow><mml:mrow><mml:mi>p</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mi>B</mml:mi></mml:mrow><mml:mrow><mml:mi>&#x02205;</mml:mi></mml:mrow></mml:msub><mml:mn>&#x0007C;</mml:mn><mml:mi>D</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:mfrac><mml:mo class="MathClass-punc">.</mml:mo></mml:math></disp-formula></p>
<p>Recall that the empty DAG <inline-formula><mml:math id="M122"><mml:msub><mml:mrow><mml:mi>G</mml:mi></mml:mrow><mml:mrow><mml:mi>&#x02205;</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> is one with no parents for all vertices <inline-formula><mml:math id="M123"><mml:mo class="MathClass-rel">&#x02200;</mml:mo><mml:mi>i</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:msub><mml:mrow><mml:mn>&#x003A0;</mml:mn></mml:mrow><mml:mrow><mml:mi>G</mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mi>V</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msubsup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>n</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi><mml:mo class="MathClass-punc">,</mml:mo><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msup><mml:mrow><mml:mn>&#x003BA;</mml:mn></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow></mml:mrow></mml:msubsup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mi>&#x02205;</mml:mi></mml:math></inline-formula>. Substituting this definition into equation (<xref ref-type="disp-formula" rid="E18">18</xref>) [or, alternatively equation (<xref ref-type="disp-formula" rid="E23">23</xref>)] gives the following result.</p>
<p>Proposition 2. <italic>The ratio of the log-likelihood</italic> [equation (<xref ref-type="disp-formula" rid="E18">18</xref>)] <italic>of a candidate DAG G to the empty network</italic> <inline-formula><mml:math id="M124"><mml:msub><mml:mrow><mml:mi>G</mml:mi></mml:mrow><mml:mrow><mml:mi>&#x02205;</mml:mi></mml:mrow></mml:msub></mml:math></inline-formula> <italic>can be expressed as</italic>
<disp-formula><mml:math id="M125"><mml:mi>&#x02113;</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mover accent='true'><mml:mi>&#x00398;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:mi>G</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-punc">:</mml:mo><mml:mi>D</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-bin">&#x02212;</mml:mo><mml:mi>&#x02113;</mml:mi><mml:mrow><mml:mo class="MathClass-open">(</mml:mo><mml:mrow><mml:msub><mml:mrow><mml:mover accent='true'><mml:mi>&#x00398;</mml:mi><mml:mo>&#x0005E;</mml:mo></mml:mover></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mi>G</mml:mi></mml:mrow><mml:mrow><mml:mi>&#x02205;</mml:mi></mml:mrow></mml:msub></mml:mrow></mml:msub><mml:mo class="MathClass-punc">:</mml:mo><mml:mi>D</mml:mi></mml:mrow><mml:mo class="MathClass-close">)</mml:mo></mml:mrow><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mi>N</mml:mi><mml:mo class="MathClass-bin">&#x022C5;</mml:mo><mml:mstyle displaystyle='true'><mml:munderover><mml:mo>&#x02211;</mml:mo><mml:mrow><mml:mi>i</mml:mi><mml:mo class="MathClass-rel">&#x0003D;</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>M</mml:mi></mml:mrow></mml:munderover></mml:mstyle><mml:msub><mml:mrow><mml:mi>T</mml:mi></mml:mrow><mml:mrow><mml:msub><mml:mrow><mml:mrow><mml:mn>&#x027E8;</mml:mn><mml:mrow><mml:msup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi mathvariant="italic">ij</mml:mi></mml:mrow></mml:msup></mml:mrow><mml:mn>&#x027E9;</mml:mn></mml:mrow></mml:mrow><mml:mrow><mml:mi>j</mml:mi></mml:mrow></mml:msub><mml:mo class="MathClass-rel">&#x02192;</mml:mo><mml:msup><mml:mrow><mml:mi>Y</mml:mi></mml:mrow><mml:mrow><mml:mi>i</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:msub><mml:mo class="MathClass-punc">.</mml:mo></mml:math></disp-formula></p>
</sec>
</sec>
<sec id="S6" sec-type="discussion">
<label>6</label> <title>Discussion and Future Work</title>
<p>We have presented a principled method to score the structure of non-linear dynamical networks, where dynamical units are coupled via a DAG. We approached the problem by modeling the time evolution of a synchronous GDS as a DBN. We then derived the AIC and BIC scoring functions for the DBN based on time delay embedding theorems. Finally, we have shown that the log-likelihood of the synchronous GDS can be interpreted in the context of information transfer.</p>
<p>The representation of synchronous GDSs as DBNs allows for inference of coupling in dynamical networks and facilitates techniques for synthesis in these systems. DBNs are an expressive framework that allows representation of generic systems, as well as a numerous general purpose inference techniques that can be used for filtering, prediction, and smoothing (Friedman et al., <xref ref-type="bibr" rid="B8">1998</xref>). Our representation therefore allows for probabilistic reasoning for purposes of planning and prediction in complex systems.</p>
<p>Theorem 2 captures an interesting parallel between learning from complete data and learning non-linear dynamical networks. If the embedding dimension <italic>&#x003BA;</italic> and time delay <italic>&#x003C4;</italic> are unity, then the information criterion becomes identical to learning a DBN from complete data (Friedman et al., <xref ref-type="bibr" rid="B8">1998</xref>). Thus, our result could be considered a generalization of typical structure learning procedures.</p>
<p>The results presented here provoke new insights into the concepts of structure learning, non-linear time series analysis, and effective network analysis (Sporns et al., <xref ref-type="bibr" rid="B33">2004</xref>; Park and Friston, <xref ref-type="bibr" rid="B27">2013</xref>) based on information transfer (Honey et al., <xref ref-type="bibr" rid="B16">2007</xref>; Lizier et al., <xref ref-type="bibr" rid="B22">2011</xref>; Cliff et al., <xref ref-type="bibr" rid="B6">2013</xref>, <xref ref-type="bibr" rid="B43">2016</xref>). The information-theoretic interpretation of the log-likelihood has interesting consequences in the context of information dynamics and information thermodynamics of non-linear dynamical networks. The transfer entropy terms in Propositions 1 and 2 show that the optimal structure of a synchronous GDS is immediately related to the information processing of distributed computation (Lizier et al., <xref ref-type="bibr" rid="B23">2008</xref>), as well as the thermodynamic costs of information transfer (Prokopenko and Lizier, <xref ref-type="bibr" rid="B29">2014</xref>).</p>
<p>In the future, we aim to perform empirical studies to exemplify the properties of the presented scoring functions. Specifically, the empirical studies should yield insight into the effect of weak, moderate and strong coupling between dynamical units. An important concept to consider in stochastic systems is the convergence of the shadow (reconstructed) manifold to the true manifold (Sugihara et al., <xref ref-type="bibr" rid="B36">2012</xref>); we have implicitly accounted for this phenomena by using CPDs in our model, however, it is important to investigate the property of convergence with different density estimation techniques. In addition, we are interested in the effect of synchrony in these networks and the relationship to previous results for dynamical systems coupled by spanning trees (Wu, <xref ref-type="bibr" rid="B41">2005</xref>). We conjecture that approach used here will allow us to derive scoring functions without the assumption of multinomial observations, and thus afford the use of non-parametric density estimators. Parametric techniques, such as learning the parameters of dynamical systems (Ghahramani and Roweis, <xref ref-type="bibr" rid="B11">1999</xref>; Hefny et al., <xref ref-type="bibr" rid="B15">2015</xref>), could be considered in place of the posterior approximations.</p>
<p>Finally, the reconstruction theorems used in this paper typically make the assumption that the map (or flow) is a diffeomorphism (invertible in time). Thus, given any state, the past and future are uniquely determined and the time delay <italic>&#x003C4;</italic> can be taken positive or negative. In certain cases, however, the time-reversed system is acausal, giving a map that is not time-invertible (an endomorphism). Ideally, we would aim to have methods to infer coupling for both endomorphisms and diffeomorphisms. Takens (<xref ref-type="bibr" rid="B38">2002</xref>) showed that if the map is an endomorphism, taking the delay vector of temporally <italic>previous</italic> observations forms an embedding. The generalized theorems in Stark (<xref ref-type="bibr" rid="B34">1999</xref>), Stark et al. (<xref ref-type="bibr" rid="B35">2003</xref>), and Deyle and Sugihara (<xref ref-type="bibr" rid="B7">2011</xref>), however, were established for diffeomorphisms, rather than endomorphisms; we can only conjecture that taking a delay of past observations (as we have done throughout this paper) follows for these results. Empirical studies using the measures presented in this paper would indicate whether it is an important line of inquiry to prove the generalized reconstruction theorems for endomorphisms.</p>
</sec>
<sec id="S7">
<title>Author Contributions</title>
<p>OC co-wrote the manuscript, derived and proved the theorems, lemmas, and propositions. MP co-wrote the manuscript, assisted with the proofs, and supervised. RF co-wrote the manuscript, assisted with the proofs, and supervised.</p>
</sec>
<sec id="S8">
<title>Conflict of Interest Statement</title>
<p>The authors declare that the research was conducted in the absence of any commercial or financial relationships that could be construed as a potential conflict of interest.</p>
</sec>
</body>
<back>
<ack>
<p>We would like to thank Joseph Lizier, J&#x000FC;rgen Jost, and Wolfram Martens for many helpful discussions, particularly in regards to embedding theory. This work was supported in part by the Australian Centre for Field Robotics; the New South Wales Government; and the Faculty of Engineering &#x00026; Information Technologies, The University of Sydney, under the Faculty Research Cluster Program.</p>
</ack>
<ref-list>
<title>References</title>
<ref id="B1"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Akaike</surname> <given-names>H.</given-names></name></person-group> (<year>1974</year>). <article-title>A new look at the statistical model identification</article-title>. <source>IEEE Trans. Automat. Contr.</source> <volume>19</volume>, <fpage>716</fpage>&#x02013;<lpage>723</lpage>.<pub-id pub-id-type="doi">10.1109/TAC.1974.1100705</pub-id></citation></ref>
<ref id="B2"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Boccaletti</surname> <given-names>S.</given-names></name> <name><surname>Latora</surname> <given-names>V.</given-names></name> <name><surname>Moreno</surname> <given-names>Y.</given-names></name> <name><surname>Chavez</surname> <given-names>M.</given-names></name> <name><surname>Hwang</surname> <given-names>D.-U.</given-names></name></person-group> (<year>2006</year>). <article-title>Complex networks: structure and dynamics</article-title>. <source>Phys. Rep.</source> <volume>424</volume>, <fpage>175</fpage>&#x02013;<lpage>308</lpage>.<pub-id pub-id-type="doi">10.1016/j.physrep.2005.10.009</pub-id></citation></ref>
<ref id="B3"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Bouckaert</surname> <given-names>R. R.</given-names></name></person-group> (<year>1994</year>). <article-title>&#x0201C;Properties of Bayesian belief network learning algorithms,&#x0201D;</article-title> in <source>Proc. of AUAI UAI</source> (<publisher-loc>Seattle, WA</publisher-loc>), <fpage>102</fpage>&#x02013;<lpage>109</lpage>.</citation></ref>
<ref id="B4"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Casdagli</surname> <given-names>M.</given-names></name> <name><surname>Eubank</surname> <given-names>S.</given-names></name> <name><surname>Farmer</surname> <given-names>J. D.</given-names></name> <name><surname>Gibson</surname> <given-names>J.</given-names></name></person-group> (<year>1991</year>). <article-title>State space reconstruction in the presence of noise</article-title>. <source>Physica D</source> <volume>51</volume>, <fpage>52</fpage>&#x02013;<lpage>98</lpage>.<pub-id pub-id-type="doi">10.1016/0167-2789(91)90222-U</pub-id></citation></ref>
<ref id="B5"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Chickering</surname> <given-names>D. M.</given-names></name></person-group> (<year>2002</year>). <article-title>Learning equivalence classes of Bayesian-network structures</article-title>. <source>J. Mach. Learn. Res.</source> <volume>2</volume>, <fpage>445</fpage>&#x02013;<lpage>498</lpage>.</citation></ref>
<ref id="B43"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Cliff</surname> <given-names>O. M.</given-names></name> <name><surname>Lizier</surname> <given-names>J. T.</given-names></name> <name><surname>Wang</surname> <given-names>P.</given-names></name> <name><surname>Wang</surname> <given-names>X. R.</given-names></name> <name><surname>Obst</surname> <given-names>O.</given-names></name> <name><surname>Prokopenko</surname> <given-names>M.</given-names></name></person-group> (<year>2016</year>). <article-title>Delayed spatio-temporal interactions and coherent structure in multi-agent team dynamics</article-title>. <source>Art. Life.</source> <volume>23</volume>, <fpage>1&#x02013;24</fpage>.<pub-id pub-id-type="doi">10.1162/ARTL_a_00221</pub-id></citation></ref>
<ref id="B6"><citation citation-type="book"><person-group person-group-type="author"><name><surname>Cliff</surname> <given-names>O. M.</given-names></name> <name><surname>Lizier</surname> <given-names>J. T.</given-names></name> <name><surname>Wang</surname> <given-names>X. R.</given-names></name> <name><surname>Wang</surname> <given-names>P.</given-names></name> <name><surname>Obst</surname> <given-names>O.</given-names></name> <name><surname>Prokopenko</surname> <given-names>M.</given-names></name></person-group> (<year>2013</year>). <article-title>&#x0201C;Towards quantifying interaction networks in a football match,&#x0201D;</article-title> in <source>RoboCup 2013: Robot World Cup XVII</source>, eds <person-group person-group-type="editor"><name><surname>Behnke</surname> <given-names>S.</given-names></name> <name><surname>Veloso</surname> <given-names>M.</given-names></name> <name><surname>Visser</surname> <given-names>A.</given-names></name> <name><surname>Xiong</surname> <given-names>R.</given-names></name></person-group> (<publisher-loc>Berlin, Heidelberg</publisher-loc>: <publisher-name>Springer-Verlag</publisher-name>), <fpage>1</fpage>&#x02013;<lpage>13</lpage>.</citation></ref>
<ref id="B7"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Deyle</surname> <given-names>E. R.</given-names></name> <name><surname>Sugihara</surname> <given-names>G.</given-names></name></person-group> (<year>2011</year>). <article-title>Generalized theorems for nonlinear state space reconstruction</article-title>. <source>PLoS ONE</source> <volume>6</volume>:<fpage>e18295</fpage>.<pub-id pub-id-type="doi">10.1371/journal.pone.0018295</pub-id></citation></ref>
<ref id="B8"><citation citation-type="book"><person-group person-group-type="author"><name><surname>Friedman</surname> <given-names>N.</given-names></name> <name><surname>Murphy</surname> <given-names>K.</given-names></name> <name><surname>Russell</surname> <given-names>S.</given-names></name></person-group> (<year>1998</year>). <article-title>&#x0201C;Learning the structure of dynamic probabilistic networks,&#x0201D;</article-title> in <source>Proc. of AUAI UAI</source> (<publisher-loc>Madison, WI</publisher-loc>), <fpage>139</fpage>&#x02013;<lpage>147</lpage>.</citation></ref>
<ref id="B9"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Gan</surname> <given-names>S. K.</given-names></name> <name><surname>Fitch</surname> <given-names>R.</given-names></name> <name><surname>Sukkarieh</surname> <given-names>S.</given-names></name></person-group> (<year>2014</year>). <article-title>Online decentralized information gathering with spatial&#x02013;temporal constraints</article-title>. <source>Auton. Robots</source> <volume>37</volume>, <fpage>1</fpage>&#x02013;<lpage>25</lpage>.<pub-id pub-id-type="doi">10.1007/s10514-013-9369-5</pub-id></citation></ref>
<ref id="B10"><citation citation-type="book"><person-group person-group-type="author"><name><surname>Ghahramani</surname> <given-names>Z.</given-names></name></person-group> (<year>1998</year>). <article-title>&#x0201C;Learning dynamic Bayesian networks,&#x0201D;</article-title> in <source>Adaptive Processing of Sequences and Data Structures, Volume 1387 of Lecture Notes in Comp. Sci</source>, eds <person-group person-group-type="editor"><name><surname>Giles</surname> <given-names>C. L.</given-names></name> <name><surname>Gori</surname> <given-names>M.</given-names></name></person-group> (<publisher-loc>Vietri sul Mare</publisher-loc>: <publisher-name>Springer-Verlag</publisher-name>), <fpage>168</fpage>&#x02013;<lpage>197</lpage>.</citation></ref>
<ref id="B11"><citation citation-type="book"><person-group person-group-type="author"><name><surname>Ghahramani</surname> <given-names>Z.</given-names></name> <name><surname>Roweis</surname> <given-names>S. T.</given-names></name></person-group> (<year>1999</year>). <article-title>&#x0201C;Learning nonlinear dynamical systems using an EM algorithm,&#x0201D;</article-title> in <source>Advances in Neural Information Processing Systems 11</source>, eds <person-group person-group-type="editor"><name><surname>Kearns</surname> <given-names>M. J.</given-names></name> <name><surname>Solla</surname> <given-names>S. A.</given-names></name> <name><surname>Cohn</surname> <given-names>D. A.</given-names></name></person-group> (<publisher-loc>Cambridge, MA</publisher-loc>: <publisher-name>MIT Press</publisher-name>), <fpage>431</fpage>&#x02013;<lpage>437</lpage>.</citation></ref>
<ref id="B12"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Granger</surname> <given-names>C. W.</given-names></name></person-group> (<year>1969</year>). <article-title>Investigating causal relations by econometric models and cross-spectral methods</article-title>. <source>Econometrica</source> <volume>37</volume>, <fpage>424</fpage>&#x02013;<lpage>438</lpage>.<pub-id pub-id-type="doi">10.2307/1912791</pub-id></citation></ref>
<ref id="B13"><citation citation-type="book"><person-group person-group-type="author"><name><surname>Gretton</surname> <given-names>A.</given-names></name> <name><surname>Spirtes</surname> <given-names>P.</given-names></name> <name><surname>Tillman</surname> <given-names>R. E.</given-names></name></person-group> (<year>2009</year>). <article-title>&#x0201C;Nonlinear directed acyclic structure learning with weakly additive noise models,&#x0201D;</article-title> in <source>Advances in Neural Information Processing Systems</source>, eds <person-group person-group-type="editor"><name><surname>Bengio</surname> <given-names>Y.</given-names></name> <name><surname>Schuurmans</surname> <given-names>D.</given-names></name> <name><surname>Lafferty</surname> <given-names>J. D.</given-names></name> <name><surname>Williams</surname> <given-names>C. K. I.</given-names></name> <name><surname>Culotta</surname> <given-names>A.</given-names></name></person-group>, Vol. <volume>22</volume> (<publisher-loc>Red Hook, NY</publisher-loc>: <publisher-name>Curran Associates, Inc.</publisher-name>), <fpage>1847</fpage>&#x02013;<lpage>1855</lpage>.</citation></ref>
<ref id="B14"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Heckerman</surname> <given-names>D.</given-names></name> <name><surname>Geiger</surname> <given-names>D.</given-names></name> <name><surname>Chickering</surname> <given-names>D. M.</given-names></name></person-group> (<year>1995</year>). <article-title>Learning Bayesian networks: the combination of knowledge and statistical data</article-title>. <source>Mach. Learn.</source> <volume>20</volume>, <fpage>20</fpage>&#x02013;<lpage>197</lpage>.<pub-id pub-id-type="doi">10.1023/A:1022623210503</pub-id></citation></ref>
<ref id="B15"><citation citation-type="book"><person-group person-group-type="author"><name><surname>Hefny</surname> <given-names>A.</given-names></name> <name><surname>Downey</surname> <given-names>C.</given-names></name> <name><surname>Gordon</surname> <given-names>G. J.</given-names></name></person-group> (<year>2015</year>). <article-title>&#x0201C;Supervised learning for dynamical system learning,&#x0201D;</article-title> in <source>Advances in Neural Information Processing Systems</source>, eds <person-group person-group-type="editor"><name><surname>Cortes</surname> <given-names>C.</given-names></name> <name><surname>Lawrence</surname> <given-names>N. D.</given-names></name> <name><surname>Lee</surname> <given-names>D. D.</given-names></name> <name><surname>Sugiyama</surname> <given-names>M.</given-names></name> <name><surname>Garnett</surname> <given-names>R.</given-names></name></person-group>, Vol. <volume>28</volume> (<publisher-loc>Red Hook, NY</publisher-loc>: <publisher-name>Curran Associates, Inc</publisher-name>), <fpage>1963</fpage>&#x02013;<lpage>1971</lpage>.</citation></ref>
<ref id="B16"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Honey</surname> <given-names>C. J.</given-names></name> <name><surname>K&#x000F6;tter</surname> <given-names>R.</given-names></name> <name><surname>Breakspear</surname> <given-names>M.</given-names></name> <name><surname>Sporns</surname> <given-names>O.</given-names></name></person-group> (<year>2007</year>). <article-title>Network structure of cerebral cortex shapes functional connectivity on multiple time scales</article-title>. <source>Proc. Natl. Acad. Sci. U.S.A</source> <volume>104</volume>, <fpage>10240</fpage>&#x02013;<lpage>10245</lpage>.<pub-id pub-id-type="doi">10.1073/pnas.0701519104</pub-id><pub-id pub-id-type="pmid">17548818</pub-id></citation></ref>
<ref id="B17"><citation citation-type="book"><person-group person-group-type="author"><name><surname>Hoyer</surname> <given-names>P. O.</given-names></name> <name><surname>Janzing</surname> <given-names>D.</given-names></name> <name><surname>Mooij</surname> <given-names>J. M.</given-names></name> <name><surname>Peters</surname> <given-names>J.</given-names></name> <name><surname>Sch&#x000F6;lkopf</surname> <given-names>B.</given-names></name></person-group> (<year>2009</year>). <article-title>&#x0201C;Nonlinear causal discovery with additive noise models,&#x0201D;</article-title> in <source>Advances in Neural Information Processing Systems</source>, eds <person-group person-group-type="editor"><name><surname>Koller</surname> <given-names>D.</given-names></name> <name><surname>Schuurmans</surname> <given-names>D.</given-names></name> <name><surname>Bengio</surname> <given-names>Y.</given-names></name> <name><surname>Bottou</surname> <given-names>L.</given-names></name></person-group>, Vol. <volume>21</volume> (<publisher-loc>Red Hook, NY</publisher-loc>: <publisher-name>Curran Associates, Inc.</publisher-name>), <fpage>689</fpage>&#x02013;<lpage>696</lpage>.</citation></ref>
<ref id="B18"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Kaneko</surname> <given-names>K.</given-names></name></person-group> (<year>1992</year>). <article-title>Overview of coupled map lattices</article-title>. <source>Chaos</source> <volume>2</volume>, <fpage>279</fpage>&#x02013;<lpage>282</lpage>.<pub-id pub-id-type="doi">10.1063/1.165869</pub-id></citation></ref>
<ref id="B19"><citation citation-type="book"><person-group person-group-type="author"><name><surname>Kantz</surname> <given-names>H.</given-names></name> <name><surname>Schreiber</surname> <given-names>T.</given-names></name></person-group> (<year>2004</year>). <source>Nonlinear Time Series Analysis</source>. eds <person-group person-group-type="editor"><name><surname>Chirikov</surname> <given-names>B.</given-names></name> <name><surname>Cvitanovi&#x00107;</surname> <given-names>P.</given-names></name> <name><surname>Moss</surname> <given-names>F.</given-names></name> <name><surname>Swinney</surname> <given-names>H.</given-names></name></person-group> <publisher-loc>Cambridge</publisher-loc>: <publisher-name>Cambridge University Press</publisher-name>.</citation></ref>
<ref id="B20"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Kocarev</surname> <given-names>L.</given-names></name> <name><surname>Parlitz</surname> <given-names>U.</given-names></name></person-group> (<year>1996</year>). <article-title>Generalized synchronization, predictability, and equivalence of unidirectionally coupled dynamical systems</article-title>. <source>Phys. Rev. Lett.</source> <volume>76</volume>, <fpage>1816</fpage>.<pub-id pub-id-type="doi">10.1103/PhysRevLett.76.1816</pub-id></citation></ref>
<ref id="B21"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Lam</surname> <given-names>W.</given-names></name> <name><surname>Bacchus</surname> <given-names>F.</given-names></name></person-group> (<year>1994</year>). <article-title>Learning Bayesian belief networks: an approach based on the MDL principle</article-title>. <source>Comput. Intell.</source> <volume>10</volume>, <fpage>269</fpage>&#x02013;<lpage>293</lpage>.<pub-id pub-id-type="doi">10.1111/j.1467-8640.1994.tb00166.x</pub-id></citation></ref>
<ref id="B22"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Lizier</surname> <given-names>J. T.</given-names></name> <name><surname>Heinzle</surname> <given-names>J.</given-names></name> <name><surname>Horstmann</surname> <given-names>A.</given-names></name> <name><surname>Haynes</surname> <given-names>J.-D.</given-names></name> <name><surname>Prokopenko</surname> <given-names>M.</given-names></name></person-group> (<year>2011</year>). <article-title>Multivariate information-theoretic measures reveal directed information structure and task relevant changes in fMRI connectivity</article-title>. <source>J. Comput. Neurosci.</source> <volume>30</volume>, <fpage>85</fpage>&#x02013;<lpage>107</lpage>.<pub-id pub-id-type="doi">10.1007/s10827-010-0271-2</pub-id></citation></ref>
<ref id="B23"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Lizier</surname> <given-names>J. T.</given-names></name> <name><surname>Prokopenko</surname> <given-names>M.</given-names></name> <name><surname>Zomaya</surname> <given-names>A. Y.</given-names></name></person-group> (<year>2008</year>). <article-title>Local information transfer as a spatiotemporal filter for complex systems</article-title>. <source>Phys. Rev. E Stat. Nonlin. Soft. Matter. Phys.</source> <volume>77</volume>, <fpage>026110</fpage>.<pub-id pub-id-type="doi">10.1103/PhysRevE.77.026110</pub-id></citation></ref>
<ref id="B24"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Lizier</surname> <given-names>J. T.</given-names></name> <name><surname>Prokopenko</surname> <given-names>M.</given-names></name> <name><surname>Zomaya</surname> <given-names>A. Y.</given-names></name></person-group> (<year>2010</year>). <article-title>Information modification and particle collisions in distributed computation</article-title>. <source>Chaos</source> <volume>20</volume>, <fpage>37109</fpage>&#x02013;<lpage>37113</lpage>.<pub-id pub-id-type="doi">10.1063/1.3486801</pub-id></citation></ref>
<ref id="B25"><citation citation-type="book"><person-group person-group-type="author"><name><surname>Lizier</surname> <given-names>J. T.</given-names></name> <name><surname>Rubinov</surname> <given-names>M.</given-names></name></person-group> (<year>2012</year>). <source>Multivariate Construction of Effective Computational Networks from Observational Data</source>. MIS-Preprint 25/2012. <publisher-name>Max Planck Institute for Mathematics in the Sciences</publisher-name>.</citation></ref>
<ref id="B26"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Mortveit</surname> <given-names>H. S.</given-names></name> <name><surname>Reidys</surname> <given-names>C. M.</given-names></name></person-group> (<year>2001</year>). <article-title>Discrete, sequential dynamical systems</article-title>. <source>Discrete Math.</source> <volume>226</volume>, <fpage>281</fpage>&#x02013;<lpage>295</lpage>.<pub-id pub-id-type="doi">10.1016/S0012-365X(00)00115-1</pub-id></citation></ref>
<ref id="B27"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Park</surname> <given-names>H.-J.</given-names></name> <name><surname>Friston</surname> <given-names>K.</given-names></name></person-group> (<year>2013</year>). <article-title>Structural and functional brain networks: from connections to cognition</article-title>. <source>Science</source> <volume>342</volume>, <fpage>1238411</fpage>.<pub-id pub-id-type="doi">10.1126/science.1238411</pub-id></citation></ref>
<ref id="B28"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Peters</surname> <given-names>J.</given-names></name> <name><surname>Janzing</surname> <given-names>D.</given-names></name> <name><surname>Sch&#x000F6;lkopf</surname> <given-names>B.</given-names></name></person-group> (<year>2011</year>). <article-title>Causal inference on discrete data using additive noise models</article-title>. <source>IEEE Trans. Pattern Anal. Mach. Intell.</source> <volume>33</volume>, <fpage>2436</fpage>&#x02013;<lpage>2450</lpage>.<pub-id pub-id-type="doi">10.1109/TPAMI.2011.71</pub-id><pub-id pub-id-type="pmid">21464504</pub-id></citation></ref>
<ref id="B29"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Prokopenko</surname> <given-names>M.</given-names></name> <name><surname>Lizier</surname> <given-names>J. T.</given-names></name></person-group> (<year>2014</year>). <article-title>Transfer entropy and transient limits of computation</article-title>. <source>Sci. Rep.</source> <volume>4</volume>, <fpage>5394</fpage>.<pub-id pub-id-type="doi">10.1038/srep05394</pub-id></citation></ref>
<ref id="B30"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Schreiber</surname> <given-names>T.</given-names></name></person-group> (<year>2000</year>). <article-title>Measuring information transfer</article-title>. <source>Phys. Rev. Lett.</source> <volume>85</volume>, <fpage>461</fpage>&#x02013;<lpage>464</lpage>.<pub-id pub-id-type="doi">10.1103/PhysRevLett.85.461</pub-id><pub-id pub-id-type="pmid">10991308</pub-id></citation></ref>
<ref id="B31"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Schumacher</surname> <given-names>J.</given-names></name> <name><surname>Wunderle</surname> <given-names>T.</given-names></name> <name><surname>Fries</surname> <given-names>P.</given-names></name> <name><surname>J&#x000E4;kel</surname> <given-names>F.</given-names></name> <name><surname>Pipa</surname> <given-names>G.</given-names></name></person-group> (<year>2015</year>). <article-title>A statistical framework to infer delay and direction of information flow from measurements of complex systems</article-title>. <source>Neural Comput.</source> <volume>27</volume>, <fpage>1555</fpage>&#x02013;<lpage>1608</lpage>.<pub-id pub-id-type="doi">10.1162/NECO_a_00756</pub-id></citation></ref>
<ref id="B32"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Schwarz</surname> <given-names>G.</given-names></name></person-group> (<year>1978</year>). <article-title>Estimating the dimension of a model</article-title>. <source>Ann. Stat.</source> <volume>6</volume>, <fpage>461</fpage>&#x02013;<lpage>464</lpage>.<pub-id pub-id-type="doi">10.1214/aos/1176344136</pub-id></citation></ref>
<ref id="B33"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Sporns</surname> <given-names>O.</given-names></name> <name><surname>Chialvo</surname> <given-names>D. R.</given-names></name> <name><surname>Kaiser</surname> <given-names>M.</given-names></name> <name><surname>Hilgetag</surname> <given-names>C. C.</given-names></name></person-group> (<year>2004</year>). <article-title>Organization, development and function of complex brain networks</article-title>. <source>Trends Cogn. Sci.</source> <volume>8</volume>, <fpage>418</fpage>&#x02013;<lpage>425</lpage>.<pub-id pub-id-type="doi">10.1016/j.tics.2004.07.008</pub-id></citation></ref>
<ref id="B34"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Stark</surname> <given-names>J.</given-names></name></person-group> (<year>1999</year>). <article-title>Delay embeddings for forced systems. I. Deterministic forcing</article-title>. <source>J. Nonlin. Sci.</source> <volume>9</volume>, <fpage>255</fpage>&#x02013;<lpage>332</lpage>.<pub-id pub-id-type="doi">10.1007/s003329900072</pub-id></citation></ref>
<ref id="B35"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Stark</surname> <given-names>J.</given-names></name> <name><surname>Broomhead</surname> <given-names>D. S.</given-names></name> <name><surname>Davies</surname> <given-names>M. E.</given-names></name> <name><surname>Huke</surname> <given-names>J.</given-names></name></person-group> (<year>2003</year>). <article-title>Delay embeddings for forced systems. II. Stochastic forcing</article-title>. <source>J. Nonlin. Sci.</source> <volume>13</volume>, <fpage>519</fpage>&#x02013;<lpage>577</lpage>.<pub-id pub-id-type="doi">10.1007/s00332-003-0534-4</pub-id></citation></ref>
<ref id="B36"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Sugihara</surname> <given-names>G.</given-names></name> <name><surname>May</surname> <given-names>R.</given-names></name> <name><surname>Ye</surname> <given-names>H.</given-names></name> <name><surname>Hsieh</surname> <given-names>C.-H.</given-names></name> <name><surname>Deyle</surname> <given-names>E.</given-names></name> <name><surname>Fogarty</surname> <given-names>M.</given-names></name> <etal/></person-group> (<year>2012</year>). <article-title>Detecting causality in complex ecosystems</article-title>. <source>Science</source> <volume>338</volume>, <fpage>496</fpage>&#x02013;<lpage>500</lpage>.<pub-id pub-id-type="doi">10.1126/science.1227079</pub-id><pub-id pub-id-type="pmid">22997134</pub-id></citation></ref>
<ref id="B37"><citation citation-type="book"><person-group person-group-type="author"><name><surname>Takens</surname> <given-names>F.</given-names></name></person-group> (<year>1981</year>). <article-title>&#x0201C;Detecting strange attractors in turbulence,&#x0201D;</article-title> in <source>Dynamical Systems and Turbulence, Volume 898 of Lecture Notes in Math</source>, eds <person-group person-group-type="editor"><name><surname>Rand</surname> <given-names>D. A.</given-names></name> <name><surname>Young</surname> <given-names>L-S.</given-names></name></person-group> (<publisher-loc>Warwick</publisher-loc>: <publisher-name>Springer-Verlag</publisher-name>), <fpage>366</fpage>&#x02013;<lpage>381</lpage>.</citation></ref>
<ref id="B38"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Takens</surname> <given-names>F.</given-names></name></person-group> (<year>2002</year>). <article-title>The reconstruction theorem for endomorphisms</article-title>. <source>Bull. Br. Math. Soc.</source> <volume>33</volume>, <fpage>231</fpage>&#x02013;<lpage>262</lpage>.<pub-id pub-id-type="doi">10.1007/s005740200012</pub-id></citation></ref>
<ref id="B39"><citation citation-type="book"><person-group person-group-type="author"><name><surname>Umenberger</surname> <given-names>J.</given-names></name> <name><surname>Manchester</surname> <given-names>I. R.</given-names></name></person-group> (<year>2016</year>). <article-title>&#x0201C;Scalable identification of stable positive systems,&#x0201D;</article-title> in <source>Proc. of IEEE CDC</source>, <publisher-loc>Las Vegas, NV</publisher-loc>.</citation></ref>
<ref id="B40"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Vicente</surname> <given-names>R.</given-names></name> <name><surname>Wibral</surname> <given-names>M.</given-names></name> <name><surname>Lindner</surname> <given-names>M.</given-names></name> <name><surname>Pipa</surname> <given-names>G.</given-names></name></person-group> (<year>2011</year>). <article-title>Transfer entropy &#x02013; a model-free measure of effective connectivity for the neurosciences</article-title>. <source>J. Comput. Neurosci.</source> <volume>30</volume>, <fpage>45</fpage>&#x02013;<lpage>67</lpage>.<pub-id pub-id-type="doi">10.1007/s10827-010-0262-3</pub-id></citation></ref>
<ref id="B41"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Wu</surname> <given-names>C. W.</given-names></name></person-group> (<year>2005</year>). <article-title>Synchronization in networks of nonlinear dynamical systems coupled via a directed graph</article-title>. <source>Nonlinearity</source> <volume>18</volume>, <fpage>1057</fpage>.<pub-id pub-id-type="doi">10.1088/0951-7715/18/3/007</pub-id></citation></ref>
<ref id="B42"><citation citation-type="journal"><person-group person-group-type="author"><name><surname>Xu</surname> <given-names>Z.</given-names></name> <name><surname>Fitch</surname> <given-names>R.</given-names></name> <name><surname>Underwood</surname> <given-names>J. P.</given-names></name> <name><surname>Sukkarieh</surname> <given-names>S.</given-names></name></person-group> (<year>2013</year>). <article-title>Decentralized coordinated tracking with mixed discrete-continuous decisions</article-title>. <source>J. Field Robot.</source> <volume>30</volume>, <fpage>717</fpage>&#x02013;<lpage>740</lpage>.<pub-id pub-id-type="doi">10.1002/rob.21471</pub-id></citation></ref>
</ref-list>
<fn-group>
<fn id="fn1"><p><sup>1</sup>Stark (<xref ref-type="bibr" rid="B34">1999</xref>) conjectures that the theorem should generalise to functions <italic>h</italic> that are not independent of <italic>x</italic>. To the best of our knowledge, this result remains to be proven.</p></fn>
<fn id="fn2"><p><sup>2</sup>The original proof (Deyle and Sugihara, <xref ref-type="bibr" rid="B7">2011</xref>) uses positive lags; however, the authors note that the use of negative lags also applies [and should be used in the case of endomorphisms (Takens, <xref ref-type="bibr" rid="B38">2002</xref>)].</p></fn>
</fn-group>
</back>
</article>