Excerpt from PDF:

Learning local neighborhoods of non-Gaussian graphical models: A measure transport approach Sarah Liaw1, Rebecca Morrison2, Youssef Marzouk3, Ricardo Baptista1 1California Institute of Technology 2University of Colorado Boulder 3Massachusetts Institute of Technology Abstract Identifying the Markov properties or conditional independencies of a collection of random variables is a fundamental task in statistics for modeling and inference. Existing approaches often learn the structure of a probabilistic graphical model, which encodes these dependencies, by assuming that the variables follow a distribution with a simple parametric form. Moreover, the computational cost of many algorithms scales poorly for high-dimensional distributions, as they need to estimate all the edges in the graph simultaneously. In this work, we propose a scalable algorithm to infer the conditional independence relationships of each variable by exploiting the local Markov property. The proposed method, named Localized Sparsity Identification for Non-Gaussian Distributions (L-SING), estimates the graph by using flexible classes of transport maps to represent the conditional distribution for each variable. We show that L-SING includes existing approaches, such as neighborhood selection with Lasso, as a special case. We demonstrate the effectiveness of our algorithm in both Gaussian and non-Gaussian settings by comparing it to existing methods. Lastly, we show the scalability of the proposed approach by applying it to high-dimensional non-Gaussian examples, including a biological dataset with more than 150 variables. 1 Introduction Given a collection of random variables X = (X1, . . . , Xd) with probability measure νπ and Lebesgue density π, discovering the conditional independence relationships of X is an important task in statistics. These dependencies are represented in a graph as edges E between vertices V , which correspond to the variables. The resulting graph structure G = (V, E) is known as a probabilistic graphical model or a Markov random field. Many real-world processes, such as gene expression levels, generate continuous and non-Gaussian data, requiring methods that can handle such distributions. Gene expression is regulated by complex networks involving transcription factors which exhibit nonlinear dynamics, leading to non-Gaussian distributions (Marko and Weil, 2012). Other applications Correspondence to sliaw@caltech.edu. 1 arXiv:2503.13899v1 [cs.LG] 18 Mar 2025 include data of financial market returns and climate variables. These datasets are high- dimensional, and existing algorithms that assume normality may fail to correctly characterize the relevant conditional dependencies. Structure learning algorithms estimate graphs that capture and summarize the condi- tional dependencies within a dataset, thereby performing model selection. These algorithms are broadly categorized into global and local methods (Koller and Friedman, 2009). Global methods reconstruct the entire graph based on global Markov properties, whereas local methods identify the neighborhood set Nb(k) for each node k in the graph G based on local Markov properties. The neighborhood set defines variables XNb(k) such that the conditional density of variable Xk satisfies π(xk|x−k) = π(xk|xNb(k)). In other words, Xk is conditionally independent of variables outside the neighborhood X−Nb(k) given XNb(k). For distributions with a positive probability density functions, global and local Markov properties are equivalent (Pearl and Paz, 1986). In this work, we …더보기

This paper was uploaded based on materials provided by arXiv.
This paper is an open academic resource, and the original text can be accessed on arXiv.
Source: arXiv – A free repository for scientific and technical researchers.
This paper is provided for academic research purposes, and the original can be downloaded from arXiv.
Visit arXiv to explore more recent papers!

This paper was uploaded based on materials provided by arXiv.
This paper is an open academic resource, and the original text can be accessed on arXiv.
Source: arXiv – A free repository for scientific and technical researchers.
This paper is provided for academic research purposes, and the original can be downloaded from arXiv.
Visit arXiv to explore more recent papers!

번역 (Translation):

비 가우스 그래픽 모델의 지역 학습 : 측정 운송 접근법 Sarah Liaw1, Rebecca Morrison2, Youssef Marzouk3, Ricardo Baptista1 1 California Institute of Technology 2University of Colorado Boulder 3Massachusetts 3Massachusetts는 Markov 특성 또는 조건부의 모음을 식별하는 기술을 식별하는 기술을 식별하는 기술을 식별하는 기술을 식별하고 임의의 변형에 대한 자사의 컬렉션을 식별하는 기술을 식별합니다. 추론. 기존 접근법은 종종 변수가 간단한 파라 메트릭 형태의 분포를 따른다고 가정하여 이러한 종속성을 인코딩하는 확률 론적 그래픽 모델의 구조를 학습합니다. 또한, 많은 알고리즘의 계산 비용은 고차원 분포의 경우 제대로 확장되지 않으므로 그래프의 모든 가장자리를 동시에 추정해야합니다. 이 작업에서는 로컬 Markov 속성을 악용하여 각 변수의 조건부 독립 관계를 추론하기위한 확장 가능한 알고리즘을 제안합니다. 비 가우시안 분포 (L-Sing)에 대한 현지화 된 희소성 식별 (L-Sing)에 대한 제안 된 방법은 유연한 전송 맵 클래스를 사용하여 각 변수에 대한 조건부 분포를 나타내어 그래프를 추정합니다. 우리는 L-Sing에 특별한 경우로 Lasso를 사용한 이웃 선택과 같은 기존 접근법이 포함되어 있음을 보여줍니다. 우리는 기존 방법과 비교하여 가우시안 및 비 가우시안 설정에서 알고리즘의 효과를 보여줍니다. 마지막으로, 우리는 150 개가 넘는 변수를 가진 생물학적 데이터 세트를 포함하여 고차원 비 가우시안 사례에 적용하여 제안 된 접근법의 확장 성을 보여줍니다. 1 소개 확률 측정 νπ 및 lebesgue 밀도 π를 갖는 랜덤 변수 x = (x1, …, xd)의 모음이 주어지면 x의 조건부 독립 관계를 발견하는 것은 통계에서 중요한 작업입니다. 이러한 종속성은 변수에 해당하는 정점 V 사이의 가장자리 e로 그래프로 표시됩니다. 결과 그래프 구조 g = (v, e)는 확률 론적 그래픽 모델 또는 Markov 랜덤 필드로 알려져 있습니다. 유전자 발현 수준과 같은 많은 실제 과정은 연속 및 비 가우시안 데이터를 생성하여 이러한 분포를 처리 할 수있는 방법이 필요합니다. 유전자 발현은 비선형 역학을 나타내는 전사 인자를 포함하는 복잡한 네트워크에 의해 조절되며, 비가 우스 분포가 발생한다 (Marko and Weil, 2012). 다른 응용 프로그램은 sliaw@caltech.edu에 서신합니다. 1 ARXIV : 2503.13899V1 [CS.LG] 1825 년 3 월 18 일 금융 시장 수익 및 기후 변수에 대한 데이터가 포함되어 있습니다. 이 데이터 세트는 차원이 높으며 정규성이 관련 조건부 종속성을 올바르게 특성화하지 못할 수 있다고 가정하는 기존 알고리즘. 구조 학습 알고리즘은 데이터 세트 내에서 정분 종속성을 캡처하고 요약하는 그래프를 추정하여 모델 선택을 수행합니다. 이 알고리즘은 광범위하게 글로벌 및 로컬 방법으로 분류됩니다 (Koller and Friedman, 2009). 글로벌 메소드는 글로벌 Markov 특성을 기반으로 전체 그래프를 재구성하는 반면, 로컬 메소드는 로컬 Markov 특성에 기초한 그래프 G에서 각 노드 k에 대해 NB (k)를 설정하는 것을 식별합니다. 이웃 세트는 변수 XNB (k) 변수를 정의하여 변수 XK의 조건부 밀도가 π (xk | x -k) = π (xk | xnb (k))를 만족시킵니다. 다시 말해, XK는 XNB (k)가 주어진 동네 X -NB (k) 외부의 변수와 조건부로 독립적입니다. 긍정적 인 확률 밀도 함수를 갖는 분포의 경우, 글로벌 및 로컬 Markov 특성은 동일하다 (Pearl and Paz, 1986). 이 작업에서 우리는 …,

이 논문은 arXiv에서 제공되는 자료를 바탕으로 업로드되었습니다.
본 논문은 공개된 학술 자료이며, 원문은 arXiv에서 확인할 수 있습니다.
출처: arXiv – 과학 및 기술 연구자들을 위한 무료 논문 저장소.
이 논문은 학술 연구 목적으로 제공되며, 원문은 arXiv에서 다운로드할 수 있습니다.
더 많은 최신 논문을 보려면 arXiv를 방문하세요!

이 논문은 arXiv에서 제공되는 자료를 바탕으로 업로드되었습니다.
본 논문은 공개된 학술 자료이며, 원문은 arXiv에서 확인할 수 있습니다.
출처: arXiv – 과학 및 기술 연구자들을 위한 무료 논문 저장소.
이 논문은 학술 연구 목적으로 제공되며, 원문은 arXiv에서 다운로드할 수 있습니다.
더 많은 최신 논문을 보려면 arXiv를 방문하세요!

PDF 다운로드

Leave a comment

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다