[๋…ผ๋ฌธ๋ฆฌ๋ทฐ] ALCM: Autonomous LLM-Augmented Causal Discovery Framework

2025. 7. 23. 18:13ยทAI
 

๐Ÿง  1. ๋…ผ๋ฌธ ๊ฐœ์š”

 
Author

Elahe Khatibi1, Mahyar Abbasian1, Zhongqi Yang1, Iman Azimi1, and Amir M.

 

 
Keywords
LLM Causal Discovery
 
Publication Date
May 2, 2024
 
Abstract

๊ณ ์ฐจ์› ๋ฐ์ดํ„ฐ์…‹์—์„œ ํšจ๊ณผ์ ์ธ ์ธ๊ณผ ์ถ”๋ก ์„ ์ˆ˜ํ–‰ํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ๊ด€์ฐฐ ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„๋ฅผ ์ƒ์„ฑํ•˜๋Š” ์ธ๊ณผ ๋ฐœ๊ฒฌ์ด ํ•„์ˆ˜์ ์ž…๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์™„์ „ํ•˜๊ณ  ์ •ํ™•ํ•œ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„๋ฅผ ์–ป๋Š” ๊ฒƒ์€ NP-๋‚œํ•ด ๋ฌธ์ œ๋กœ ์—ฌ๊ฒจ์ง€๋Š” ์–ด๋ ค์šด ๊ณผ์ œ์ž…๋‹ˆ๋‹ค. ๋ณธ ์—ฐ๊ตฌ์—์„œ๋Š” ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์ธ๊ณผ ๋ฐœ๊ฒฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜๊ณผ LLM์„ ๊ฒฐํ•ฉํ•˜์—ฌ ๋” ๊ฒฌ๊ณ ํ•˜๊ณ  ์ •ํ™•ํ•˜๋ฉฐ ์„ค๋ช… ๊ฐ€๋Šฅํ•œ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„๋ฅผ ์ž๋™์œผ๋กœ ์ƒ์„ฑํ•˜๋Š” ์ƒˆ๋กœ์šด ํ”„๋ ˆ์ž„์›Œํฌ์ธ '์ž์œจ LLM ์ฆ๊ฐ• ์ธ๊ณผ ๋ฐœ๊ฒฌ ํ”„๋ ˆ์ž„์›Œํฌ(ALCM)'๋ฅผ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค. ALCM์€ ์ธ๊ณผ ๊ตฌ์กฐ ํ•™์Šต, ์ธ๊ณผ ๋ž˜ํผ, LLM ๊ธฐ๋ฐ˜ ์ธ๊ณผ ์ •์ œ๊ธฐ๋ผ๋Š” ์„ธ ๊ฐ€์ง€ ์ค‘์š”ํ•œ ๊ตฌ์„ฑ ์š”์†Œ๋กœ ์ด๋ฃจ์–ด์ ธ ์žˆ์œผ๋ฉฐ, ์ด๋“ค์€ ๋™์ ์ธ ํ™˜๊ฒฝ์—์„œ ํ˜‘๋ ฅํ•˜์—ฌ ์ธ๊ณผ ๋ฐœ๊ฒฌ ์งˆ๋ฌธ์— ๋Œ€์‘ํ•˜๊ณ  ๊ทธ๋Ÿด๋“ฏํ•œ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ๋ณธ ์—ฐ๊ตฌ๋Š” 7๊ฐœ์˜ ์ž˜ ์•Œ๋ ค์ง„ ๋ฐ์ดํ„ฐ์…‹์—์„œ ๋‘ ๊ฐ€์ง€ ์‹œ์—ฐ์„ ํ†ตํ•ด ALCM ํ”„๋ ˆ์ž„์›Œํฌ์˜ ํšจ๊ณผ๋ฅผ ํ‰๊ฐ€ํ•˜์˜€์œผ๋ฉฐ, ALCM์ด ๊ธฐ์กด LLM ๋ฐฉ๋ฒ• ๋ฐ ์ „ํ†ต์ ์ธ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์ธ๊ณผ ์ถ”๋ก  ๋ฉ”์ปค๋‹ˆ์ฆ˜๋ณด๋‹ค ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์คŒ์„ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ์—ฐ๊ตฌ๋Š” ALCM์˜ ํšจ์œจ์„ฑ์„ ์ž…์ฆํ•˜๋Š” ๊ฒƒ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ LLM์˜ ์ธ๊ณผ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํ™œ์šฉํ•œ ์ƒˆ๋กœ์šด ์—ฐ๊ตฌ ๋ฐฉํ–ฅ์„ ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค.

์—ฐ๊ตฌ ๋ชฉ์ 

LLM ๊ธฐ๋ฐ˜์œผ๋กœ ์„ค๋ช… ๊ฐ€๋Šฅํ•œ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„ ์ƒ์„ฑ์„ ์ž๋™ํ™”

๋…ผ๋ฌธ URL

ALCM: Autonomous LLM-Augmented Causal Discovery Framework

 

๐ŸŽฏ 2. ์—ฐ๊ตฌ ๋ชฉ์  ๋ฐ ๋ฌธ์ œ ์ •์˜

2-1. ํ•ด๊ฒฐํ•˜๋ ค๋Š” ๋ฌธ์ œ๋Š” ๋ฌด์—‡์ธ๊ฐ€?

  • ์ •ํ™•ํ•œ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„๋ฅผ ์–ป๋Š” ๊ฒƒ

2-2. ๊ธฐ์กด ์—ฐ๊ตฌ์™€ ์–ด๋–ค ์ฐจ๋ณ„์ ์ด ์žˆ๋Š”๊ฐ€?

  • ์ „ํ†ต์ ์ธ ์ธ๊ณผ ๋ฐœ๊ฒฌ ๊ธฐ๋ฒ•๊ณผ LLM ๊ฒฐํ•ฉํ•˜์—ฌ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„ ์ƒ์„ฑ

 

โš™๏ธ 3. ์—ฐ๊ตฌ ๋ฐฉ๋ฒ•๋ก 

3-1. ์‚ฌ์šฉํ•œ ๋ชจ๋ธ/๊ธฐ์ˆ /ํ”„๋ ˆ์ž„์›Œํฌ

ํ”„๋ ˆ์ž„์›Œํฌ

(1) ์ธ๊ณผ ๊ตฌ์กฐ ํ•™์Šต (Causal Structure Learning)

  • ๋ฐ์ดํ„ฐ์…‹์„ ์ž…๋ ฅ๋ฐ›์•„ ์ „ํ†ต์ ์ธ ์ธ๊ณผ ๋ฐœ๊ฒฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„ ์ƒ์„ฑ
  • PC(Peter-Clark) ์•Œ๊ณ ๋ฆฌ์ฆ˜๊ณผ LiNGAM(Linear Non-Gaussian Acyclic Model) ์‚ฌ์šฉ

(2) ์ธ๊ณผ ๋ž˜ํผ (Causal Wrapper)

  • ์ธ๊ณผ ๊ตฌ์กฐ ํ•™์Šต๊ณผ LLM ๊ธฐ๋ฐ˜ ์ธ๊ณผ ์ •์ œ๊ธฐ ๊ตฌ์„ฑ ์š”์†Œ ์‚ฌ์ด์˜ ์ค‘๊ฐœ์ž ์—ญํ• 
  • ์ธ๊ณผ ๊ทธ๋ž˜ํ”„์˜ ์›์‹œ ๋ฐ์ดํ„ฐ๋ฅผ ์ธ๊ณผ ํ”„๋กฌํ”„ํŠธ๋กœ ์บก์Аํ™”ํ•˜๋Š” ์—ญํ• 
  • ํ•ด๋‹น ์ธ๊ณผ ํ”„๋กฌํ”„ํŠธ๊ณผ LLM ๊ธฐ๋ฐ˜ ์ •์ œ๊ธฐ๋กœ ์ „๋‹ฌ๋˜์–ด ์ธ๊ณผ ๊ทธ๋ž˜ํ”„๋ฅผ ์ดํ•ดํ•˜๊ณ  ์ ํ•ฉํ•œ ํ•ด๊ฒฐ์ฑ…์„ ๋งŒ๋“ค๋„๋ก ํ•จ
  • Causal Prompt = Instruction + Causal Context + Metadata + Question + Output format.
    • Instruction (์ง€์นจ): LLM์˜ ์—ญํ• , ๋ชฉํ‘œ, ์˜ˆ์ƒ๋˜๋Š” ๋™์ž‘์„ ๋ช…ํ™•ํ•˜๊ฒŒ ์ •์˜
    • Causal Context (์ธ๊ณผ ๋งฅ๋ฝ): ์„ ํƒ๋œ ์ธ๊ณผ ๋ฐœ๊ฒฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜(์˜ˆ: PC ์•Œ๊ณ ๋ฆฌ์ฆ˜)์˜ ์ด๋ฆ„๊ณผ ๊ฒฐ๊ณผ ๋“ฑ ์„ธ๋ถ€ ์ •๋ณด๋ฅผ ํฌํ•จ
    • Metadata (๋ฉ”ํƒ€๋ฐ์ดํ„ฐ): ๋ฐ์ดํ„ฐ์…‹์˜ ๋„๋ฉ”์ธ์ด๋‚˜ ๋ณ€์ˆ˜ ์ด๋ฆ„๊ณผ ์„ค๋ช…(์˜ˆ: ์•” ์œ„ํ—˜ ์š”์ธ, ์œ ์ „์  ์•” ๊ด€๊ณ„)์„ ์ œ๊ณต
    • Question (์งˆ๋ฌธ): ํŠน์ • ์ฟผ๋ฆฌ(์˜ˆ: A๊ฐ€ B์˜ ์›์ธ์ธ์ง€ ์—ฌ๋ถ€)๋ฅผ ๋ช…ํ™•ํžˆ ์ œ์‹œ
    • Output format (์ถœ๋ ฅ ํ˜•์‹): ์›ํ•˜๋Š” ๊ฒฐ๊ณผ๋ฌผ์˜ ํ˜•์‹์„ ์ •์˜
  • ์ด๋Ÿฌํ•œ ํ”„๋กฌํ”„ํŠธ ์ „๋žต์„ ํ†ตํ•ด ์ตœ์ข… ์ธ๊ณผ ๊ทธ๋ž˜ํ”„๊ฐ€ ๋ฐ์ดํ„ฐ์…‹ ๋‚ด์˜ ๊ทผ๋ณธ์ ์ธ ์ธ๊ณผ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ๋ฐ˜์˜ํ•˜๋„๋ก ๋ณด์žฅ

(3) LLM ๊ธฐ๋ฐ˜ ์ธ๊ณผ ์ •์ œ๊ธฐ (LLM-driven Refiner)

  • LLM์œผ๋กœ ์ธ๊ณผ๊ทธ๋ž˜ํ”„์˜ ์ •์ œ ๋ฐ ํ‰๊ฐ€
  • ๋ฌธ๋งฅ์  ์ธ๊ณผ ํ”„๋กฌํ”„ํŠธ์™€ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ๋ฅผ ํ† ๋Œ€๋กœ ์ธ๊ณผ ์—ฃ์ง€/๋…ธ๋“œ๋ฅผ ํ‰๊ฐ€ํ•˜์—ฌ ๋…ธ๋“œ์™€ ์—ฃ์ง€๋ฅผ ์ถ”๊ฐ€ํ•˜๊ฑฐ๋‚˜ ์ œ๊ฑฐ

ALCM ํ”„๋กœ์„ธ์Šค

    • ์ž…๋ ฅ (Require):
      • ๊ด€์ฐฐ ๋ฐ์ดํ„ฐ์…‹ (O): ๋ถ„์„ํ•  ์›๋ณธ ๋ฐ์ดํ„ฐ
      • ๋งฅ๋ฝ์  ์ธ๊ณผ ์ •๋ณด (C): ๋ฌธ์ œ์˜ ๋ฐฐ๊ฒฝ ์ง€์‹์ด๋‚˜ ๋„๋ฉ”์ธ๋ณ„ ์ •๋ณด
      • ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ (M): ๋ฐ์ดํ„ฐ์…‹์˜ ๋ณ€์ˆ˜๋ช… ๋ฐ ์„ค๋ช…๊ณผ ๊ฐ™์€ ์ถ”๊ฐ€ ์ •๋ณด
    • ์ถœ๋ ฅ (Ensure):
      • ์ธ๊ณผ DAG : ์ตœ์ข…์ ์œผ๋กœ ์ƒ์„ฑ๋˜๋Š” ๋ฐฉํ–ฅ์„ฑ ๋น„์ˆœํ™˜ ๊ทธ๋ž˜ํ”„(Directed Acyclic Graph) ํ˜•ํƒœ์˜ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„
    • ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๋‹จ๊ณ„๋ณ„ ์„ค๋ช…:
      1. ์ดˆ๊ธฐ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„ ์ƒ์„ฑ:
        • ์„ ํƒ๋œ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์ธ๊ณผ ๋ฐœ๊ฒฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜(์˜ˆ: PC, LiNGAM)์„ ์‚ฌ์šฉํ•˜์—ฌ ๊ด€์ฐฐ ๋ฐ์ดํ„ฐ์…‹ (O)์œผ๋กœ๋ถ€ํ„ฐ ์ดˆ๊ธฐ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„ ($G_i$)๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. ์ด ๋‹จ๊ณ„๋Š” "Causal Structure Learning" ๊ตฌ์„ฑ ์š”์†Œ์— ํ•ด๋‹นํ•ฉ๋‹ˆ๋‹ค.
      2. ์ธ๊ณผ ํ”„๋กฌํ”„ํŠธ ์ƒ์„ฑ:
        • ๋งฅ๋ฝ์  ์ธ๊ณผ ์ •๋ณด (C)์™€ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ (M)๋ฅผ ์ฃผ์ž…ํ•˜์—ฌ LLM์„ ์œ„ํ•œ ์ธ๊ณผ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. ์ด ํ”„๋กฌํ”„ํŠธ๋Š” LLM์ด ์ดˆ๊ธฐ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„๋ฅผ ์ดํ•ดํ•˜๊ณ  ๊ด€๋ จ ๋ฐฐ๊ฒฝ ์ง€์‹์„ ํ†ตํ•ฉํ•˜๋„๋ก ์•ˆ๋‚ดํ•˜๋Š” ์—ญํ• ์„ ํ•ฉ๋‹ˆ๋‹ค. ์ด ๋‹จ๊ณ„๋Š” "Causal Wrapper" ๊ตฌ์„ฑ ์š”์†Œ์— ํ•ด๋‹นํ•ฉ๋‹ˆ๋‹ค. ํ”„๋กฌํ”„ํŠธ๋Š” ๋‹ค์Œ ์š”์†Œ๋ฅผ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค: Instruction + Causal Context + Metadata + Question + Output format.
      3. LLM ๊ธฐ๋ฐ˜ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„ ์ •์ œ (๋ฐ˜๋ณต):
        • ์ดˆ๊ธฐ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„ ($G_i$))์˜ ๊ฐ ์—ฃ์ง€($z = (e_i, e_j)$)์— ๋Œ€ํ•ด ๋‹ค์Œ ์ž‘์—…์„ ๋ฐ˜๋ณตํ•ฉ๋‹ˆ๋‹ค. ์ด ๊ณผ์ •์€ "LLM-driven Refiner" ๊ตฌ์„ฑ ์š”์†Œ์— ์˜ํ•ด ์ˆ˜ํ–‰๋ฉ๋‹ˆ๋‹ค.
          • ์—ฃ์ง€ ์œ ํšจ์„ฑ ๊ฒ€์‚ฌ: LLM-Driven Refiner๊ฐ€ ํ•ด๋‹น ์—ฃ์ง€๋ฅผ ์œ ํšจํ•˜๋‹ค๊ณ  ํŒ๋‹จํ•˜๋ฉด, ๊ทธ๋ž˜ํ”„์— ์œ ์ง€๋ฉ๋‹ˆ๋‹ค.
          • ์—ฃ์ง€ ๋ฐฉํ–ฅ ์ˆ˜์ •: LLM-Driven Refiner๊ฐ€ ์—ฃ์ง€์˜ ๋ฐฉํ–ฅ์„ ์ˆ˜์ •ํ•ด์•ผ ํ•œ๋‹ค๊ณ  ํŒ๋‹จํ•˜๋ฉด, ์ƒˆ๋กœ์šด ๋ฐฉํ–ฅ์˜ ์—ฃ์ง€($(z')$)๋กœ ๋Œ€์ฒด๋ฉ๋‹ˆ๋‹ค.
          • ์—ฃ์ง€ ์ œ๊ฑฐ: LLM-Driven Refiner๊ฐ€ ํ•ด๋‹น ์—ฃ์ง€๋ฅผ ์ œ๊ฑฐํ•ด์•ผ ํ•œ๋‹ค๊ณ  ํŒ๋‹จํ•˜๋ฉด, ๊ทธ๋ž˜ํ”„์—์„œ ์‚ญ์ œ๋ฉ๋‹ˆ๋‹ค.
          • ์ƒˆ๋กœ์šด ์—ฃ์ง€ ์ถ”๊ฐ€: LLM-Driven Refiner๊ฐ€ ์ดˆ๊ธฐ ๊ทธ๋ž˜ํ”„์—๋Š” ์—†๋˜ ์ƒˆ๋กœ์šด ์ธ๊ณผ ๊ด€๊ณ„(\(z''\))๋ฅผ ์‹๋ณ„ํ•˜์—ฌ ์ถ”๊ฐ€ํ•ด์•ผ ํ•œ๋‹ค๊ณ  ํŒ๋‹จํ•˜๋ฉด, ์ด๋ฅผ ๊ทธ๋ž˜ํ”„์— ์ถ”๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.
      4. ์ตœ์ข… ์ธ๊ณผ ๊ทธ๋ž˜ํ”„ ๋ฐ˜ํ™˜:
        • ๋ชจ๋“  ์—ฃ์ง€์— ๋Œ€ํ•œ ์ •์ œ ๊ณผ์ •์ด ์™„๋ฃŒ๋œ ํ›„, ์ตœ์ข…์ ์œผ๋กœ ๊ฐœ์„ ๋˜๊ณ  ์ •์ œ๋œ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„ (\(G_i\))๋ฅผ ๋ฐ˜ํ™˜ํ•ฉ๋‹ˆ๋‹ค.

 

3-2. ์‹คํ—˜ ์„ค์ •

ALCM-PC vs ALCM-Hybrid

  • ALCM-PC
    • ์ธ๊ณผ ๊ตฌ์กฐ๋Š” PC ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ ํ•™์Šต ํ›„, OpenAI์˜ GPT-4๋ฅผ ํ™œ์šฉํ•ด LLM ๊ธฐ๋ฐ˜ ์ •์ œ
  • ALCM-Hybrid
    • PC + LiNGAM ๋‹ค์ˆ˜๊ฒฐ๋กœ ํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜๋งŒ ์‹๋ณ„ํ•œ ์—ฃ์ง€์˜ ๊ฒฝ์šฐ LLM์ด ํŒ๋‹จ.
  • ์„ฑ๋Šฅ ์ง€ํ‘œ : ์ •๋ฐ€๋„, ์žฌํ˜„์œจ, F1 ์ ์ˆ˜, ์ •ํ™•๋„, ๊ทธ๋ฆฌ๊ณ  ์ •๊ทœํ™”๋œ ํ•ด๋ฐ ๊ฑฐ๋ฆฌ(NHD)์˜ ๋‹ค์„ฏ ๊ฐ€์ง€ ์ง€ํ‘œ
    • Precision (์ •๋ฐ€๋„): ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ์‹๋ณ„ํ•œ ๋ชจ๋“  ๊ด€๊ณ„ ์ค‘์—์„œ ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ์‹๋ณ„๋œ ์ธ๊ณผ ๊ด€๊ณ„์˜ ๋น„์œจ์„ ์ธก์ •ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๊ฑฐ์ง“ ์–‘์„ฑ(false positives)์„ ์ตœ์†Œํ™”ํ•˜์—ฌ ์ œ์•ˆ๋œ ์ธ๊ณผ ๊ด€๊ณ„์˜ ์œ ํšจ์„ฑ์„ ๋ณด์žฅํ•˜๋Š” ๋ฐ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.
    • Recall (์žฌํ˜„์œจ): ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ์‹๋ณ„ํ•œ ์‹ค์ œ ์ธ๊ณผ ๊ด€๊ณ„์˜ ๋น„์œจ์„ ํ‰๊ฐ€ํ•˜์—ฌ ๋ฐ์ดํ„ฐ ๋‚ด์— ์กด์žฌํ•˜๋Š” ์ธ๊ณผ ๊ด€๊ณ„๋ฅผ ์–ผ๋งˆ๋‚˜ ์™„์ „ํžˆ ์ฐพ์•„๋ƒˆ๋Š”์ง€๋ฅผ ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค.
    • F1-score: ์ •๋ฐ€๋„์™€ ์žฌํ˜„์œจ์˜ ์กฐํ™” ํ‰๊ท ์œผ๋กœ, ์‹๋ณ„๋œ ์ธ๊ณผ ๊ด€๊ณ„์˜ ์ •ํ™•์„ฑ๊ณผ ์™„์ „์„ฑ ์‚ฌ์ด์˜ ๊ท ํ˜•์„ ์ œ๊ณตํ•˜๋Š” ๋‹จ์ผ ์ง€ํ‘œ์ž…๋‹ˆ๋‹ค.
    • Accuracy (์ •ํ™•๋„): ์ธ๊ณผ ๊ทธ๋ž˜ํ”„์˜ ์ „์ฒด์ ์ธ ์ •ํ™•์„ฑ์„ ํ‰๊ฐ€ํ•˜๋ฉฐ, ์‹ค์ œ ์ธ๊ณผ ๊ด€๊ณ„์˜ ์กด์žฌ์™€ ๊ฑฐ์ง“ ๊ด€๊ณ„์˜ ๋ถ€์žฌ๋ฅผ ๋ชจ๋‘ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค.
    • Normalized Hamming Distance (NHD): ์˜ˆ์ธก๋œ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„์™€ ์‹ค์ œ ๊ทธ๋ž˜ํ”„ ๊ฐ„์˜ ์ฐจ์ด๋ฅผ ์ •๋Ÿ‰ํ™”ํ•˜๋ฉฐ, ๊ทธ๋ž˜ํ”„ ํฌ๊ธฐ์— ๋”ฐ๋ผ ์ •๊ทœํ™”๋œ ๋ถˆ์ผ์น˜ ์—ฃ์ง€์˜ ๋น„์œจ์„ ์ธก์ •ํ•ฉ๋‹ˆ๋‹ค.
      • $\text{NHD} = \frac{1}{m^2} \sum_{i=1}^{m} \sum_{j=1}^{m} \mathbb{I}(G_{ij} \neq G^p_{ij})$ : ์ผ์น˜ํ•˜์ง€ ์•Š๋Š” ์—ฃ์ง€๋“ค์˜ ๋น„์œจ
      • $\mathbb{I}(\cdot)$ : ์ฐธ๊ทธ๋ž˜ํ”„์™€ ๋ถˆ์ผ์น˜ํ•˜๋Š” ๊ฒฝ์šฐ 1์„ ๋ฐ˜ํ™˜ํ•˜๊ณ  ๊ฐ™์œผ๋ฉด 0์„ ๋ฐ˜ํ™˜ํ•˜๋Š” ์ง€์‹œ ํ•จ์ˆ˜

3-3. ๋ฐ์ดํ„ฐ์…‹ ์ข…๋ฅ˜ ๋ฐ ํŠน์„ฑ

  • Asia, Cancer, Child, Insurance, Sachs, Neuropathic, Sangiovese ๋“ฑ ์˜๋ฃŒ ์—ฐ๊ตฌ, ๋ณดํ—˜ ๋ชจ๋ธ๋ง, ์œ ์ „ ๊ฒฝ๋กœ ๋“ฑ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์™€ ๋ณต์žก์„ฑ์„ ์ง€๋‹Œ 7๊ฐœ์˜ ๋ฒค์น˜๋งˆํฌ ๋ฐ์ดํ„ฐ์…‹๊ณผ ์‹ค์ œ ์ฐธ๊ฐ’ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„ ์‚ฌ์šฉ

Summary of Datasets

๐Ÿ“Š 4. ์ฃผ์š” ๊ฒฐ๊ณผ ๋ฐ ์„ฑ๋Šฅ

์„ฑ๋Šฅ ๋น„๊ต 

Additive Contribution on Causal Discovery Accuracy on Neuropathetic Pai
Additive Contribution on Causal Discovery Accuracy on Sach
Evaluation Results for Various Causal Discovery Methods
  • ๊ธฐ์กด ๋ฐฉ๋ฒ•๋ก ๊ณผ์˜ ๋น„๊ต: ALCM-PC์™€ ALCM-Hybrid๋Š” ๊ธฐ์ค€์„ ์ธ PC ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๋ฐ LLM ๊ธฐ๋ฐ˜ ์ ‘๊ทผ ๋ฐฉ์‹๊ณผ ๋น„๊ตํ•˜์—ฌ ์ •๋ฐ€๋„, ์žฌํ˜„์œจ, F1-์Šค์ฝ”์–ด, ์ •ํ™•๋„์—์„œ ๋ˆˆ์— ๋„๋Š” ์ฆ๊ฐ€๋ฅผ ๋ณด์ž„
  • NHD ๊ฐ์†Œ: ALCM-PC์™€ ALCM-Hybrid ๋ชจ๋‘์—์„œ NHD๊ฐ€ ํ˜„์ €ํ•˜๊ฒŒ ๊ฐ์†Œํ–ˆ๋Š”๋ฐ, ์ด๋Š” Ground Truth ์ธ๊ณผ ๊ทธ๋ž˜ํ”„์™€์˜ ๊ตฌ์กฐ์  ์ผ์น˜๊ฐ€ ๋” ๋†’์Œ์„ ์‹œ์‚ฌํ•˜๋ฉฐ ๋ฐ์ดํ„ฐ์…‹ ๋‚ด์˜ ์ธ๊ณผ ๋™์—ญํ•™์— ๋Œ€ํ•œ ๋” ์ •ํ™•ํ•œ ํ‘œํ˜„์„ ํ•˜๊ณ  ์žˆ์Œ์„ ์˜๋ฏธํ•จ.
  • ALCM-Hybrid์˜ ์šฐ์ˆ˜์„ฑ: ALCM-Hybrid๋Š” ALCM-PC๋ณด๋‹ค ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๊ธฐ์กด ์ธ๊ณผ ๋ฐœ๊ฒฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜๊ณผ ๋‹ค์ˆ˜๊ฒฐ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ๊ฒฐํ•ฉํ•˜๊ณ  LLM์„ ํ™œ์šฉํ•˜์—ฌ ์ธํ„ฐ๋„ท์˜ ์ตœ์‹  ์ •๋ณด๋ฅผ ํ†ตํ•ฉํ•˜๋Š” ์ด์ค‘ ์ „๋žต์˜ ํšจ๊ณผ๋กœ ๋ณด์ž„. 
  • LLM ๊ธฐ๋ฐ˜ ์ ‘๊ทผ ๋ฐฉ์‹์˜ ํ•œ๊ณ„: LLM ๊ธฐ๋ฐ˜ ์ ‘๊ทผ ๋ฐฉ์‹์˜ ์ผ๋ถ€ ๊ฒฐ๊ณผ์—์„œ๋Š” ๋‚ฎ์€ ์ •๋ฐ€๋„์™€ ๋†’์€ NHD ๊ฐ’์ด ๊ด€์ฐฐ๋˜์—ˆ๋Š”๋ฐ, ์ด๋Š” LLM์ด ์‹๋ณ„ํ•œ ๊ด€๊ณ„์˜ ์ƒ๋‹น ๋ถ€๋ถ„์ด ์‹ค์ œ Ground Truth์— ์—†์—ˆ์Œ์„ ์‹œ์‚ฌํ•˜๋ฉฐ, ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ํŠน์ด์„ฑ ๋˜๋Š” ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์—์„œ ๊ณผ๋„ํ•˜๊ฒŒ ์ผ๋ฐ˜ํ™”ํ•˜๋Š” ๊ฒฝํ–ฅ๊ณผ ๊ด€๋ จ๋œ ์ž ์žฌ์ ์ธ ๋ฌธ์ œ๊ฐ€ ์žˆ์Œ์„ ์‹œ์‚ฌ.

์ƒˆ๋กœ์šด ๋…ธ๋“œ ๋˜๋Š” ์—ฃ์ง€ ์ถ”๊ฐ€ ๊ฒฐ๊ณผ

Causal graphs for demonstrating new nodes or edges
Results for Uncover, Hidden, or Ignored Nodes and Edges

  • ALCM ํ”„๋ ˆ์ž„์›Œํฌ๊ฐ€ ๊ธฐ์กด ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์ธ๊ณผ ๋ฐœ๊ฒฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ๋†“์น  ์ˆ˜ ์žˆ๋Š” ์ƒˆ๋กœ์šด ๋…ธ๋“œ(๋ณ€์ˆ˜)๋‚˜ ์—ฃ์ง€(์ธ๊ณผ ๊ด€๊ณ„)๋ฅผ ์–ด๋–ป๊ฒŒ ์‹๋ณ„ํ•˜๊ณ  ์ถ”๊ฐ€๋Š”์ง€ ํ™•์ธ 
  • ALCM์€ LLM์ด ๊ฐ€์ง„ ๋ฐฉ๋Œ€ํ•œ ์ตœ์‹  ์ง€์‹๊ณผ ์ „๋ฌธ๊ฐ€ ์ˆ˜์ค€์˜ ๊ฐ๋… ๋Šฅ๋ ฅ์„ ํ™œ์šฉํ•˜์—ฌ ์ด๋Ÿฌํ•œ 'ํŒŒ์•…ํ•˜๊ธฐ ์–ด๋ ค์šด ๋ณ€์ˆ˜(Markov blanket)'์™€ ์ธ๊ณผ ๊ด€๊ณ„๋ฅผ ์ฐพ์•„๋‚ด๋Š” ๋ฐ ํฌ๊ฒŒ ๊ธฐ์—ฌํ•˜๊ณ  ์žˆ์Œ 
    • ALCM์€ LLM ์ปดํฌ๋„ŒํŠธ์˜ ๊ฐ•์ ์„ ํ™œ์šฉํ•˜์—ฌ ๋ฐ์ดํ„ฐ์…‹์— ์กด์žฌํ•˜์ง€ ์•Š๊ฑฐ๋‚˜ ๊ฐ„๊ณผ๋˜์—ˆ๋˜ ์ˆจ๊ฒจ์ง„ ๋ณ€์ˆ˜์™€ ์ธ๊ณผ ๊ด€๊ณ„๋ฅผ ๋ฐํ˜€๋ƒ„
  •  LLM์ด ์ œ๊ณตํ•œ ์‘๋‹ต์˜ ์‹ ๋ขฐ ์ˆ˜์ค€์„ ์š”์ฒญํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ALCM์˜ ๋‹ต๋ณ€์€ Tobacco smoke and involuntary smoking๊ณผ ๊ฐ™์€ ์ตœ์‹  ์˜ํ•™ ๋…ผ๋ฌธ์„ ํ†ตํ•ด ๊ฒ€์ฆ๋˜์—ˆ์Œ

 

๐Ÿ’ฌ 5. ๋น„ํŒ์  ๋ถ„์„

5-1. ํ•œ๊ณ„์ 

(1) ๊ตฌ์กฐ์  ๋งฅ๋ฝ์˜ ์†์‹ค

  • Causal Wrapper๊ฐ€ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„๋ฅผ ํ”„๋กฌํ”„ํŠธ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๊ณผ์ •์—์„œ ์ž ์žฌ์ ์ธ ์ •๋ณด ์†์‹ค์ด๋‚˜ ์™œ๊ณก ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Œ

(2) ํ™•์žฅ์„ฑ ๋ฌธ์ œ ๋ฐ ํ”„๋กฌํ”„ํŠธ ๊ธธ์ด ์ œํ•œ

  • ๋…ธ๋“œ์™€ ์—ฃ์ง€ ์ˆ˜๊ฐ€ ๋งค์šฐ ๋งŽ์€ ๊ณ ์ฐจ์› ๋ฐ์ดํ„ฐ์…‹์˜ ๊ฒฝ์šฐ, ๋ชจ๋“  ์—ฃ์ง€๋ฅผ ๊ฐœ๋ณ„ ํ”„๋กฌํ”„ํŠธ๋กœ ๋ณ€ํ™˜ํ•˜์—ฌ LLM์— ์ „๋‹ฌํ•˜๋Š” ๊ฒƒ์€ ํ”„๋กฌํ”„ํŠธ์˜ ๊ธธ์ด๋ฅผ ์ง€๋‚˜์น˜๊ฒŒ ๊ธธ๊ฒŒ ๋งŒ๋“ค ์ˆ˜ ์žˆ์Œ
  • ์ปจํ…์ŠคํŠธ ๊ธธ์ด ์ œํ•œ์œผ๋กœ ํ”„๋กฌํ”„ํŠธ๊ฐ€ ์ž˜๋ ค ์ •๋ณด ๋ˆ„๋ฝ ์œ„ํ—˜ ์žˆ์Œ

(3) ์•Œ๊ณ ๋ฆฌ์ฆ˜์  ์„ธ๋ถ€ ์ •๋ณด์˜ ์†์‹ค

  • ์ดˆ๊ธฐ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„๋ฅผ ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์ธ๊ณผ ๋ฐœ๊ฒฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ๋‹จ์ˆœํžˆ ๊ทธ๋ž˜ํ”„ ๊ตฌ์กฐ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ๊ฐ ์—ฃ์ง€์— ๋Œ€ํ•œ ํ†ต๊ณ„์  ์œ ์˜์„ฑ, ์‹ ๋ขฐ ๊ตฌ๊ฐ„, ํ˜น์€ ๋Œ€์•ˆ์ ์ธ ๊ทธ๋ž˜ํ”„ ๊ฐ€์„ค ๋“ฑ ๋‹ค์–‘ํ•œ ๋ถ€๊ฐ€ ์ •๋ณด๋ฅผ ์‚ฐ์ถœ
  • Causal Wrapper๊ฐ€ 'raw, initial causal graph'๋งŒ์„ ์ „๋‹ฌํ•˜๊ณ  ์ด๋Ÿฌํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์  ์„ธ๋ถ€ ์ •๋ณด๋ฅผ ํ”„๋กฌํ”„ํŠธ์— ์ถฉ๋ถ„ํžˆ ํฌํ•จํ•˜์ง€ ์•Š์œผ๋ฉด, LLM์ด ๋” ํ’๋ถ€ํ•œ ๊ทผ๊ฑฐ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์ •์ œํ•  ๊ธฐํšŒ๋ฅผ ์žƒ๊ฒŒ ๋จ.

5-2. ๋ณด์™„ํ•  ์ 

(1) ํ”„๋กฌํ”„ํŠธ์— ๊ตฌ์กฐ์  ๋งฅ๋ฝ ์ถ”๊ฐ€

  • ๊ฐœ๋ณ„ ์—ฃ์ง€์— ๋Œ€ํ•œ ์งˆ๋ฌธ ์™ธ์—, ํŠน์ • ์„œ๋ธŒ๊ทธ๋ž˜ํ”„(subgraph), ๊ณตํ†ต ์กฐ์ƒ/์ž์† ๊ด€๊ณ„, ๋˜๋Š” ํŠน์ • ์ธ๊ณผ ํŒจํ„ด(์˜ˆ: "PC ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด X, Y, Z์—์„œ v-๊ตฌ์กฐ๋ฅผ ๊ฐ์ง€ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ‰๊ฐ€ํ•˜์‹ญ์‹œ์˜ค.")์— ๋Œ€ํ•œ ์ •๋ณด๋ฅผ ํ”„๋กฌํ”„ํŠธ์— ํฌํ•จ์‹œ์ผœ LLM์ด ๋” ๋„“์€ ๊ด€์ ์—์„œ ๊ตฌ์กฐ๋ฅผ ์ดํ•ดํ•˜๋„๋ก ์œ ๋„

(2) ์ •๋Ÿ‰์  ์ฆ๊ฑฐ ๋ฐ ์‹ ๋ขฐ๋„ ํฌํ•จ

  • ์ดˆ๊ธฐ ์ธ๊ณผ ๋ฐœ๊ฒฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ๊ฐ ์—ฃ์ง€์— ๋Œ€ํ•ด ๊ณ„์‚ฐํ•œ ํ†ต๊ณ„์  ์‹ ๋ขฐ๋„ ์ ์ˆ˜๋‚˜ ์œ ์˜ ํ™•๋ฅ  ๊ฐ’์„ ํ”„๋กฌํ”„ํŠธ์— ๋ช…์‹œ์ ์œผ๋กœ ์ถ”๊ฐ€ํ•ฉ๋‹ˆ๋‹ค (์˜ˆ: "์•Œ๊ณ ๋ฆฌ์ฆ˜์€ '์˜ค์—ผ'์ด '์•”'์˜ ์›์ธ์ด๋ผ๊ณ  0.85์˜ ์‹ ๋ขฐ๋„๋กœ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค."). ์ด๋ฅผ ํ†ตํ•ด LLM์€ ๋‹จ์ˆœํ•œ ์กด์žฌ ์—ฌ๋ถ€๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ํ•ด๋‹น ๊ด€๊ณ„์˜ ํ†ต๊ณ„์  ๊ฐ•๋„๊นŒ์ง€ ๊ณ ๋ คํ•˜์—ฌ ์ •์ œ ๊ฒฐ์ •

(3) ๋ฐ˜๋ณต์ /๊ณ„์ธต์  ํ”„๋กฌํ”„ํŠธ ์ „๋žต

  • ๊ทธ๋ž˜ํ”„๋ฅผ ๋…ผ๋ฆฌ์ ์ธ ์„œ๋ธŒ๊ทธ๋ž˜ํ”„๋‚˜ ๋ชจ๋“ˆ๋กœ ๋ถ„ํ• ํ•˜์—ฌ ๊ฐ ๋ถ€๋ถ„์„ ๊ฐœ๋ณ„์ ์œผ๋กœ LLM์— ํ”„๋กฌํ”„ํŠธํ•˜๊ณ  ์ •์ œ

(4) Retrieval-Augmented Generation (RAG) ์‹œ์Šคํ…œ ํ†ตํ•ฉ

  • ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๋‚˜ ๋ฌธ์„œ์—์„œ ๊ด€๋ จ ์ •๋ณด๋ฅผ ์‹ค์‹œ๊ฐ„์œผ๋กœ ๊ฒ€์ƒ‰ํ•˜์—ฌ ๋‹ต๋ณ€์„ ์ƒ์„ฑ
  • ์ด๋ฅผ ํ†ตํ•ด LLM์€ ํ”„๋กฌํ”„ํŠธ์— ํฌํ•จ๋œ ์ œํ•œ๋œ ์ •๋ณด๋ฟ๋งŒ ์•„๋‹ˆ๋ผ, ์ตœ์‹ ์˜ ๋ฐฉ๋Œ€ํ•œ ์™ธ๋ถ€ ์ง€์‹(์˜ˆ: ์˜๋ฃŒ ๋ฌธํ—Œ, ๊ณผํ•™ ๋…ผ๋ฌธ)์„ ํ™œ์šฉํ•˜์—ฌ ์ •๋ณด ์†์‹ค ์—†์ด ๋” ์ •ํ™•ํ•˜๊ณ  ๊ทผ๊ฑฐ ์žˆ๋Š” ํŒ๋‹จ
  • ๊ด€๋ จ ๋…ผ๋ฌธ :Causal graph discovery with retrieval-augmented generation based large language models

(5) ์ „๋ฌธ๊ฐ€ ํ”ผ๋“œ๋ฐฑ ๋ฐ ๊ฐ•ํ™” ํ•™์Šต ๋ฃจํ”„

  • ์ •์ œ๋œ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„์— ๋Œ€ํ•ด ์‹ค์ œ ๋„๋ฉ”์ธ ์ „๋ฌธ๊ฐ€์˜ ํ”ผ๋“œ๋ฐฑ์„ ๋ฐ›์•„ LLM์˜ ์ •์ œ ๊ฒฐ๊ณผ๋ฅผ ํ‰๊ฐ€ํ•˜๊ณ , ์ด ํ”ผ๋“œ๋ฐฑ์„ Causal Wrapper์˜ ํ”„๋กฌํ”„ํŠธ ์ „๋žต์„ ๊ฐœ์„ ํ•˜๊ฑฐ๋‚˜ LLM ์ž์ฒด๋ฅผ ์ถ”๊ฐ€๋กœ ํ•™์Šต์‹œํ‚ค๋Š” ๋ฐ ํ™œ์šฉํ•˜๋Š” ๊ฐ•ํ™” ํ•™์Šต(Reinforcement Learning) ๋ฃจํ”„๋ฅผ ๊ตฌ์ถ•

5-3. ๋…ผ๋ฌธ์ด ์ œ์‹œํ•œ ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ

  • ์ง€์‹ ๊ทธ๋ž˜ํ”„(Knowledge Graphs) ํ™œ์šฉ
    •  ์ง€์‹ ๊ทธ๋ž˜ํ”„๋Š” ๊ตฌ์กฐํ™”๋œ ์ง€์‹์„ ํ‘œํ˜„ํ•˜๋Š” ๋ฐ ๊ฐ•๋ ฅํ•œ ๋„๊ตฌ๋กœ, ์—ฐ๊ตฌํŒ€์€ ๋ชจ๋ธ์˜ ์ •ํ™•๋„๋ฅผ ๋”์šฑ ํ–ฅ์ƒ์‹œํ‚ค๊ธฐ ์œ„ํ•ด ์ง€์‹ ๊ทธ๋ž˜ํ”„๋ฅผ ํ™œ์šฉํ•˜๋Š” ๋” ์ •๊ตํ•œ ์ธ๊ณผ ์ธ์‹ ํ”„๋ ˆ์ž„์›Œํฌ(causal-aware framework)๋ฅผ ๊ฐœ๋ฐœํ•  ๊ณ„ํš
  • ๋ชฌํ…Œ ์นด๋ฅผ๋กœ ํŠธ๋ฆฌ ํƒ์ƒ‰(Monte Carlo Tree Search, MCTS) ํ†ตํ•ฉ
    • ALCM ์‹œ์Šคํ…œ์„ ๋”์šฑ ๋™์ ์ด๊ณ  ์ ์‘์ ์ธ ๋ฌธ์ œ ํ•ด๊ฒฐ ์—์ด์ „ํŠธ๋กœ ๋ฐœ์ „์‹œํ‚ค๊ธฐ ์œ„ํ•ด ๋ชฌํ…Œ ์นด๋ฅผ๋กœ ํŠธ๋ฆฌ ํƒ์ƒ‰(MCTS)๊ณผ์˜ ํ†ตํ•ฉ ์ œ์•ˆ. MCTS๋Š” ๋‹ค์–‘ํ•œ ์˜์‚ฌ๊ฒฐ์ • ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ ์ตœ์ ์˜ ๊ฒฐ์ •์„ ๋‚ด๋ฆฌ๋Š” ๋ฐ ์‚ฌ์šฉ๋˜๋Š” ํƒ์ƒ‰ ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ, ์ธ๊ณผ ๋ฐœ๊ฒฌ ๊ณผ์ •์—์„œ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๋Š” ๋ณต์žกํ•œ ์˜์‚ฌ๊ฒฐ์ •์„ ํšจ๊ณผ์ ์œผ๋กœ ์ฒ˜๋ฆฌํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋  ์ˆ˜ ์žˆ์Œ. 
  • ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ(Retrieval-Augmented Generation, RAG) ๋ฐ openCHA ํ†ตํ•ฉ
    • LLM์˜ ํ•œ๊ณ„ ์ค‘ ํ•˜๋‚˜์ธ ํ™˜๊ฐ(hallucination) ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ณ  ALCM ํ”„๋ ˆ์ž„์›Œํฌ์˜ ์—ญ๋Ÿ‰์„ ๊ฐ•ํ™”ํ•˜๊ธฐ ์œ„ํ•ด ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ(RAG) ์‹œ์Šคํ…œ ๋ฐ openCHA์™€์˜ ํ†ตํ•ฉ์„ ์ œ์•ˆ

 

๐Ÿ“Œ 6. ๊ฒฐ๋ก 

6-1. ์—ฐ๊ตฌ๋กœ๋ถ€ํ„ฐ ์–ป์€ ํ†ต์ฐฐ

ALCM์€ ๊ธฐ์กด ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์ธ๊ณผ ๋ฐœ๊ฒฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ํ•œ๊ณ„(์˜ˆ: ๋™์  ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ์ ์‘์„ฑ ๋ถ€์กฑ, ์ˆจ๊ฒจ์ง„ ๋ณ€์ˆ˜ ๊ฐ์ง€ ์–ด๋ ค์›€, ์ „๋ฌธ๊ฐ€ ์˜์กด์„ฑ)์™€ LLM์˜ ํ•œ๊ณ„(์˜ˆ: ์ •๋ฐ€๋„ ๋ถ€์กฑ, ๋ณต์žกํ•œ ์ธ๊ณผ ๊ฐœ๋… ์ฒ˜๋ฆฌ์˜ ์–ด๋ ค์›€)๋ฅผ ์ƒํ˜ธ ๋ณด์™„์ ์œผ๋กœ ๊ฒฐํ•ฉํ•˜์—ฌ ๋” ๋‚˜์€ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•˜๋Š” ์†”๋ฃจ์…˜์œผ๋กœ ์ธ๊ณผ ๊ตฌ์กฐ ํ•™์Šต(Causal Structure Learning), ์ธ๊ณผ ๋ž˜ํผ(Causal Wrapper), LLM ๊ธฐ๋ฐ˜ ์ •์ œ๊ธฐ(LLM-driven Causal Refiner)์˜ ์„ธ ๊ฐ€์ง€ ํ•„์ˆ˜ ๊ตฌ์„ฑ ์š”์†Œ๋กœ ์ด๋ฃจ์–ด์ ธ ์žˆ์Šต๋‹ˆ๋‹ค. ALCM์€ ์ด๋Ÿฌํ•œ ๊ตฌ์„ฑ ์š”์†Œ๋“ค์˜ ํ˜‘์—…์„ ํ†ตํ•ด ๊ธฐ์กด์˜ LLM ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•๋ก  ๋ฐ ์ „ํ†ต์ ์ธ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์ธ๊ณผ ์ถ”๋ก  ๋ฉ”์ปค๋‹ˆ์ฆ˜๋ณด๋‹ค ์ •ํ™•์„ฑ๊ณผ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ ๋ฉด์—์„œ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, LLM์˜ ๋ฐฉ๋Œ€ํ•œ ์ง€์‹ ๊ธฐ๋ฐ˜๊ณผ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํ™œ์šฉํ•˜์—ฌ ๋ฐ์ดํ„ฐ๋งŒ์œผ๋กœ๋Š” ํŒŒ์•…ํ•˜๊ธฐ ์–ด๋ ค์šด ์ธ๊ณผ ๊ด€๊ณ„๋ฅผ ๋ฐœ๊ฒฌํ•˜๊ณ  ๊ธฐ์กด ๊ทธ๋ž˜ํ”„๋ฅผ ์ •์ œํ•˜๋Š” ๋ฐ ๊ธฐ์—ฌํ•ฉ๋‹ˆ๋‹ค.

์ธ๊ณผ ๊ทธ๋ž˜ํ”„์˜ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ๊ณผ ์„ฑ๋Šฅ์„ ๋†’์ด๊ณ  ์ˆจ๊ฒจ์ง„ ๋ณ€์ˆ˜ ํŒŒ์•…์— ์šฉ์ดํ•˜๋‹ค๋Š” ์ ์—์„œ LLM์„ ๋„์ž…ํ•  ์ด์œ ๋Š” ์ถฉ๋ถ„ํ•˜๋‹ค๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค. ๋ฌธ์ œ๋Š” ๊ทธ๋ž˜ํ”„๋ฅผ ์–ผ๋งˆ๋‚˜ ์ž˜ ์ดํ•ดํ•˜๊ณ  ๊ทธ๋ž˜ํ”„์˜ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜ํƒ€๋‚œ ์ธ๊ณผ ๋ฐœ๊ฒฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ๋งฅ๋ฝ์„ LLM์ด ์–ผ๋งˆ๋‚˜ ์ž˜ ์ดํ•ดํ•˜๋А๋ƒ์™€ LLM์˜ ํ• ๋ฃจ์‹œ๋„ค์ด์…˜์„ ์–ผ๋งˆ๋‚˜ ์ž˜ ๋ฐฉ์ง€ํ•˜๋А๋ƒ์ผ ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค.

์ด์ œ๋Š” ์„ค๋ช…ํ•  ์ˆ˜ ์—†๋Š” ๋ธ”๋ž™๋ฐ•์Šค ๋ชจํ˜•์˜ AI๋Š” ํ˜„์—…์—์„œ ๋ฐ˜๊ธฐ์ง€ ์•Š๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ ‡๊ธฐ์— ๋”๋”์šฑ ํ•ด์„์„ ๋„์™€์ฃผ๋Š” LLM๊ณผ์˜ ๊ฒฐํ•ฉ์ด ์•ž์œผ๋กœ๋Š” ํ•„์ˆ˜๊ฐ€ ๋˜์ง€ ์•Š์„๊นŒ ์‹ถ๋„ค์š”.

6-2. ์‹ค์ œ ํ”„๋กœ์ ํŠธ์— ์ ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๋ถ€๋ถ„

ํ”„๋กœ์ ํŠธ์— ํ•ด๋‹น ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ ์šฉํ•œ๋‹ค๋ฉด ์ธ๊ณผ๋ฐœ๊ฒฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์ข€ ๋” ๋‹ค์–‘ํ•˜๊ฒŒ ์จ๋ณด๋ฉด ์ข‹์„ ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค. ์ธ๊ณผ๋ฐœ๊ฒฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜๋„ ๊ฐ๊ฐ์˜ ์žฅ๋‹จ์ ์ด ๋šœ๋ ทํ•˜๊ณ  ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•œ ๋ฐ์ดํ„ฐ ํ˜•ํƒœ๊ฐ€ ์ •ํ•ด์ ธ์žˆ๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ๋‘ ์•Œ๊ณ ๋ฆฌ์ฆ˜๋งŒ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์€ ์œ„ํ—˜ํ•  ๊ฒƒ ๊ฐ™๊ณ , ๋‹ค์ˆ˜๊ฒฐ๋กœ ํŒ๋‹จํ•˜๊ธฐ์— ์ ํ•ฉํ•˜์ง€ ์•Š์•„ ๋ณด์ž…๋‹ˆ๋‹ค. 

๋‹ค์ˆ˜๊ฒฐ์˜ ์›์น™๋„ ๊ฐ ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ํŠน์„ฑ์ด๋‚˜ ์„ฑ๋Šฅ์— ๋”ฐ๋ผ์„œ ๊ฐ€์ค‘์น˜๋ฅผ ๋‹ค๋ฅด๊ฒŒ ์ค„ ์ˆ˜ ์žˆ์„ ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค.  

๋˜ํ•œ ๋ณด์™„์ ์—๋„ ์–ธ๊ธ‰ํ–ˆ๋“ฏ์ด RAG ๋„์ž…์œผ๋กœ ํ• ๋ฃจ์‹œ๋„ค์ด์…˜์„ ์ค„์ด๊ณ  ์ข€ ๋” ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜์˜ ๋‹ต๋ณ€์ด ๊ฐ€๋Šฅํ•˜๊ฒŒ ๊ณ ๋„ํ™”ํ•ด์•ผ ํ•  ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค. 

ํ”„๋กœ์ ํŠธ์— ์ ์šฉํ•œ๋‹ค๋ฉด ์ œ์ผ ๊ด€๊ฑด์€ ํ”„๋กฌํ”„ํŠธ์ผ ๊ฒƒ ๊ฐ™๋„ค์š”. ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ํŠน์„ฑ์„ ์–ด๋–ป๊ฒŒ ์ ์šฉ์‹œํ‚ฌ ์ง€, ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ๋Š” ์–ด๋–ป๊ฒŒ ์ž˜ ์ •์ œํ•ด์„œ context ๊ธธ์ด ์•ˆ์— ์ž˜ ๋„ฃ์„์ง€ ๊ณ ๋ฏผ์ด ํ•„์š”ํ•  ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค. 

์ด๊ฒƒ์ €๊ฒƒ ๊ณ ๋ คํ•ด์•ผ ํ•  ๋ถ€๋ถ„๋“ค์ด ์žˆ์ง€๋งŒ ์ž˜๋งŒ ๋งŒ๋“ ๋‹ค๋ฉด ์ •๋ง ๊ดœ์ฐฎ์€ ์ œํ’ˆ์ด ๋งŒ๋“ค์–ด์ง€์ง€ ์•Š์„๊นŒ ์‹ถ์Šต๋‹ˆ๋‹ค. 

'AI' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

[Causal Analysis] PC ์•Œ๊ณ ๋ฆฌ์ฆ˜  (1) 2025.03.30
ํšจ๊ณผ์ ์ธ ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง (๊ธฐ์ดˆ) : ํ”„๋กฌํ”„ํŠธ ๊ตฌ์„ฑ์š”์†Œ์™€ ํšจ๊ณผ์ ์ธ ํ”„๋กฌํ”„ํŠธ ๊ตฌ์กฐ  (0) 2025.03.02
LLM ๊ธฐ๋ฒ•(Fine-tuning, RAG) ์„ค๋ช… ๋ฐ ์ ์šฉ ๊ฐ€์ด๋“œ  (0) 2025.02.16
[์ตœ์ ํ™” ์•Œ๊ณ ๋ฆฌ์ฆ˜] ์œ ์ „์•Œ๊ณ ๋ฆฌ์ฆ˜ ๊ธฐ๋ณธ ๊ฐœ๋… ๋ฐ ๋ฐฐ๋‚ญ๋ฌธ์ œ ์‹ค์Šต (with python)  (4) 2024.12.22
[LLM] Fine-tuning์‹œ early stopping ์ ์šฉํ•˜๊ธฐ  (1) 2024.03.14
'AI' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€
  • [Causal Analysis] PC ์•Œ๊ณ ๋ฆฌ์ฆ˜
  • ํšจ๊ณผ์ ์ธ ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง (๊ธฐ์ดˆ) : ํ”„๋กฌํ”„ํŠธ ๊ตฌ์„ฑ์š”์†Œ์™€ ํšจ๊ณผ์ ์ธ ํ”„๋กฌํ”„ํŠธ ๊ตฌ์กฐ
  • LLM ๊ธฐ๋ฒ•(Fine-tuning, RAG) ์„ค๋ช… ๋ฐ ์ ์šฉ ๊ฐ€์ด๋“œ
  • [์ตœ์ ํ™” ์•Œ๊ณ ๋ฆฌ์ฆ˜] ์œ ์ „์•Œ๊ณ ๋ฆฌ์ฆ˜ ๊ธฐ๋ณธ ๊ฐœ๋… ๋ฐ ๋ฐฐ๋‚ญ๋ฌธ์ œ ์‹ค์Šต (with python)
๋ฐ์ดby๋ฐ์ด
๋ฐ์ดby๋ฐ์ด
  • ๋ฐ์ดby๋ฐ์ด
    Carpe Diem
    ๋ฐ์ดby๋ฐ์ด
  • ์ „์ฒด
    ์˜ค๋Š˜
    ์–ด์ œ
    • ๋ถ„๋ฅ˜ ์ „์ฒด๋ณด๊ธฐ (55)
      • AI (6)
      • ๋ฐ์ดํ„ฐ๋ถ„์„ (5)
      • MLOps (2)
      • ํ”„๋กœ์ ํŠธ (2)
      • Personal (12)
      • Algorithm (12)
      • TIL (2)
  • ๋ธ”๋กœ๊ทธ ๋ฉ”๋‰ด

    • ํ™ˆ
    • ํƒœ๊ทธ
    • ๋ฐฉ๋ช…๋ก
  • ๋งํฌ

  • ๊ณต์ง€์‚ฌํ•ญ

  • ์ธ๊ธฐ ๊ธ€

  • ํƒœ๊ทธ

    ์ธ๊ณผ์ถ”๋ก 
    causal discovery
    2025 ๋‹ค์ง
    numpy
    change point detection
    2024 ํšŒ๊ณ 
    pc์•Œ๊ณ ๋ฆฌ์ฆ˜
    single-turn
    ๋‚˜๋ฅผ๋งŒ๋‚˜๋Š”๊ธ€์“ฐ๊ธฐ
    ํ‹ฐ์Šคํ† ๋ฆฌ์ฑŒ๋ฆฐ์ง€
    ๋งน๊ทธ๋กœ๋ธŒ๊ณ ์„ฑ
    change point analysis
    Rag
    LLM
    ์ตœ์ ํ™”์•Œ๊ณ ๋ฆฌ์ฆ˜
    ํšŒ๊ณ 
    ์˜ค๋ธ”์™„
    ์œ ์ „์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ˆ์ œ
    #99ํด๋Ÿฝ #์ฝ”๋”ฉํ…Œ์ŠคํŠธ์ค€๋น„ #๊ฐœ๋ฐœ์ž์ทจ์—… #ํ•ญํ•ด99 #til
    ์ธ๊ณผ๋ฐœ๊ฒฌ
    ๋”๋‚˜์€ํ”„๋กœ๊ทธ๋ž˜๋จธ๋˜๋Š”๋ฒ•
    ์œ ์ „์•Œ๊ณ ๋ฆฌ์ฆ˜๊ฐœ๋…
    Python
    ๊ฐœ๋ฐœ์ฑ…์ถ”์ฒœ
    ๊ตฌ๊ฐ„๋ถ„ํ• 
    ๋ฐ์ดํ„ฐ์‹œ๊ฐํ™”
    AI
    ai๋Œ€ํ•™์›์ง„ํ•™
    ์ด์ƒํƒ์ง€
    ๋ณ€ํ™”์ ์ฐพ๊ธฐ
  • ์ตœ๊ทผ ๋Œ“๊ธ€

  • ์ตœ๊ทผ ๊ธ€

  • hELLOยท Designed By์ •์ƒ์šฐ.v4.10.3
๋ฐ์ดby๋ฐ์ด
[๋…ผ๋ฌธ๋ฆฌ๋ทฐ] ALCM: Autonomous LLM-Augmented Causal Discovery Framework
์ƒ๋‹จ์œผ๋กœ

ํ‹ฐ์Šคํ† ๋ฆฌํˆด๋ฐ”