'분류 전체보기' 카테고리의 글 목록 (2 Page)

1. 문제 발견Feature Engineering 관련 업무를 진행하다 22개의 주요 피쳐를 추출하는 pycatch22의 파이썬 패키지에서 잘못된 점을 발견했습니다. 참고로, catch22(“Canonical Time-series CHaracteristics”)는 2019년 Lubba 외 연구진이 제안한, 시계열 데이터의 핵심 성질을 빠르고 직관적으로 추출할 수 있는 22가지 피쳐 집합을 추출하는 패키지입니다. 각 피처는 엔트로피, 자기상관, 스펙트럼 전력, 모티프 통계 등 시계열의 동적 거동을 대표하는 정보를 담고 있으며, 모두 C로 최적화되어 있어 계산 속도가 매우 빠릅니다. 이런 특징 덕분에 catch22는 시계열 분류나 클러스터링 같은 머신러닝 과제에서 효율적이면서도 해석 가능한 피처 엔지니어링 ..

🧠 1. 논문 개요 AuthorElahe Khatibi1, Mahyar Abbasian1, Zhongqi Yang1, Iman Azimi1, and Amir M. KeywordsLLM Causal Discovery Publication DateMay 2, 2024 Abstract고차원 데이터셋에서 효과적인 인과 추론을 수행하기 위해서는 관찰 데이터를 기반으로 인과 그래프를 생성하는 인과 발견이 필수적입니다. 그러나 완전하고 정확한 인과 그래프를 얻는 것은 NP-난해 문제로 여겨지는 어려운 과제입니다. 본 연구에서는 데이터 기반 인과 발견 알고리즘과 LLM을 결합하여 더 견고하고 정확하며 설명 가능한 인과 그래프를 자동으로 생성하는 새로운 프레임워크인 '자율 LLM 증강 인과 발견 프레임워크(ALCM)..

간단한 챗봇 구현으로 알아보는 싱글턴과 멀티턴 차이 ChatGPT와 대화를 할 때 이전의 대화 내용을 기억하고 있어 질문을 모호하게 했는데도 찰떡같이 알아듣고 잘 대답해 준 경험이 있는데요. 이렇게 이전 대화 내용을 기억하고 여러 번 대화를 주고받으면서 응답하는 방식을 멀티턴이라고 합니다. 멀티턴이 가능한 챗봇을 구현하기 위해 싱글턴과 멀티턴의 개념 차이를 다시 한번 짚고, 구현 코드와 결과를 비교해보고자 합니다. 그리고 실제 챗봇처럼 스트리밍 방식으로 응답이 빠르게 출력되는 것까지 간단하게 Gradio를 통해 구현해 보겠습니다. GradioGradio는 머신러닝 모델을 웹 앱으로 쉽게 배포할 수 있도록 도와주는 사용자 친화적인 인터페이스를 갖춘 python 기반 오픈소스 라이브러리입니다. 특징간단한 ..

# 발산팸의 시작 발산팸은 이력서 모임에서 만난 ENTP 세분의 '무한발산'에서 시작되었다. 발산을 멈추고 이제는 수렴을 하자는 취지로 맹그로브 고성을 같이 가기로 하였고, 2인실 예약의 남은 빈자리를 채우기 위해 나도 같이 가게 되었다. 나도 한 발산하는 ENTP(J)이므로 수렴이 필요한 상황이었고 같이 가는 분들과 친해지고 싶다고 예전부터 생각해 왔기 때문에 무리를 해서라도 꼭 가고 싶었다. 실제로 그날 오전에 4시간 짜리 자격증 시험이 있어 전날까지 공부하고 오후에 따로 출발하게 되었다… 다시 생각해도 오후에 늦게라도 고성에 갔던 건 올해 한 일 중 정말 정말 정말 제일 잘한 선택이었다. # 수렴하고 싶었던 생각들 맹그로브 고성을 가기 전 요즘 고민하고 있는 주제들, 수렴해야 할 내용들을 정리해 ..

1. 인과발견의 개념과 필요성 인과발견이란 데이터에서 변수 간의 인과관계를 밝히는 과정으로, 이 관계를 그래프 형태로 표현합니다. 인과발견이 중요한 이유는 특정 변수가 다른 변수에 미치는 영향을 정확하게 파악해야 목표 변수의 값을 효과적으로 제어할 수 있기 때문입니다. 예를 들어, 제조 공정에서 이상이 발생했을 때 원인이 되는 변수를 명확하게 특정해야 해당 변수를 모니터링하며 이상을 감지하고, 필요할 경우 해당 값을 조정하여 문제 발생을 방지할 수 있습니다. 일반적으로 변수 간의 관계를 확인할 때 상관관계를 이용하지였지만, 단순한 상관성만 확인해서는 인과관계를 명확히 밝힐 수가 없습니다. 예를 들어, X가 Y의 상관성이 높게 나타났을 때는 3가지 경우가 있을 수 있습니다.(1) X가 Y의 원인이다. (2..

고민의 시작입사 때부터 대학원 진학을 생각했던 것은 아니다. 대학원을 가지 않고도 비전공자지만 취업을 할 수 있었고, 대학원을 나온 다른 동료들과 업무 능력을 비교했을 때 부족하다고 느끼지도 않았다. 그렇지만 어렴풋이 '대학원을 나오면 더 좋지 않을까?'라는 생각은 갖고 있었다. 그 이유는 채용공고를 보면 자격조건에 석사를 우대하거나 지원자격 자체가 석사 이상인 경우가 많았기 때문에 석사라는 타이틀을 갖고 싶었고, 비전공자로서 이 직무를 잘할 수 있다고 증명하기 위해 필요하지 않을까 생각이 들었다. 하지만 석사라는 타이틀의 효과, 학사 출신의 한계를 느끼진 않았던 터라 대학원의 필요성을 느끼지 못했다. 그러다 이직한 회사에 오니 대학원을 나온 사람들이 다수인 것을 알게 되었다. 팀원 10명 중 7명이 통..

이번 글은 프롬프트를 작성할 때 기본적으로 이해하면 좋을 기초 내용으로 프롬프트의 구성요소, 프롬프트의 구조에 대해서 예제와 함께 소개하고 있습니다.1. 프롬프트 엔지니어링이란? 프롬프트 엔지니어링(Prompt Engineering)은 AI 모델 (LLM, Large Language Model)이 내가 원하는 답변을 출력할 수 있도록 프롬프트를 효과적으로 설계하고 최적화하는 기술을 말합니다. 여기서 프롬프트(Prompt)는 AI에게 주어지는 입력 문장을 말합니다. 쉽게 말해, 우리가 ChatGPT에게 물어볼 때 입력하는 문장과 질문들이라고 보면 됩니다. 단순하게 내가 모르는 부분에 대해서 질문만 입력할 수 있지만, '개조식으로 말해줘', '영어로 말해줘'와 같이 특정 지시도 함께 전달할 수 있는데요...

검색 대신 챗봇에 먼저 물어보는 게 일상이 되어 버린 요즘, 이제 LLM(Large Language Model)은 혁신 기술에서 하나의 트렌드가 된 것 같습니다. 특정 산업 분야 가리지 않고 LLM이 사용되고 있다 보니, 모든 기업에서 LLM을 도입해 새로운 서비스를 제공하길 원하고 있습니다. 이로 인해 LLM을 도입하기 위해 어떻게 해야 하는지 궁금한 분들이 있을 것 같아 한 번 정리해 봤습니다. 이 글은 LLM을 만드는 대표적인 방법 두 가지, 파인튜닝(fine tuning)과 RAG(Retrieval Augmented Generation) 기법에 대한 개괄적인 내용을 다루고 있어 LLM에 대해 이제 막 공부를 시작한 사람들, LLM 도입을 검토 중인 사람들이 보면 좋을 것 같습니다. ✔️ LLM 모..

코드트리 X 글또 블로그 챌린지를 통해 작성하는 한 달 코드트리 후기 코테 준비를 하고 있는 개발자라면 백준, 프로그래머스, 리트코드 등 다양한 코딩테스트 문제 플랫폼을 접하고 있을텐데요. 그 중에서 '코드트리'라는 코딩테스트 대비 학습 플랫폼을 접해 보고 그 후기를 남겨봤습니다. 이 포스팅은 코드트리 x 글또 블로그 챌린지 2기를 통해 코드트리 체험권을 받아 작성한 후기입니다. 코드트리의 장점(1) 체계적인 커리큘럼처음 코드트리를 접하고 제일 먼저 감동받았던 포인트는 나의 수준에 맞춰 학습 커리큘럼이 잘 짜여있다는 것이었습니다. 코딩테스트를 준비하려고 할 때 제일 막막했던 부분 중 하나가 어디서부터 뭘 해야 할 지 모른다는 것인데 코드트리는 그런 고민을 해결해줄 수 있도록 학습 수준 별로 학습해야 할..

아닛, 벌써 한 달이 지나갔다고?새해에 대한 부푼 설렘을 갖고 목표를 작성했던 게 엊그제 같은데.. 벌써 한 달이 지나갔습니다. 하고 싶은 게 많고 해야 할 게 많다고 생각해서 그런지 항상 시간에 쫓기며 시간이 부족하다고 느끼네요. 하루하루를 돌아보면 그날의 감정과 상황에 충실했다 생각하는데 한 달을 되돌아보면 항상 아쉬움이 남습니다. 다음 달에는 덜 아쉬움이 남도록 월별 회고를 진행해보려고 합니다.KPT 기법을 이용한 1월 회고회고를 하는 다양한 기법들이 존재하지만 저에게 잘 맞는 회고 방법은 KPT 회고법입니다. 질문으로 구성된 회고가 아니라서 질문에 한정되지 않고 좀 더 자유롭게 한 달을 돌아볼 수 있어 좋아합니다. KPT는 Keep + Problem + Try의 약자로, 의미는 아래와 같습니다...

티스토리툴바