2025-03-01 ~ 2030-02-28
Research 3.0
한국연구재단 Funded
미래 방향 제시 Large Language Model Prompt Engineering
강현석, 황태욱, 서혜인, 정지수, 남궁혁, 한예림, 김은빈, 편고운, 허인범
  • 생성형 AI – 연구자 협업 연구 프레임워크 구축 (연구 전주기에서 AI 지원)
  • 공동 논문화 작업을 위한 인간-기계 협력형 멀티에이전트 프레임워크 구축
AI-Centered
Research
2024-07-01 ~ 2025-12-31
연합학습 기반 ADMET-PK/PD 모델 개발
한국보건산업진흥원 Funded
Federated Learning ADMET_PBPK Prediction Multi-Domain
강현석
  • 연합학습 기반 약동학·약력학 예측 모델(FAM-PK/PD) 개발
  • Text Symbol로 표현된 약물 및 아미노산 정보와 Numeric 형태의 임상 파라미터를 활용하여 물리화학적 특성을 예측하는 모델 연구
  • 로컬 데이터의 불균형 및 분산 환경을 고려하여 학습 파라미터를 효과적으로 통합하는 Training Model Merge 기법 제안
AI+BIO
2024-01-01 ~ 2024-12-31
대화이력 반영 문장 유사도 학습 및 데이터 증강 연구
한국전자통신연구원(ETRI) Funded
Large Language Model Feedback Generation Feedback Ranking
서혜인
  • 대규모 언어 모델을 활용한 튜터링 피드백 자동 생성
  • 순위화 모델 훈련 및 평가
AI-Centered
Education
2024-01-01 ~ 2024-10-31
복수 Large Language Model으로 시각 데이터를 반영한 문장을 생성할 수 있는 Multi-Modal 기반 문장 생성 프레임워크
국가보안기술연구소(NSR) Funded
Text Generation Multi-Modal Multi-LLMs
강현석
  • 시각 데이터(Chart) 구성 요소를 반영한 문장 생성 프레임워크 개발
  • Chart 해석 목적을 반영한 문장 생성 제어 문법 연구
  • Chart 기반 문장 생성을 위한 입력 프롬프트 구조 제안
Data-Centric
NLP
2023-01-01 ~ 2023-12-31
대규모 언어모델 기반 제어 가능 문장표현 및 생성
한국전자통신연구원(ETRI) Funded
Automatic Training Factual Consistency Checker Large Language Model
정지수, 이치현
  • 특정 문장에 대해 검색을 통해 근거를 수집
  • 대규모 언어모델을 통해 데이터의 근거를 선택
  • 자동화 학습을 통해 Factual Verification 모델을 자동 생성
Data-Centric
NLP
2023-01-01 ~ 2023-12-31
복수 대규모 언어모델에 기반한 제어 가능형 한국어 문자열생성 프레임워크
국가보안기술연구소(NSR) Funded
Multi-LLMs Data Augmentation Prompt Engineering
강현석, 남궁혁
  • 편향 및 데이터 부족을 보완하기 위한 Multi-LLMs 기반 데이터 증강 방법 제안
  • Multi-LLMs의 입출력 구조에 따라 증강 데이터의 구조적/의미적 유사성을 제어
  • 문장의 구성과 사용 어휘를 다양화한 증강 결과 확인
Data-Centric
NLP
2022-12-01 ~ 2023-08-31
대용량 언어모델 기반 데이터 선별 및 정형데이터 활용 문장 생성 기술 개발
KT Funded
Model Difficulty Curriculum learning Easy-to-hard
정지수, 서혜인, 남궁혁
  • 딥러닝 모델이 어려워하는 데이터를 수치화 및 파악
  • Curriculum learning을 통해 쉬운 데이터부터 어려운 순으로 학습
  • 특수 도메인에 대하여 성능의 향상을 보임
Updated NLP
2022-04-01 ~ 2022-12-31
제어 가능한 한국어 문자열 생성 기술 연구
국가보안기술연구소(NSR) Funded
Text Generation Template-based Text Generation Constraints Extractor
서혜인, 정지수
  • 유사성 정의 및 제어문법 연구
  • 한국어 문자열 제어문법 데이터 구축
  • 한국어 문자열 생성을 위한 기초모델 개발
Data-Centric
NLP
2022-03-01 ~ 2022-11-30
대화표현 벡터학습 및 문장생성
한국전자통신연구원(ETRI) Funded
Data Augmentation Template-based Text Generation Contrastive Learning
서혜인, 정지수
  • 범도메인 대응 가능 벡터공간 구성 기술 연구
  • 제약조건 반영 문장생성 기술 연구
  • 문장 유사도 검증 기술 연구
Semantic Representation
2022-01-01 ~ 2022-04-30
모빌리티 배터리 냉각을 위한 AI기반 열관리 시스템 기술 개발
SCSM Funded
Reinforcement Learning Time Series Prediction
강현석, 남궁혁
  • 냉각기를 효율적으로 동작하는 강화학습 모델
  • 강화학습 모델을 학습하기 위한 시뮬레이션 모델
  • 냉각기에서 강화학습 모델과 연결하여 작동
General Intelligence
2021-12-20 ~ 2022-09-20
대용량 언어모델 기반 대화체 생성요약 기술 개발
KT Funded
Dialogue Summarization Constrained Learning Text Generation
정지수, 서혜인
  • Constraint markup language(CML) 고안
  • 자동화된 제약조건 구축 방법 및 평가 방법 설계
  • 모델에서 생성된 생성 문장에 대해 제약조건을 기준으로 재순위화(reranking), 최종 요약문 결정
Data-Centric
NLP
2021-09-01 ~ 2021-11-01
트랜스포머 모델을 이용한 특허 질의응답 신경망 검색 시스템 개발
ISoft Lab
Neural Search Engine Semantic Search
이윤민
  • 특허 정보 검색 시 유사 문장 검출기를 통한 유사 질문 문장 추출
  • 특허 도메인으로 미세 조정한 신경망 모델을 통해 추출된 유사 질문 문장의 우선순위 재지정
Interactive Neural Search
2021-04-01 ~ 2021-10-31
의미·구조적 유사성을 가진 한국어 문자열 생성 기술 연구
국가보안기술연구소(NSR) Funded
Natural Language Generation Text Generation Data Augmentation Semantic Control Grammar Syntax Control Grammar Cosine Similarity
서혜인
  • 문장의 다양한 제약조건과 의미, 구조적 정보가 포함된 벡터공간 구성
  • 벡터공간으로부터 문장 생성 기술 연구
  • 벡터공간을 활용하는 유사성 검증 기술 연구
Data-Centric
NLP
2021-03-01 ~ 2021-11-30
해석 및 제어가능 의미벡터 학습 및 문장생성
한국전자통신연구원(ETRI) Funded
Natural Language Understanding Text Generation Sentence Similarity Self-Supervised Learning
황태욱
  • 해석 및 제어 가능한 벡터공간 구성
  • 딥러닝 기반 준지도 문장 의미 표현학습 및 문장 생성
  • 벡터기반 문장 유사도 평가
  • 생성 문장 적합도 평가를 통한 대화 자동 평가
Data-Centric
NLP
2021-02-05 ~ 2021-09-30
보이스봇 중심 AI 기술을 국세행정에 접목하는 방안
국세청 Funded
Voicebot 미래 방향 제시
김현지, 서혜인
  • 포스트 코로나 시대의 세정환경 변화에 대응해나갈 수 있도록 국세청의 미래지향적 기능, 역할, 개선 방안 등을 연구를 통해 2030 미래 국세행정 방향 제시
General Intelligence
2020-11-23 ~ 2021-08-31
Knowledge graph 기반 다중 문서 분석 기술 개발
KT Funded
Classification QA Factual Consistency Checker
정지수
  • 요약문의 퀄리티를 측정하기 위한 새로운 접근 방법
  • 요약문의 원문 반영도를 살피기 위해 원문-요약문의 핵심 질문에 대한 정답 일치도 도입
Interactive Neural Search
2020-11-09 ~ 2021-02-28
신조어 중요도 설정 및 카테고리 맵핑 프레임워크
NCSOFT Funded
Data Classification New Word Category Mapping
황태욱
  • 지속가능한 데이터 수집 및 가공
  • 신조어 카테고리 분류 기술
Updated NLP
2020-06-01 ~ 2020-09-30
신조어 탐지를 위한 신규 명사구 추출 기술
NCSOFT Funded
Build New Word Dataset New Word Detection
황태욱
  • 신조어 데이터 수집
  • 대용량 말뭉치와 도메인 말뭉치를 활용한 신조어 탐지
Updated NLP
2020-04-01 ~ 2020-10-31
생성신경망 기반 한국어 문자열 생성 기술 연구
국가보안기술연구소(NSR) Funded
Natural Language Generation Text Generation Semantic Similarity Syntax Similarity Data Augmentation
서혜인
  • 선학습에 기반한 유사 표현 벡터공간 구성 방법
  • 벡터공간 구성 시 의존구문분석 등의 구조적 연관성 연계 기법 연구
  • 유사 표현 벡터로부터의 문장 생성
Data-Centric
NLP
2020-03-15 ~ 2020-11-15
대화 자동평가를 위한 선학습 기반 조합형 의미벡터 학습 기술 연구
한국전자통신연구원(ETRI) Funded
Correspondence Learning Semantic Vector Learning
황태욱
  • 자연어와 의미틀의 상호연관성 학습
  • 유사한 의미를 가진 문장 벡터가 같은 위치에 배치되도록 학습
Semantic Representation
2019-07-01 ~ 2019-11-30
딥러닝 기반 질의응답 자연어처리 기술 활용 시스템 연구
한국전자통신연구원(ETRI) Funded
정상근
  • 과거 사건상황 및 지령 데이터 분석
  • 규칙 및 기계학습에 기반한 신속 정확한 지령 생성
General Intelligence
2019-05-01 ~ 2019-09-30
인공지능을 활용한 인간행동분석 기술개발
한국행동과학연구소 Funded
Human Behavior Analysis Image to Text
정상근
  • 인간행동분석 방법에는 많은 시간과 전문적인 훈련이 필요하였으나, 과거 분석 데이터를 통해 훈련한 인공지능 기술은 전문가에 준하는 행동분석 능력을 보임
  • Multimodal 데이터로 부터 분석 코멘트 자동생성
General Intelligence