chanmuzi

<Distillation, DPO> Zephyr: Direct Distillation of LM Alignment (2023.10)

2023.11.28· Paper Review

관심있는 NLP 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 🙇‍♂️ usechatgpt init success [H4 Team] - distilled Direct Preference Optimization (dDPO)를 적용하여 sLLM이 user intent에 잘 align 될 수 있도록 함 - fine-tuning 동안 추가적인 sampling 없이 Mistral-7B 모델을 학습한 Zephyr-7B 모델을 공개 1. Introduction capable teacher model의 output을 사용하는 distilled supervised fine-tuning (dSFT) 등의 방법론이 연구 그럼에도 불구하고 여전히 smaller LM들은 not "..

<CoT> Chain-of-Knowledge: Grounding Large Language Models via Dynamic Knowledge Adapting over Heterogeneous Sources [CoK] (2023.10)

2023.11.27· Paper Review

관심있는 NLP 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 🙇‍♂️ usechatgpt init success [Alibaba, Singapore University] - 다른 source로부터의 정부를 dynamically incorporating 함으로써 LLM을 augment하는 framework, Chain-of-Knolwedge (CoK) - CoK는 구조화된 Wikidata나 table 같은 knowledge source도 이용 가능 1. Introduction hallucination 현상과 updated factual knowledge를 반영하지 못하는 것이 LLM의 단점으로 제기되어 왔음 이를 해결하기 위해 external knowledg..

<LK Lab, Chatbot> Keep Me Updated! Memory Management in Long-term Conversations (2022.10)

2023.11.25· Paper Review

관심있는 NLP 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 🙇‍♂️ usechatgpt init success [Naver Clova, KAIST AI] - 여러 턴의 대화 중에서도 유저에 대한 최신 정보를 잘 불러오는 long term conversations을 위한 데이터셋 구축 - 불필요하거나 더이상 쓸모가 없어진 memory는 삭제하는 방식으로 long term conversation을 효과적으로 유지 Backgrounds human interaction의 관점에서 memory는 대화를 유지하기 위해 가장 중요한 메커니즘 중 하나 그러나 효과적으로 memory를 관리하거나 업데이트하는 것이 쉽지 않은 상황 Related Works Personali..

2023 OSSCA (오픈소스 컨트리뷰션 아카데미) 파이토치 및 파이토치 라이트닝 문서 번역 참여 후기

2023.11.24· 후기

지난 7월부터 시작한 오픈소스 컨트리뷰션 아카데미 프로그램을 수료했습니다..! 취업 할 때쯤 이것저것 찾아보다가 조금이나마(..?) 스펙에 도움될 수 있는 것들을 도전하게 되었는데 그중 파이토치가 끌려서 시작하게 되었죠. 한창 기본적인 내용들을 집요하게 공부해야겠다는 생각을 하고 있기도 했고, 강의 자료들을 번역해서 올리는 작업을 개인적으로도 하고 있어서 큰 부담이 없을 것으로 예상했습니다. 다른 프로그램에 참여한 분의 후기를 들어보니 프로젝트마다 몰입도 차이가 꽤 크더라구요! 저희는 그래도 큰 부담없이 진행할 수 있는 프로젝트였는데 굉장히 빡센 경우들도 있었습니다. 그래서 저는 다음과 같은 분들에게 이 프로그램을 추천하고 싶습니다. - 관심있는 오픈소스(프레임워크 등)가 확실히 있으신 분 - 프로젝트에..

<sLLM, Distillation> Orca 2: Teaching Small Language Models How to Reason (2023.11)

2023.11.24· Paper Review

관심있는 NLP 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 🙇‍♂️ usechatgpt init success [Microsoft Research] - small LMs이 각 태스크에 적합한 solution strategies를 이용하는 방법을 학습시키는 것이 목표 - 기존 모델 Orca 1 대비 강한 추론 능력을 보유할 수 있도록 학습하여 최대 10x 사이즈 모델보다도 우월한 성능을 보이는 경우가 많음을 확인함 배경 LLM이 unseen tasks에 대해 문제를 잘 처리할 수 있는 zero-shot ability가 알려짐 그러나 단순히 Teacher model의 output을 모방하는 Imitation Learning 방식은 한계가 존재 따라서 여러 태..

<LK Lab, Prompt> [PI] Prompt Injection: Parameterization of Fixed Inputs (2022.05)

2023.11.23· Paper Review

관심있는 NLP 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 🙇‍♂️ usechatgpt init success [LK Lab, KAIST] - prompt를 LM의 파라미터에 주입하는 방식, Prompt Injection (PI)를 제안 - novel distillation approach, Pseudo-INput Generation (PING)를 제안 - prompt를 input에 prepend하는 기존 방식 대비 우수한 성능 달성 배경 input에 prompt를 attach함으로써(prefixes) LM을 특정 태스크에 맞게 조정하는 것이 가능 그러나 이처럼 prompt와 input을 단순 concatenate하는 prompt-dependent 방식은..

전체 글

티스토리툴바