chanmuzi

<Continual Learning> Adapting Large Language Models to Domains via Reading Comprehension (2023.09, ICLR 2024)

2024.08.02· Paper Review

관심 있는 NLP 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 🙇‍♂️usechatgpt init success[Microsoft, BIGAI]- raw corpora로 continued pre-training을 수행하는 경우 도메인 지식은 늘어나지만 prompting 능력은 급격하게 감소함을 확인- raw corpora를 reading comprehension texts로 바꾸는 간단한 방법을 제안- 이는 어떤 종류의 pre-training corpora에도 적용 가능한 방식: 본 논문에서는 biomedicine, finace, law 분야에서 활용 출처 : https://arxiv.org/abs/2309.09530 Adapting Large Lang..

<Instruction tuning> Symbol tuning improves in-context learning in language models (2024.01) (EMNLP 2023)

2024.07.25· Paper Review

관심 있는 NLP 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 🙇‍♂️usechatgpt init success[Google, Stanford University]- 모델이 태스크를 이해할 때 참고할 instruction 또는 natural language가 없는 경우, input-label mapping을 정보로 이용하는 Symbol Tuning을 제안- unseen in-context learning tasks에 대한 성능이 뛰어나고 underspecified prompts에 더욱 robust하게 됨 - 학습하지 않았던 algorithmic reasoning task에 뛰어난 성능 & flipped-labels 태스크 수행 능력이 복구됨 출처 : ht..

<Document, Multi-modal> BROS: A Pre-trained Language Model Focusing on Text and Layout for Better Key Information Extraction from Documents (2021.08) (AAAI 2022)

2024.07.19· Paper Review

관심 있는 고전(?) 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 🙇‍♂️usechatgpt init success[Naver Clova, KAIST, LBox, Upstage]- Key information extraction (KIE) 태스크를 잘 처리하기 위해 text와 layout을 효과적으로 결합하는 방식을 고안- BROS (BERT Relying On Spatiality): text를 2D 공간에서 relative position encoding 하고 area-masking strategy를 적용- 현실 세계에서 다루기 어려운 두 가지의 문제(incorrect text ordering, fewer downstream examples)에도 강건함..

<Evaluation> FActScore: Fine-grained Atomic Evaluation of Factual Precision in Long Form Text Generation (2023.05)

2024.06.27· Paper Review

관심 있는 NLP 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 🙇‍♂️Published as a main conference paper at EMNLP 2023. Code available at this URLusechatgpt init success[University of Washington, AI2, Meta AI]- long-form text generation의 factuality를 평가할 때, binary judgments(supported/unsupported) & huge cost of human evaluatoin 이슈가 존재- 생성 결과를 일련의 atomic facts로 쪼갠 뒤 각 fact를 평가한 결과를 합쳐 score를 구하는 방식..

<Multi-modal> [CLIP] Learning Transferable Visual Models From Natural Language Supervision (2021.02)

2024.06.15· Paper Review

관심 있는 NLP 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 🙇‍♂️usechatgpt init success[OpenAI]- 당시 computer vision system의 SoTA 모델은 사전 정의된 object 카테고리를 예측하도록 학습됨- 이미지와 어울리는 설명(caption)을 예측하도록 하는 사전학습 방식을 제안- fully supervised baseline과 비교했을 때, dataset specific training을 할 필요가 없음 (zero-shot 성능을 강조) 출처 : https://arxiv.org/abs/2103.00020Introduction논문이 제출되었던 2021년 초라면 아직 챗지피티도 나오기 한참 전이니..당시의 CV..

VSCode에서 제대로 Debugging 하는 방법

2024.06.04· CS

안녕하세요, chanmuzi입니다.오늘은 많은 개발자가 사용하는 VSC에서 어떻게 debugger를 제대로 사용할 수 있는지에 대해 포스팅하려고 합니다! 🪲❌ 코드를 작성하기 시작한지 그래도 꽤 시간이 지났는데, 말로만 debugging이 중요하다 듣기만 하고 print 함수를 사방팔방 썼다가 지우는 방법밖에 잘 몰랐습니다.그런다고 사용 방법을 찾아봐도 본인만 알아보기 쉬운 글들 뿐이고..다양한 상황에 어떻게 대처할 수 있는지 알기가 어렵더라고요 🥲 그래서 디버깅을 하면서 직접 알게 된 아주 유용하고 쓸모있는 기능들을 글로 정리하여 나중에도 또 활용하는 것이 목표입니다.혹시라도 잘못된 내용이 있거나 추가적으로 알려주고 싶은 내용이 있다면 댓글로 편하게 말씀 부탁드립니다 ☺️1. json 파일부터 작성..

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

전체 글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역