chanmuzi

<Distillation> [Tutok-KD] Tutoring Helps Students Learn Better: Improving Knowledge Distillation for BERT with Tutor Network (2022.12)

2023.12.11· Paper Review

관심있는 NLP 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 🙇‍♂️ usechatgpt init success [DI Lab, Korea University] - 사전 학습 동안에 학습 예시들의 난이도를 조절함으롰 dillation의 효율성을 높인 Tutor-KD - 샘플의 난이도는 teacher model에게는 쉽고 student model에게는 어려운 것으로 조절 - policy gradient method를 활용 1. Introduction Pre-trained Language Models (PLMs)은 뛰어난 성능으로 NLP 분야에서 크게 주목 받았으나 많은 자원을 필요로 한다는 한계를 지님 이를 해결하기 위한 방법 중 하나로 Knowledge D..

<Curriculum> Efficient Pre-training of Masked Language Model via Concept-based Curriculum Masking (2022.12)

2023.12.08· Paper Review

관심있는 NLP 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 🙇‍♂️ usechatgpt init success [DI Lab, Korea University] - 언어 모델을 효과적으로 pre-train하는 concept-based curriculum masking (CCM) method를 제안 - MLM (Masked Language Modeling)의 난이도는 linguistic difficulty를 기준으로 삼음 1. Introduction 자연어 처리 분야에서 MLM (Masked Language Modeling)은 모델 성능 향상에 크게 기여했으나 많은 양의 연산 자원을 필요로 한다는 문제점을 안고 있었음 CL (Curriculum Learnin..

<LLM> The Falcon Series of Open Language Models (2023.11)

2023.12.07· Paper Review

관심있는 NLP 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 🙇‍♂️ usechatgpt init success [Technology Innovation Institute, Abu Dhabi] - Falcon-7/40/180B 모델을 공개 - RefinedWeb 데이터셋 중 600B 토큰을 공개 (전체는 5T 토큰이라고 언급) - Falcon series에 대한 detailed research 1. Introduction 언어 모델의 폭발적인 성장 및 발전은 transformer 아키텍쳐의 scability에 근간을 두고 있습니다. 본 논문에서는 이를 세 가지 관점(axes)에서 살펴보고 있습니다. Performance Scability: 사전학습에 들어가..

2023 Google Machine Learning BootCamp 후기 (feat. 졸업식 🎓)

2023.12.02· 취업/부트캠프

지난 9월부터 시작한 구글 머신러닝 부트캠프를 수료했습니다 🎉 저는 구글 부캠을 통해서 좋은 사람들과 관계 맺는 것이 목표였는데, 이를 충분히 달성한 것 같아서 만족스럽네요 ☺️ [목차] 1. 부트캠프 추천 대상 2. 굿즈 자랑 3. 부트캠프 활동 4. 졸업식 1. 부트캠프 추천 대상! 올해는 구글 부캠 4기였는데요, 지원자가 굉장히 많았다고 하더라구요. 뽑는 사람의 숫자도 많이 늘었고 그만큼 지원자도 많아서 구글 부캠에 입과하지 못하신 분들의 이야기도 종종 들었던 것 같습니다 🥲 지원할 때를 회상해보면 되게 재밌는 지원 자격 중 하나가 '취업'을 목표로 하는 사람이어야한다는 것이었습니다. 저는 결이 조금 달랐던 것 같긴 한데요..! 제가 생각하는 이 프로그램에 적합한 사람은 다음과 같습니다. 1. 파이..

<Prompt> LongLLMLingua: Accelerating and Enhancing LLMs in Long Context Scenarios via Prompt Compression (2023.10)

2023.11.30· Paper Review

관심있는 NLP 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 🙇‍♂️ usechatgpt init success [Microsoft Corporation] - 길이가 긴 텍스트에서 핵심 정보를 효과적으로 추출할 수 있도록하는 prompt compression 기법, LongLLMLingua - higher performance, much less cost, reduced latency 1. Introduction LLM의 능력을 최대로 끌어내기 위해서 각 downstream task에 적합한 prompt를 design하는 것이 중요하다는 것은 이미 잘 알려져있음 그러나 LLM을 long context scenarios에서 활용하는 것은 다음 문제점들을 야기..

<Benchmark> GAIA: A Benchmark for General AI Assistants (2023.11)

2023.11.29· Paper Review

관심있는 NLP 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 🙇‍♂️ usechatgpt init success [FAIR, Meta, HuggingFace, AutoGPT, GenAI] - General AI Assistant의 성능을 평가하기 위해 real-word question으로 구성된 벤치마크, GAIA 공개 - 사람은 풀기 쉽지만 인공지능 모델은 풀기 어려운 466개 (그중 166개만 annotation 공개) Q&A pair - 무려 Yann LeCun이 저자에 포함된 논문 1. Introduction LLM은 general tasks를 처리하는 우수한 능력으로 주목을 받았으나 이를 평가하는 시스템은 아직까지 open problem 최근의 벤..

전체 글

티스토리툴바