chanmuzi

<LLM, Diffusion> Large Language Diffusion Models (2024.02)

2025.03.16· Paper Review

관심 있는 NLP 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 🙇‍♂️usechatgpt init success[Renmin Univ. of China]- diffusion model을 scratch부터 pre-training & supervised fine-tuning (SFT) 적용한 LLaDA- 일부 벤치마크에서 Autoregressive models (ARMs)보다 강한 scalability를 보여줌 출처 : https://arxiv.org/abs/2502.099921. Introduction최근 Diffusion(이하 디퓨전)을 LLM에 적용한 모델이 (상대적으로 작은 사이즈-7~8B-에서) 뛰어난 성능을 보여주며 화제가 되고 있습니다.디퓨전은..

스픽 5개월 내돈내산 후기 (스픽 헌드레드 클럽 달성!)

2025.03.02· 후기

약 5개월 정도 스픽 앱을 내돈내산 해서 영어 공부한 후기를 남겨봅니다.작년(2024)에 크게 할인 할 때 AI 피드백까지 다양하게 받을 수 있는 버전을 구독했고 약 5개월이 흘렀네요.정확한 금액이 기억나지 않긴 한데 1년 동안 20만원 초반 정도에 해당하는 금액을 지불했습니다. 돈을 사용한만큼 영어 실력이 늘었는가 하면 그렇지 않은 것 같습니다..시스템 자체는 엄청 좋은데 제가 열심히 안한 게 가장 큰 이유고요 😂개인적으로 시간이나 노력을 더 투자하면 좋을 거 같은데 그러려면 생각보다 품이 더 드는 기분입니다.. 오늘부로 154일 연속으로 공부했고 총 1763분을 투자했네요.하루 평균 10분 조금 더 공부한 셈입니다. 저는 주로 씻고 나서 로션 바르고 말리는 동안에 틀어 놓고 공부를 많이 하게 되더라..

부스트캠프 AI Tech 7기 기업 해커톤 시상식 후기 (사실 1784 투어 후기)

2025.02.15· 후기

오늘은 부스트캠프 AI Tech 7기의 기업 해커톤에서 1등을 차지한 팀들을 대상으로 시상식을 진행했습니다.이번 7기에는 기업별로 다른 주제의 프로젝트를 수행하고 최종 발표하는 기업 해커톤이 생겼더라고요.네이버 클라우드, 틸다, 노타 등의 회사가 참여했는데, 제가 소속된 업스테이지도 그중 하나여서 멘토 자격으로 참여했습니다.저는 4기 수료생인데 조금 다른 자격으로 교육 프로그램에 포함되니 감회가 새롭기도 하고.. 여튼 시상식은 1784에서 진행되었는데 다들 먼길 하는 입장이다보니 그냥 오라고 하는 건 좀 그랬는지 사옥 투어를 시켜줬습니다.그렇게나 유명한 네이버의 사옥을 이런 기회로 투어하게 되어서 굉장히 신기했습니다. 역시 대기업인가..? 각지고 푸르스름한 빌딩이 유독 웅장해 보입니다. 옆 건물 입구로 ..

먹통된 노트북에 Windows 11 설치하는 방법 (feat. 650만원 짜리 노트북 3일 만에 고장난 썰 & 레노버 USB 복구키 불능 이슈)

2025.01.28· CS

오늘은 최근에 프로젝트 수행을 위해 회사 차원에서 구매한 650만원 짜리 레노버 노트북을 고장냈다가 정상적으로 고쳐낸 썰을 좀 기록해보고자 합니다. 살면서 이런 고사양 노트북을 직접 뜯어보고 만져볼 날이 오다니..감개무량 했지만 기쁨은 잠시, 노트북께서 순식간에 사망하시고 저는 이를 고칠 시간이 없어 지옥 같은 일주일을 보냈습니다. 🔥💀🪦결국 노트북은 정상적으로 복구 되었으나 그 과정에 여러 이슈들이 있었고, 문제가 있는 노트북에서의 화면들을 직접 촬영하거나 기록하지는 못해서 작성될 내용들 사이에 공백이 존재할 수 있음을 미리 말씀드립니다. 따라서 이 글은 아래에 해당하는 분들이 읽으시면 좋은 글입니다.Windows를 업그레이드 혹은 다운그레이드 하다가 노트북이 제대로 작동하지 않게 된 분저는 ..

<Uncertainty> I Don't Know: Explicit Modeling of Uncertainty with an [IDK] Token (2024.12) (NeurIPS 2024)

2024.12.27· Paper Review

관심 있는 NLP 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 🙇‍♂️usechatgpt init success[HPI]- [IDK] 라는 스페셜 토큰을 모델 vocab에 추가- 잘못된 예측에 대한 probability mass를 스페셜 토큰으로 옮겨주는 objective function 도입- 큰 사이즈의 corpus에 대해 objective function 교체 후 self-supervised learning (pre-training) 적용 출처 : https://arxiv.org/abs/2412.066761. IntroductionLLM은 뛰어나지만 아직까지도 hallucination 문제가 해결되지 않고 있죠.이제는 LLM에게서 이러한 문제점이 나..

[Upstage] 업스테이지 AI Research Engineer 정규직 전환 합격후기 (비전공자)

2024.11.14· 취업

취업 관련 후기는 오랜만에 작성하는 것 같네요.6개월이 금방 지나갔다고 생각했는데 생각보다 길었던 것 같기도 하고.. 묘한 기분이 드네요오늘(2024.11.13)은 업스테이지에서 정규직 전환형 인턴으로 6개월 근무 후에 정규직으로 전환하게 된 후기를 남겨보겠습니다 🥳저는 영어영문학을 전공하고 네이버 부스트캠프를 통해 자연어처리를 배웠습니다.이후 스타트업과 대학원 연구실을 거쳐 현재까지 오게 되었네요!1. 무슨 일을 했나요?특정할 수 있는 내용이나 공개하기 어려운 것들을 제외하고 아주 간단하게 정리하면,저는 6개월 동안 보험사와 관련된 문제 중 두 가지를 LLM으로 해결할 수 있도록 도입 및 개발하는 업무를 맡았습니다. 사실 제가 입사한 팀은 업스테이지가 창립 시기부터 자랑하던 OCR 기술을 바탕으로..

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

전체 글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역