전체 글

· 취업
취업 관련 후기는 오랜만에 작성하는 것 같네요.6개월이 금방 지나갔다고 생각했는데 생각보다 길었던 것 같기도 하고.. 묘한 기분이 드네요오늘(2024.11.13)은 업스테이지에서 정규직 전환형 인턴으로 6개월 근무 후에 정규직으로 전환하게 된 후기를 남겨보겠습니다 🥳저는 영어영문학을 전공하고 네이버 부스트캠프를 통해 자연어처리를 배웠습니다.이후 스타트업과 대학원 연구실을 거쳐 현재까지 오게 되었네요!1. 무슨 일을 했나요?특정할 수 있는 내용이나 공개하기 어려운 것들을 제외하고 아주 간단하게 정리하면,저는 6개월 동안 보험사와 관련된 문제 중 두 가지를 LLM으로 해결할 수 있도록 도입 및 개발하는 업무를 맡았습니다. 사실 제가 입사한 팀은 업스테이지가 창립 시기부터 자랑하던 OCR 기술을 바탕으로..
· 딥러닝
최근 사내 스터디를 위해 같이 공부할만한 책을 찾다가 알게 된 책인데요,다양한 서적, 자료 등을 접해본 경험을 근거로, 이 책이 단연 최고의 LLM 도서 중 하나라는 생각을 하게 됐습니다.(인공지능 관련 도서 중 최고를 꼽자면 밑바닥부터 시작하는 딥러닝, 그 다음 이 책인 것 같습니다..!) [도서 링크]- 교보문고: https://product.kyobobook.co.kr/detail/S000213834592- 알라딘: https://www.aladin.co.kr/m/mproduct.aspx?ItemId=343185652- YES24: https://m.yes24.com/Goods/Detail/129081594 [깃허브 링크]- https://github.com/onlybooks/llm 저한테 돈 떨어..
· Paper Review
관심 있는 NLP 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 🙇‍♂️usechatgpt init success[Appier AI Research, National Taiwan University]- LLM에게 JSON, XML과 같은 structured format을 지키도록 강제하는 경우, reasoning task에서 모델 성능이 하락한다.- 하지만 분류 태스크에서는 오히려 성능이 향상될 수 있다.- 즉, 어떤 형식을 강제하는 것이 모델 성능에 영향을 주는지는 task by task로 다르다. 출처 : https://arxiv.org/abs/2408.024421.  IntroductionLLM은 뛰어난 퍼포먼스를 보이고 있음에도 아직까지 실제 app..
· Paper Review
관심 있는 NLP 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 🙇‍♂️usechatgpt init success[NC Research]- LLM이 생성한 결과를 평가할 때 존재하는 다양한 bias를 정의 (6개)- EvalBiasBench를 제안. 6개 종류의 bias에 대한 test case를 직접 제작함.- OffsetBias 공개. bias를 낮추는 데 기여할 수 있는 학습용 선호 데이터셋 출처 : https://arxiv.org/abs/2407.06551 1. Introduction최근 LLM이 생성한 텍스트를 LLM으로 평가하는 경우가 굉장히 많아졌습니다.LLM으로 생성하는 텍스트는 종류나 범위가 엄청나게 다양한데 이를 사람이 직접 다 평가하기엔..
· Paper Review
관심 있는 NLP 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 🙇‍♂️usechatgpt init success[UC Berkeley, Stanford University]- 운영체제에서 가상메모리와 페이징 기법에 착안한 PagedAttention을 제안- 이를 기반으로 하는 vLLM을 개발했는데, (1) KV 캐시 메모리의 낭비가 거의 없고 (2) 불필요한 메모리 사용을 최소화 한다는 특징이 있음 출처 : https://arxiv.org/abs/2309.06180깃허브 : https://github.com/vllm-project/vllm1. Introduction최근 가장 감명 깊게 읽은 PagedAttention에 대해 간단히 리뷰를 해보려고 합니다...
· Paper Review
관심 있는 NLP 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 🙇‍♂️usechatgpt init success[Dartmouth College]- position bias를 정량적으로 평가할 수 있도록 돕는 프레임워크를 개발- MTBecnh와 DevBench의 22개 태스크에 대해 40개 모델로 답변을 생성하고, 이를 9개의 평가 모델로 평가하여 실험한 결과- position bias가 단순한 random variation이 아니라 특정한 모델 간 관계를 지닌다는 것을 입증 출처 : https://arxiv.org/abs/2406.07791v11. Introduction생성형 언어 모델의 성장은 이를 다양한 태스크에 활용하는 관행으로 이어졌습니다.LLM..
chanmuzi
chanmuzi