전체 글

· 후기
안녕하세요 chanmuzi입니다.사실 지금은 어쩌다 보니 다시 취업을 하게 된 상황이긴 하지만.. 🧑🏻‍💻그동안 대학원 입학을 위해 준비했던 시간들이 짧지 않기도 하고, 앞으로 다시 도전할 가능성도 충분히 있다고 생각합니다.그래서 개인적인 경험을 정리해보기도 하고.. 다른 분들이 인공지능 대학원을 준비하시는데 참고가 될 수 있도록 글을 작성해보고자 합니다. 참고로 저는 자연어처리(NLP)에 관심이 많기 때문에 다른 분야에 관심이 있으신 분들에게는 큰 도움이 되지 않을 수도 있습니다..!대학원을 준비하게 된 이유이미 직장 생활을 하고 있던 상황에서 대학원 준비를 결심하게 된 이유는 좀 복합적이긴 합니다.직장 자체에 대한 아쉬움일 수도 있고, 비전공자로서 커리어에 제한이 많기도 하고.. 여러 이유들이 ..
· 후기
본 포스팅은 유데미로부터 강의 쿠폰을 제공받아 작성한 글입니다.【한글자막】 Docker & Kubernetes : 실전 가이드【한글자막】 랭체인 - LangChain 으로 LLM 기반 애플리케이션 개발하기리뷰에 앞서..저는 '글또' 9기에 참여 중입니다.글또를 통해 유데미의 강의 쿠폰을 제공받을 수 있었고 이에 대한 강의 후기를 남기게 되었습니다. IT 분야 종사자라면 도커는 필수라는 이야기를 수도 없이 들은 것 같은데, 기회가 되면 공부해야지 막연히 생각하다가 이번에 시간적 여유가 있을 때 공부할 수 있었습니다.랭체인은 개인적으로도 몇 번 사용을 했었는데 애플리케이션 개발으로는 어떻게 연결될 수 있는지 궁금해서 강의를 수강하게 되었습니다. 【한글자막】 Docker & Kubernetes : 실전 가이드..
· 후기
지난 5월 1일(수) ~ 5월 3일(금) 동안 코엑스에서 AI Expo 2024가 진행되었습니다.저는 마지막 날인 금요일에 참석했고 이에 대한 짤막한 후기를 남겨보려고 합니다.작년에는 이런 행사가 있는지 몰랐었는데 상당히 큰 규모였고(지금까지 다녀봤던 행사들 중 기업 부스가 가장 많았던 것 같네요 😲), 느낌이 조금 달랐습니다..! 디테일한 내용들은 후술 하고.. 결론적으로 느낀 것은..1. 모델을 직접 학습하고 활용하는 사례가 굉장히 많이 줄어들었다. (API 기반의 솔루션, 프로덕트가 대부분)2. MLOps, LLMOps 관련 솔루션들이 오히려 탄탄한 기술력을 갖고 있다고 느껴졌고 시장성도 좋다는 생각이 들었다.3. 같은 맥락에서 computing resource 관련 사업도 유망하다는 생각이 들었..
· Paper Review
관심 있는 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 🙇‍♂️usechatgpt init success[Microsoft]- scan된 문서에 대한 text와 layout 정보 간의 interaction을 함께 학습- 사전학습 단계에서 문서 단위로 학습 출처 : https://arxiv.org/abs/1912.133181. IntroductionBusiness document를 이해하고 그 정보를 활용하기 위한 연구는 오래 전부터 이어져오고 있었습니다.기존에는 대부분의 문서 작업을 사람이 직접 하는 방식이었기 때문에, 이를 인공지능 모델을 이용하여 효율적으로 해결하고자 한 것이죠.그러나 실제로 여러 문서들은 다양한 layout과 형식으로 구성되는 경우가..
· Paper Review
관심 있는 NLP 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 🙇‍♂️usechatgpt init success[Microsoft]- 3.3T개 토큰을 학습한 3.8B 사이즈의 모델 phi-3-mini를 공개. 사이즈가 굉장히 작음에도 불구하고 Mixtral 8x7B, GPT-3.5급의 추론 능력을 보여주어 화제.- multi-lingual 특성을 강화하여 학습한 phi-3-small 모델(7B)과 mini 모델을 추가학습한 phi-3-medium 모델(14B)을 함께 공개 출처 : https://arxiv.org/abs/2404.142191. Introduction지난 몇 년 간 인공지능의 눈부신 발전은 점점 더 큰 모델과 데이터셋을 만..
· 딥러닝
안녕하세요, chanmuzi입니다. 오늘 새벽 Meta에서 Llama 3 모델을 공개했습니다! 커뮤니티를 보니 소수의 사람들은 이미 이 모델을 사용하고 있었다고 하더군요. 전작에 비해 훨씬 잘한다고 알려진 이 모델은 벌써 허깅페이스에도 업로드 되었습니다. 허깅페이스에서는 블로그 글도 항상 깔끔하고 상세하게 잘 써주는데요, 오늘은 llama 3 관련 내용이 저도 궁금해서 ChatGPT에게 번역을 의뢰하여 얻은 내용을 공유하고자 합니다! (경쟁자의 탄생을 직시하게 만들어버리는..😅) 참고로 메타의 블로그는 이 링크를, 허깅페이스의 블로그 원문은 이 링크를, 그리고 허깅페이스의 모델 카드는 이 링크를 통해 확인 가능합니다. Welcome Llama 3 - Meta's new open LLM Introducti..
chanmuzi
chanmuzi