Recurrent Neural Networks(11) : Bidirectional RNN

2023. 4. 17. 10:39· Sequence Models/1주차

Getting information from the future

  • 지금까지 살펴본 RNN, GRN, LSTM과 같은 모델들은 입력 정보를 계산하여 forward하는 방식으로만 문제를 처리하고 있습니다.
  • 그에 따라서 이후의 정보를 반영하는 것이 중요한 위 예시같은 문제는 해결하지 못한다는 문제점을 안고 있죠.

 

Bidirectional RNN (BRNN)

  • Bidirectional RNN은 위처럼 forward 뿐만 아니라 backward 방향의 정보도 함께 반영하여 예측값을 구합니다.
    그래서 예시의 경우 Teddy라는 일부의 정보만으로 다음 단어를 예측하지 않게 되어 보다 정확한 예측이 가능해집니다.
  • 물론 음성 인식처럼 이전 정보만을 가지고 다음 값을 예측해야 하는 경우에는 적합하지 않지만, 대부분의 자연어 처리 태스크에 대해서는 우수한 성능을 보여줍니다.

 

 

출처: Coursera, Sequence Models, DeepLearning.AI

'Sequence Models > 1주차' 카테고리의 다른 글

Recurrent Neural Networks(12) : Deep RNNs  (0) 2023.04.17
Recurrent Neural Networks(10) : Long Short Term Memory (LSTM)  (0) 2023.04.17
Recurrent Neural Networks(9) : Gated Recurrent Unit (GRU)  (0) 2023.04.17
Recurrent Neural Networks(8) : Vanishing Gradients with RNNs  (0) 2023.04.14
Recurrent Neural Networks(7) : Sampling Novel Sequences  (0) 2023.04.14
'Sequence Models/1주차' 카테고리의 다른 글
  • Recurrent Neural Networks(12) : Deep RNNs
  • Recurrent Neural Networks(10) : Long Short Term Memory (LSTM)
  • Recurrent Neural Networks(9) : Gated Recurrent Unit (GRU)
  • Recurrent Neural Networks(8) : Vanishing Gradients with RNNs
chanmuzi
chanmuzi
chanmuzi
chanmuzi
chanmuzi
전체
오늘
어제
  • 분류 전체보기 (509)
    • 후기 (11)
    • 취업 (5)
      • 부트캠프 (11)
      • 채용 (13)
    • Paper Review (182)
    • 딥러닝 (19)
    • 알고리즘 (78)
      • BOJ (50)
      • 프로그래머스 (28)
    • Sequence Models (34)
      • 1주차 (11)
      • 2주차 (9)
      • 3주차 (10)
      • 4주차 (4)
    • Algorithms, Part 1 (30)
      • 1주차 (11)
      • 2주차 (12)
      • 3주차 (7)
    • Convolutional Neural Networ.. (19)
      • 3주차 (11)
      • 4주차 (8)
    • CS (3)
    • Improving Deep Neural Netwo.. (15)
      • 1주차 (5)
      • 2주차 (5)
      • 3주차 (5)
    • Multivariate Calculus (15)
      • 1주차 (3)
      • 2주차 (3)
      • 3주차 (2)
      • 4주차 (3)
      • 5주차 (2)
      • 6주차 (2)
    • Linear Algebra (16)
      • 1주차 (2)
      • 2주차 (2)
      • 3주차 (3)
      • 4주차 (4)
      • 5주차 (5)
    • 프로그래머를 위한 선형대수 (14)
      • 0장 (0)
      • 1장 (0)
      • 2장 (0)
      • 3장 (4)
      • 4장 (6)
      • 5장 (4)
    • AI For Everyone (14)
      • 1주차 (5)
      • 2주차 (3)
      • 3주차 (3)
      • 4주차 (3)
    • PCA (11)
      • 1주차 (3)
      • 2주차 (3)
      • 3주차 (2)
      • 4주차 (3)
    • Neural Networks and Deep Le.. (14)
      • 1주차 (1)
      • 2주차 (5)
      • 3주차 (4)
      • 4주차 (4)

블로그 메뉴

  • 홈
  • 태그
  • 방명록
  • 글쓰기
  • 설정

공지사항

  • NLP 연구자를 꿈꾸는 chanmuzi 입니다 🔥🔥

인기 글

태그

  • Multivariate Calculus
  • LLM
  • Programmers
  • coursera
  • AI
  • algorithms
  • GPT-4
  • deep learning
  • paper review
  • Rag
  • kaist
  • llama
  • 프로그래머스
  • Sequence Models
  • Multi-Modal
  • Cot
  • 개발자
  • 취준생
  • Python
  • 비전공자
  • CNN
  • BOJ
  • 파이썬
  • 프로그래머를 위한 선형대수
  • 알고리즘
  • LK Lab
  • transformer
  • Andrew ng
  • 백준
  • NLP

최근 댓글

최근 글

hELLO · Designed By 정상우.v4.2.2
chanmuzi
Recurrent Neural Networks(11) : Bidirectional RNN
상단으로

티스토리툴바

개인정보

  • 티스토리 홈
  • 포럼
  • 로그인

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.